原文: Tim Brock» An Introduction to Slopegraphs - Part 1
スロープグラフの起源を語る際に、一般的に Edward Tufte 氏の 「The Visual Display of Quantitative Information」がまず取り上げられます。Tufte 氏は 159 ページ (第二版) に、チャート、あるいは「表グラフィックス」を新しく紹介しています。そこでは、「垂直方向に、1970 年、そして 1979 年に徴収された税金を 15 か国でランキングで表示しています。国名はその金額のパーセンテージに応じた間隔で配置されています」。 また、国名の各ペアが直線で結ばれています。このグラフがスロープグラフです。
グラフを単に再描画するのではなく (元のグラフはここにあります)、
下のグラフでは同じ原則で異なるデータを表示しています。データは 世界銀行のウエブサイトから入手した G-20の 19 か国中、13 か国の 1960 年と 2013 年の人口を示しています。スケールのベースラインを示すために水平線も追加しています。
スロープグラフは、シンプルで洗練されたデータ表示が一番の利点です。大抵は構造化データを含む 2 列、そして変化と相違点を際立てる列間の明確な結びが基本になっています。Tufte 氏の元の例では、唯一税収が減少した国が英国だとグラフを見れば一目瞭然です。上記のデータでは、1960 年から 2013 年にかけてすべての国において人口の増加傾向が見られますが、増加幅が比較的大きい国 (メキシコ) とそうでない国 (ドイツ) とがあります。
スロープグラフはよく使用されますが、考慮しなければならない制約があります。最も顕著なものでは、ラベルの重複が一番よくある問題でしょう。上のチャートでは、G-20 のすべての国が表示されていないのもまさしくそのためです。省略された 6 か国中 5 か国で 2013 年の人口が 2 億人を超えています。これらの国すべてをグラフに入れようとすると、残りの国をグラフのボトム 10% に押し込むことになります。ただし、この課題はスロープグラフのみならず、すべてのチャート類で発生します。省略された国で 6 つ目の国の南アフリカの 2013 年の人口はたった 5 千 3 百万人です。1960 年にはその人口は 1 千 7 百万人だったため、カナダのラベルと重複しかねません。後編ではラベルの重複をさらに詳しく取り上げようと考えていますが、ここではまずデータを視覚的に表示する方法を解説していきます。
スロープグラフの他、Tufte 氏はスパークラインに代表されるようなデータリッチなグラフを推し進めています。ただこの指針では国ごとに 2 つのデータ ポイントしか表示されていないスロープグラフは矛盾しないでしょうか。13 か国の場合、世界銀行のすべての人口データをプロットするとどうなるでしょうか。
1960 年から 2013 年までの毎年のデータ ポイントを含めると、人口の推移が全く異なる様相を帯びてきます。メキシコの線はさほど変わりませんが、日本とロシアの場合は直線とは程遠いデータ表示になります。日本の人口増加割合は最初は高かったですが、その後減少して現在はマイナス傾向に転じています。ロシアの場合、人口が増加して頂点に達してから減少傾向に転じ、その後減少の割合が一層大きくなり、平坦になって近年は再度人口が増加しています。この変化に富んだデータは、国ごとに 2 つのデータ ポイントしか示さない簡易なスロープグラフでは表せません。
ところで、最後のチャートは元のグラフにない問題を抱えています。つまり、交差する線は曲線を読み取りにくくすることがあるのです。例えば、左側の英国から開始してその曲線を辿って右へ移動していくと、イタリアにたどり着くことがあります。そして、左側のイタリアから開始すると、またイタリアにたどり着きます。おそらく、ゲシュタルトの法則に起因しているのだと思います。要するに、「急激に変化する視覚要素よりも、滑らかに変化する、連続性のある視覚要素のほうが、視覚的エンティティの構成につながりやすい (Colin Ware 「Information Visualization」 (第三版)、183 ページ)」ということです。 つまり、両国の場合、線が交差した後に、脳が上へ上がっていく英国の曲線より、比較的平坦なイタリアの曲線を選ぶのです。この脳の働きは、線を異なる色で表示すると補えます (下を参照)。複数の線が同じ色になっていますが、共通の属性は持っていません。読み取りやすくしただけです。
この最後のチャートは上のチャートと比べてさほど洗練されていませんが、情報を詳細に表示できるというメリットはあります。