原文 - Connect the Dots
通常の散布図についてはすでにご存じだと思いますが、各 x 座標がある変数および各 y 座標が別の変数によって決定される、ポイントの選択です。以下は、その簡単な例です。1896 年アテネから 2012 年ロンドンで開催されたすべてのサマー オリンピック試合の総メダル数と 1 個以上のメダルを獲得した国の数です。データは Wikipedia のオリンピック メダル受賞数一覧 (1896 年オリンピック) の記事を基に作られています。
ご覧のとおり、メダル数とメダルを獲得した国の間の正の相関関係がわかります (ちなみに、相関係数は 0.95 です)。オリンピック試合に対する見解を変えるような画期的なチャートではありません。
左下近くのポイントを見てください。あまりメダルを獲得できなかった国が数か国あります。左下はオリンピック初期の頃の試合を示し、右上はより最近の試合を表します。それらの情報はポイントに直接ラベル付けできます。
たとえば、1896 年オリンピックの一番左のポイントを見てください。右上の 2 つのポイントが 2008 年と 2012 年で最も最近のイベントです。また、1988 年と 2008 年の間に1948 年と 1968 年の間よりも大きな変化があったことがわかります。ラベルの色がポイントと同じ色のため、実際のポイントの配置がやや分かりにくいです。テキストにより明るいグレーを使用して、ラベルが背景に埋もれないようにします。
ポイントで時系列を構成していることを明確にする必要があります。原則的に 3D でこのシリーズを描画しますが、2 次元の画面で 3 次元の線を読み取るのは困難であることに注意してください。接続散布プロットを作成するためでしたが、以前使用した 2 D プレーンでポイントを一緒に結合できます。これは以下で実現しています。多くの年ラベルを移動し、いくつか削除して邪魔にならないようにしました。太字線がフォーカスされているため、テキストを再び使用してもよいでしょう。
データは同じですが、チャートの焦点が若干変わりました。メダル取得とメダル獲得国の数の相関関係には注目していません。特に優れたインサイトが得られないからです。代わりに時間の経過による進行を見ることができます (時間は直接プロットされていませんが)。更に進行に適合しない試合もあります。1904 年オリンピックでメダルを獲得した国はほとんどありませんでした。1976 年と 1980 年に何か起こったのでしょうか、また 1988 年 1996 年の間にメダル獲得国が急激に増加したのはなぜでしょう。これらの質問の答えは、オリンピック開催地で実際に起こった地域的および政治的な歴史にあります。
この時点で何が起こったかを段落で説明します。むしろ、シリーズの興味深い変化の広範または部分的な原因を簡潔に説明するために注釈を使います。使用するデータは、歴史的イベントを明確に強調表示する必要はありません。たとえば、獲得メダル数よりも競合の国の数のほうが、1970 年代と 1980 年代に起こったボイコットをより明確なビジュアルで兆候を表すことができます。この例は注釈がデータについて情報を提供するもので、その反対ではありません。
私が通常チャートとして引用するのはどのようなチャートかというトピックから、インフォグラフィックを何に分類するかというトピックについて説明しました。散布プロットは科学文献で頻繁に使用されています。一方、インフォグラフィックは新聞でよく使われており、接続散布プロットの優れた例を見ることができます。数年前にアルバート カイロは彼が好むいくつかのチャートの例について書いています。私は特に Hannah Fairfield のこのチャートが好きです。これは、アメリカで走行距離が伸びているにも関わらず、自動車死亡率がなぜ、そしてどのように低下しているかを示すものです。
上記のいづれも従来の散布プロットをすべて接続散布プロットと置き換えることを示唆するものではありません。時間がデータに適切であっても、散布プロット (非接続) がやはり身近なタスクのベストなビジュアル表現でしょう。直接プロットされた 2 つの変数の全体的な関係は、最初の例で最も明確に示されています。また 3 つ目の変数の説明は、ポイントにラベルを付けるだけで十分でしょう。ただし、順番にポイントを接続することによって、データのインサイトを引き出すための手助けとなる場合があります。