原文:Tim Brock» Some Thoughts on Data Density
以前、私のブログであるデータ可視化の 7 つのヒントを公開しましたが、そのブログで最初にご紹介した注意事項は、棒チャートを利用して「説明が十分に可能であればチャートは使用しない」というものでした。
ブログで述べたように、上記の棒チャートは、読者の理解を妨げずに、「製品 B を好む人はたった 112 人であるのに対し、237 人が製品 A を好むと回答しました。」などのシンプルな文で置き換えられます。
棒が 2 本だけの棒チャートをよく見かけますが、ポイントが 2 点しかない散布プロットはめったに見ることがありません。可能性の 1 つとしては、散布プロットの相対希薄がとても小さいサイズのデータセットを強調するということです。逆に、大きくてしっかりした棒のチャートはより多くの情報を提供するという錯覚を与えます。外観に関係なく、以下の散布プロットは、上記棒チャートよりもより多くの情報をエンコードします。
反響が大きかったエドワード タフトの本 "The Visual Display of Quantitative Information" では、すべての章を高密度データ ビジュアライゼーションのメリットと棒チャートと散布プロットの対照について捧げています。その章にはニューヨークタイムズ review of the weather for 2003やスモール マルチプル (前のブログ [英語]をご覧ください) がいくつか含まれます。 セクションすべてがスパークラインのセクションがあります。小さい高解像度グラフィックスが文字、数字、画像の背景に通常埋め込まれています。
以下は私が作成したとてもシンプルなスパークラインです。World Bank dataと IgniteUIを使用して文に埋め込んでいます。
数データ ポイントのみの大きな棒チャートや散布プロットとは対照的に、上記の小さなスパークラインは 50 年に値するデータをエンコードしています。1963 年まで急激に増加し、その後なだらかに上下しながら減少しています。そのすべてが 2、3 文字のスペースに収まっています。(スパークラインは表でも大変有効です。)
一見したところこれらに何も問題はなさそうです。スパークラインは、スペースのすばらしい有効利用で、スモール マルチプルのメリット(英語) については既にお話ししました。データリッチ マップもうまく活用できれば貴重なインサイトを提供できます。更に、データをコンパクトに表示すると必要な目の動きを軽減でき、画像検索がより簡単になります。だだし、そうは言ってもタフトの高密度グラフィックス支持に対する議論には完全に納得していません。すべてが悪いと言っているわけではありませんが、主要な目的にはすべきでないと思うのです。最終的には、「データの可視化にはどんな利益があるのか?」という疑問に達します。
データ可視化の本質は、データの理解をサポートすることです。データセットの詳細については一連の散文で説明できます。また数十列および数百行のテーブルを使用できます。ただし、両者とも包括的なパターンを認識するのには適さず、変則を見つけるのに苦労しそうです。これは単に我々にワーキングメモリの能力がないからです。よくデザインされているものであれば、チャートはこれらの制限を克服し、データのインサイトを得ることができます。2, 3 個のデータ ポイントでは恐らく無理でしょうが、10 個では可能でしょう。(10 個のデータ ポイントが多くない場合、45 一対比較が可能です。)
タフトは、「地図と同じ情報率を実現できる統計的なグラフィックスはほとんどない」と嘆いていました。そして「いつか統計的なグラフィックスが地図と同等の情報を表すことができる日が来ることを期待している」とも述べています。私にはグラフィックスの成功を評価するかなり変わった方法に思えます。また、背景にも配慮していません。地図は、常に調査のために使用され、統計的なグラフィックスは一般的に説明に使用されます。前者は通常必要と見なされるすべてのデータを表示します。後者は関連するデータのみを (もちろん省略によって誤解を招かないように) 表示します。必要なデータ以上にデータを表示するのは、画像を向上させるのではなく混乱を招きます。また、関連データがそれ以上ない場合もあります。
数個のデータセットからチャートを生成するかどうかを決めるときに、チャートで十分なデータを表しているか?を問うべきではありません。対象の閲覧者があなたのグラフィックスからテキストや表からは得ることができない有益な情報を得ることができるかどうかを問うべきなのです。答えが NO であればチャートは必要ありません。YES の場合、インサイトの追加がグラフィック作成の拡大に要する時間や労力といった追加のコストに値するかどうかを検討する必要があります。スパークライン、スモールマルチプル、および (または) マップが便利であれば、それらを十分に使用すべきです。