データをグラフ化する際の10のベストプラクティス

Jeff Sauro

Measuring Uの創設者。シックスシグマに熟練した統計学分析者であり、ユーザーエクスペリエンスを定量化したパイオニアでもあります。

この記事はMeasuring Uからの翻訳転載です。配信元または著者の許可を得て配信しています。

10 Best Practices for Graphing & Displaying Data (2017-02-07)

データを可視化することで、数値をより簡単に解釈することができ、正確で効果的な意思決定ができるようになります。

しかしデータのグラフ化には、リスクが伴わないわけではありません。スケールやグラフの種類、スタイルの選択は、閲覧者の結果の解釈に対して、常に良い意味でも悪い意味でも影響を与えます。

今回は、データを作る際の10個のベストプラクティスと気を付けるべきことをまとめました。これらはデータの可視化に関する有名な著書の中ですすめられているものだけでなく、私たち自身がデータをグラフ化した経験もまとめて、紹介していきます。

1.チャートジャンクを避ける

グラフの中のビジュアル要素は、情報を伝える上で必ずしも必要ではありません。場合によっては、伝えたい情報が伝わりにくくなってしまうこともあります。Tufte氏はこれらをチャートジャンクと呼び、一般的には下のグラフのような、画像や太線のグリッド、シャドウ効果、3D要素などがこれにあたると言われます。

Tufte氏はこれらの要素を強く非難していますが、すべての画像がいつでもチャートジャンクとなるわけではありません。Tufte氏は要点を伝えるためにやや大げさな言い方をしており、画像などを正しく用いることで内容を記憶しやすくなり解釈の手助けにもなるということは実証されています。

2.Y軸の設定

Y軸(縦軸)に何を設定するかによって、意図的かどうかに関わらず、データの意味合いは大きく左右されます。データのミスリードは、するのもされるのも避けたいですが、実際には客観的なグラフは存在しないということを覚えておきましょう。どんなグラフの裏にも、作られた意図が存在するのです。その中のいくつかは、ほかの意図より無害かもしれません。

グラフが作成された背景が重要であり、読者はY軸の条件が選ばれた背景と結果を理解しなくてはなりません。下の2つのグラフは、地球の気温に関する同じデータをグラフ化したものですが、Y軸の要素が異なります。

3.ゼロを基点にする必要はない

グラフはいつでもゼロを基点にする必要はないことを覚えておきましょう。データをグラフ化する上でベストプラクティスを採用するのは良い考えですが、「ゼロを示す」という原則は簡単に破られることがあります。

4.Y軸の目盛り幅を統一する

Y軸の要素を何にするにしろ、同じレポートの中で同じY軸を使って複数のグラフを表示する際はグラフの目盛り幅を、できるだけ統一しましょう。下の2つのグラフは似た結果を示していますが、Y軸のスケールが違うので下のデータのほうが低く見えてしまいます。

5.値の差分を比較する

差異スコア(2つのデータポイントの差)は、多くのデータポイントがあるグラフでノイズを除去するのに役立ちます。差異スコアを使うと、元の値では失われる可能性のある重要な違いに注意を引くことができます。データの差が強調されていると、たとえ小さくても、差異は実世界ではもっとインパクトがあるということが示唆されます。しかし、差異スコアを使う際には十分注意してください。元の値よりも解釈が難しい場合があります。

元の値のグラフ

差異スコアのグラフ

6.3Dを使う注意点

同じ値を扱う場合、面積よりも体積のほうがより大きく見えます。ですから、3Dグラフでデータを比較すると、実データより差異を強調して解釈することができますが、ともすれば誤った意思決定につながってしまうかもしれません。

あるリサーチによると、3D効果は専門家たちが指摘するほど見た目に大きな害を及ぼすことはないことがわかっています。ですが、2Dで必要な情報が十分伝わる場合は、やはり3Dは最小限に留めておくことをおすすめします。

7.表を利用したほうが良い場合

棒グラフの数が多くなりすぎるときは、表でデータを可視化して表示するほうがわかりやすくなることが多いです。表を活用することで、チャートジャンクを減らせるほかに、差異が誇張されたり不適切なY軸を設定したりするような、細かいバイアスを減らすことができます。

8.サンプリングエラーを示す

必要に応じて信頼区間などの統計的有意性の指標を加えてサンプリングエラーを示すことで、ランダムノイズと実際の差異の違いを、閲覧者が区別できるようにしましょう。

9.何を比較するのか?

可能であれば、より有効な解釈ができるように、比較対象のデータを付与しましょう。たとえば、業界平均や最高値の競合他社などの、外部のベンチマークがあげられます。下のグラフはSEQ(Student EQ)を使用してタスクの簡単さを測ったデータを示しています。それに加えて、業界平均(水平の破線)と、1つのタスクにつき3つの競合のスコアも載せています。これらの比較対象によって、測定基準がより意味を持つようになり、「これは良いことなのか悪いことなのか?」という疑問にも答えられるようになります。

10.疑問がある場合はテストを

時間があれば、グラフが本当にわかりやすいのかテストして、閲覧者の理解や解釈があなたのものと合致しているかを検証しましょう。製品のユーサビリティテストと同じように、単にグラフを「気に入っているか」どうかを聞くのではなく、自由回答の質問と選択回答の質問を組み合わせて被験者の理解度を測定してください。チャートジャンクや3D効果の項で説明したように、データによっては、専門家が主張する適切なグラフの「原則」が支持されないことがあるかも知れません。