シンプルに視覚化
Highchartsは、開発者があらゆるWebおよびモバイルプラットフォームにチャートを簡単に追加できるようにします。
Javascript、Angular、React、VueJS、iOS、R、.NET、Python、その他に対応しています。
連続データ入門
前回の記事では、カテゴリカルデータについて説明しました。今回の記事では、連続データとこのデータ型を分析するために使用される数学的ツールについて説明します。データ型やデータ可視化の目的に精通している場合は、チャート・チューザー・ツールに直接ジャンプして、効果的なチャートを作成してください。
では始めましょう。
下記は、すべてのデータ型の階層を表す優れたチャートです。
値が測定されている場合、データは連続とラベル付けされます。例えば、「X」キログラムのじゃがいもがあるとします。 連続データは離散的(…, -1, 0, 1, 2, …)または連続的(…, 0.123, 0.456, …)である可能性があります。
連続データは、間隔データ(Interval)または比率データ(Ratio)のいずれかです。
1.間隔データ(Interval data)
間隔データは、比率が意味を持たず、0が意味を持たない値を表します。 例えば、IQ160の人はIQ80の人より2倍賢くはありません。 20℃の温度は0℃の20倍ではありません。
間隔データの例:
- 知能指数(IQ)
- 温度
- 時間帯(午後1時、午後2時、午前4時など)
【備考】比率や0の意味がないという間隔データの性質上、社会科学においてよく使用されます。 例えば、IQ、テストスコア、所得範囲などです。
1.1. 統計的手法
以下は、間隔データを調べるための統計ツールです。
- パーセンタイル、中央値、四分位範囲
- 平均値、中央値、最頻値
- 標準偏差、範囲、IQR
1.2. 可視化
折れ線グラフ、ヒストグラム、ボックスプロット(箱ひげ図)は、間隔データを視覚化するために最も使用されるチャートです。 これらはパーセンタイルや中央値などの統計要素を表示するのに適しています。
以下の折れ線グラフは、12か月間の東京とベルゲンの気温変化を視覚化しています。
2.比率データ
比率データは、0が基準点として意味を持ち、比率が意味を持ちます。 例えば、4kgは2kgの2倍または1kgの4倍であり、最小重量は0kgです。
比率データの例:
- 距離:5km、1.84mなど
- 重量:81.5kg
- 日数:2日または3日
- 時間:1時間、34分
【備考】比率データには負の値がないことに注意してください。高さや体重に負の値はありません。 物理科学でよく使用されます。
2.1. 統計的方法
以下は、比率データを調べるための統計ツールです。
- パーセンタイル、中央値、四分位範囲
- 平均値、中央値、最頻値
- 標準偏差、範囲、IQR
2.2. 可視化
間隔データと同様に、ヒストグラムとボックスプロット(箱ひげ図)は、比率データを視覚化するために使用されるチャートです。 以下のボックスプロット(箱ひげ図)デモは、ノルウェーの教育水準別月収を示しています。
連続データについて読んだ後、おそらくカテゴリカルデータについても読んだと思います。 これにより、データのタイプや、どの統計ツールやデータ可視化を使用して調査するかについてのアイデアが得られました。 しかし、ここで止めないでください。これらは表面的なものに過ぎません。 実際のデータ入力は、データ収集プロセスがデータタイプに大きく影響するため、課題となる場合があります。
とはいえ、データ・サイエンスの旅を続けるための準備は整っており、チャート・チューザー・ツールを使って、どのチャートが必要な洞察を得るのに役立つかを調べることが可能です。