データの尺度
一口に「データ」といっても、実際には色々な「データ」があります。
量的データと質的データ
「量的データ」:数値情報であり計算が可能なデータ
「質的データ」:主に文字情報であり、数量的な意味がないデータ
以上の2つのデータはさらに、「尺度」をもとに分類することができます。
ここで「尺度」とは、「データの値を決める際の基準」のことです。
「量的データ」
・比例尺度:距離や質量さらには年収のように、数値を比較する際の比にも意味がある尺度
(例)4km と 2km はそれぞれ長さとしての意味と、4km は 2km の2倍であるという意味もあります。
・間隔尺度:気温や偏差値、西暦のように数値の間隔(差)が数量としての意味を持つ尺度
(例)気温15℃は−1℃よりも16℃高い訳ですが、比を取ろうとすると 15/ −1 = −15倍 と、意味のないものになってしまいます。
「質的データ」
・名義尺度:血液型や氏名のように、分類する際に区別することだけに意味を持つ尺度。
(例)数値だけで書かれた受験番号や、郵便番号などは、数値化されていますが上述したような間隔としての意味はありません。よって名義尺度に含まれます。
・順序尺度:服のサイズや5段階の成績評価やのように、分類の順序に意味がある尺度。例えば、服のサイズは一般的に S, M, L の順序で大きくなっていくことに意味があります。書道や柔道などの「段位」もここに当てはまります。初段より二段の方が上ですね。しかし2段の人は、初段の人よりも2倍上手い字が書けたり、強かったりすることにはなりません。