データの性質と尺度

データの性質

質的データ

数量として意味のないカテゴリを数値に直したデータ

  • 名義尺度
  • 順序尺度

量的データ

数量として意味のあるデータ

  • 間隔尺度
  • 比例尺度

尺度

名義尺度 nominal scale

大小に意味はない。

  • 郵便番号
  • 国際電話の国番号 (Country code)
  • 金融機関コード、支店コード
  • エラー種別コード
  • IPアドレス

順序尺度 ordinal scale

大小は意味を持つが、間隔には意味がない。平均値を計算しても、ほぼ意味を持たない。

  • 震度(気象庁震度階級) : 震度1と2の差と震度5と6の差に相関はない。
  • モースコード : 硬さの尺度。数値間の硬さの変化は比例しない。硬度1と2の間の差が小さく、硬度9と10の間の差が大きい。
  • 富士山の合目 : 5合目より6合目の標高は高い。6合目より7合目の標高は高い。しかしながら、富士宮ルートの5合目と6合目の標高差は約100m。6合目と7合目の標高差は約300m。あくまで人の感覚と歴史的経緯に拠っている
  • 牛肉の等級
  • マラソンの順位
  • エラー深刻度レベル
  • ログ重要度レベル

間隔尺度 interval scale

差に意味はあるが比は意味を持たない。
「0℃ と 10℃ の間隔」と「10℃ と 20℃ の間隔」は熱力学的に同じである。しかし「10℃ の 2倍は 20℃」や「-10℃ の 2倍は -20℃」という計算は意味をなさない。

  • 摂氏温度, 華氏温度
  • 知能指数
  • 西暦、元号暦

比例尺度 ratio scale

差も比も意味を持つ。

  • 絶対温度
  • 長さ
  • 質量
  順序
名義尺度 無意 無意 無意
順序尺度 有意 無意 無意
間隔尺度 有意 有意 無意
比例尺度 有意 有意 有意