統計におけるばらつきの測定

2019年9月7日
ばらつきの測定は不可欠で、ある集団や標本の中身を知ることができます。標本においては、これにより、平均などの中心傾向に関して結論を出す時に生じる誤差の範囲が決まるため、ばらつきの測定は非常に重要です。

どんなデータにおいても、ばらつきの測定は重要な役割を担います。これは、中心傾向の測定と共に使われ、データの変動性を示します

中心傾向の値から、様々なデータのまとめ方がわかります。ある標本や集団において、変数がどう変わるかを知るのに役立ちます。中央地、平均値、範囲が3つの基本要素です。

ばらつきの値は、中心傾向の値と連動します。そのデータの分散を示すため、データを読む時に必要不可欠です。統計におけるこれらの重要性は、ワイルドとプファンコッホ(1999)により強調されています。

データの変動性の認識は、統計学的思考の基本的要素のひとつだと彼らは言います。変動性の認識の仕方により、平均値や中央値の観点から、データの広がりやばらつきを示す情報を得ることができるのです。

平均値は統計学で非常によく用いられます。しかし、これは誤解されやすいものです。特に、変数で、ばらつきの幅が広い時、誤解が生じやすくなります。そこで、ばらつきの測定が役に立ちます(2)。

確立変数に関連するばらつきの測定には、3つの重要な要素があります(2)。

  • あなたの周りの世界で、それがどれほど一般的かという認識
  • 対立する解釈があるかどうか
  • 定量化できるか(ばらつきの概念とその適応の仕方の理解)
統計 ばらつき 測定

 

何のためにばらつきの測定をするのか?

データから結論を導こうとする時、どんな統計的研究においてもばらつきの測定は重要です。それは、働きかけている誤差の範囲に直接役割を持つためです。標本のばらつきが大きければ大きいほど、その範囲内で働きかける必要のあるスペースが大きくなります

また、あなたのデータが中心傾向より離れているかを測るのにも役立ちます。中心傾向が、研究の標本にした人々を実際にうまく表しているかを示します。特定の決断をするリスクの理解や分布の比較をする時、これは非常に有用です(1)。

まとめると、ばらつきが大きければ大きいほど、中心傾向が典型的でないことを示します。一般的なばらつきの測定値には次のものがあります:

 

それぞれの役割

範囲

範囲は、両端をみることができるため、一般的に比較の最初に使われます。これは、小さな標本でのみ価値があります(1)。基本的な範囲の定義は、データの最初と最後の差です。

統計 ばらつき 測定

平均偏差

そして、平均偏差です。これは、平均からすべて等しく離れているとすると、データがどうあるかを示します(1)。変数の絶対値と平均値との差です。平均偏差とは、基本的に、すべての偏差の平均なのです(3)。

分散

すべての値の代数的機能で、推測統計に最適です(1)。分散とは、基本的に、偏差の二乗です。

標準偏差

同じ集団から得た標本のばらつきの測定によく使われます(1)。分散の平方根です(3)。

変動係数

これは、主に、異なる集団の2つのデータ間の変動を比較するために使われます。例えば、ある学校の生徒の身長と体重を測定します。より代表的な計測のために、どのような特定の分布が、精度の高いデータグループであるかを示します。

統計 ばらつき 測定

変動係数には単位がなく、ここでご紹介したばらつきの測定すべてにおいて最も代表的なものです。つまり、その集団における変数に依存しないのです。一般的に、割合で示された変動係数を目にするでしょう(3)。

ばらつきの測定値により、その標本にどれだけ変動性があるかをみることができます。また、中心傾向がどれほど代表的であるかもわかります。変動性が低ければ、そのデータは中心傾向が高く、すべてのデータの代表だと言えるでしょう。

反対に、変動性が高いと、そのデータは凝集したものではなく、広がったものだということを意味します。高い変動性は、中心傾向が代表的でないことを表します。この場合、データの数を増やす必要があります。データを増やすと、誤差の大きな余地の基本的原因となる変動性を低くすることができます。

  1. Graus, M. E. G. (2018). Estadística aplicada a la investigación educativa. Dilemas Contemporáneos: Educación, Política y Valores, 5(2).
  2. Batanero, C., González-Ruiz, I., del Mar López-Martín, M., & Miguel, J. (2015). La dispersión como elemento estructurador del currículo de estadística y probabilidad. Epsilon, 32(2), 7-20.
  3. Folgueras Russell, P. Medidas de Dispersión. Retrieved from https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=2ahUKEwixgPLvw_XgAhVDAmMBHW02AesQFjABegQIBRAC&url=http%3A%2F%2Fwww.educaguia.com%2FBiblioteca%2Fapuntesde%2Fmatematicas%2FESTADISTICAYPROBABILIDAD%2FMEDIDASDEDISPERSION.pdf&usg=AOvVaw0DCZ9Ej1YvX7WNEu16m2oF
  4. Wild, C. J. y Pfannkuch, M. (1999). Statistical thinking in empirical enquiry. International
    Statistical Review, 67(3), 223-263.