統計におけるばらつきの測定
どんなデータにおいても、ばらつきの測定は重要な役割を担います。これは、中心傾向の測定と共に使われ、データの変動性を示します。
中心傾向の値から、様々なデータのまとめ方がわかります。ある標本や集団において、変数がどう変わるかを知るのに役立ちます。中央地、平均値、範囲が3つの基本要素です。
ばらつきの値は、中心傾向の値と連動します。そのデータの分散を示すため、データを読む時に必要不可欠です。統計におけるこれらの重要性は、ワイルドとプファンコッホ(1999)により強調されています。
データの変動性の認識は、統計学的思考の基本的要素のひとつだと彼らは言います。変動性の認識の仕方により、平均値や中央値の観点から、データの広がりやばらつきを示す情報を得ることができるのです。
平均値は統計学で非常によく用いられます。しかし、これは誤解されやすいものです。特に、変数で、ばらつきの幅が広い時、誤解が生じやすくなります。そこで、ばらつきの測定が役に立ちます(2)。
確立変数に関連するばらつきの測定には、3つの重要な要素があります(2)。
- あなたの周りの世界で、それがどれほど一般的かという認識
- 対立する解釈があるかどうか
- 定量化できるか(ばらつきの概念とその適応の仕方の理解)
何のためにばらつきの測定をするのか?
データから結論を導こうとする時、どんな統計的研究においてもばらつきの測定は重要です。それは、働きかけている誤差の範囲に直接役割を持つためです。標本のばらつきが大きければ大きいほど、その範囲内で働きかける必要のあるスペースが大きくなります。
また、あなたのデータが中心傾向より離れているかを測るのにも役立ちます。中心傾向が、研究の標本にした人々を実際にうまく表しているかを示します。特定の決断をするリスクの理解や分布の比較をする時、これは非常に有用です(1)。
まとめると、ばらつきが大きければ大きいほど、中心傾向が典型的でないことを示します。一般的なばらつきの測定値には次のものがあります:
それぞれの役割
範囲
範囲は、両端をみることができるため、一般的に比較の最初に使われます。これは、小さな標本でのみ価値があります(1)。基本的な範囲の定義は、データの最初と最後の差です。
平均偏差
そして、平均偏差です。これは、平均からすべて等しく離れているとすると、データがどうあるかを示します(1)。変数の絶対値と平均値との差です。平均偏差とは、基本的に、すべての偏差の平均なのです(3)。
分散
すべての値の代数的機能で、推測統計に最適です(1)。分散とは、基本的に、偏差の二乗です。
標準偏差
同じ集団から得た標本のばらつきの測定によく使われます(1)。分散の平方根です(3)。
変動係数
これは、主に、異なる集団の2つのデータ間の変動を比較するために使われます。例えば、ある学校の生徒の身長と体重を測定します。より代表的な計測のために、どのような特定の分布が、精度の高いデータグループであるかを示します。
変動係数には単位がなく、ここでご紹介したばらつきの測定すべてにおいて最も代表的なものです。つまり、その集団における変数に依存しないのです。一般的に、割合で示された変動係数を目にするでしょう(3)。
ばらつきの測定値により、その標本にどれだけ変動性があるかをみることができます。また、中心傾向がどれほど代表的であるかもわかります。変動性が低ければ、そのデータは中心傾向が高く、すべてのデータの代表だと言えるでしょう。
反対に、変動性が高いと、そのデータは凝集したものではなく、広がったものだということを意味します。高い変動性は、中心傾向が代表的でないことを表します。この場合、データの数を増やす必要があります。データを増やすと、誤差の大きな余地の基本的原因となる変動性を低くすることができます。
引用された全ての情報源は、品質、信頼性、時代性、および妥当性を確保するために、私たちのチームによって綿密に審査されました。この記事の参考文献は、学術的または科学的に正確で信頼性があると考えられています。
- Gamboa, M. E. (2018). Estadística aplicada a la investigación educativa. Dilemas Contemporáneos: Educación, Política y Valores, 5(2), 1-32. https://dilemascontemporaneoseducacionpoliticayvalores.com/index.php/dilemas/article/view/427
- Batanero, C., González, R. I., del Mar, L. M., & Miguel, J. (2015). La dispersión como elemento estructurador del currículo de estadística y probabilidad. Epsilon, 32(2), 7-20. http://funes.uniandes.edu.co/18184/
- Folgueras, R. P. (s. f.). Medidas de Dispersión. https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=2ahUKEwixgPLvw_XgAhVDAmMBHW02AesQFjABegQIBRAC&url=http%3A%2F%2Fwww.educaguia.com%2FBiblioteca%2Fapuntesde%2Fmatematicas%2FESTADISTICAYPROBABILIDAD%2FMEDIDASDEDISPERSION.pdf&usg=AOvVaw0DCZ9Ej1YvX7WNEu16m2oF
- Manikandan, S. (2011). Measures of dispersion. Journal of Pharmacology and Pharmacotherapeutics, 2(4), 315-316. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3198538/