基本的な統計の概念

2019年9月9日
今回は、さまざまな統計の概念をご紹介します。

統計は、確率の法則に従い、そのモデルを使用して変動性を計算するプロセスと同様に、変動性を研究する数学の分野です。調査を実施し理解するには統計が必要であることがわかっていますが、基本的な統計の概念とは何でしょうか?

基本的な統計の概念に焦点を合わせるには、記述統計に目を向ける必要があります。記述統計とは、統計の手法のひとつで、収集したデータの平均や分散、標準偏差などを計算して分布を明らかにし、データの示す傾向や性質を把握する手法のことを言います。観察対象となる母集団の大量観察に基づいて、その平均・分散・ 標準偏差などの値を導き、母集団の性質や傾向を記述します。

基本的 統計 概念

マドリードのチャールズ3世大学のイグナシオ・カスコス教授によると、以下に挙げるものは、誰もが知っておくべき基本的な統計概念です。

1.母集団

母集団とは、調査や観察の対象とする集団全体、標本を抽出するときの元の集団を言います。

母集団には「有限母集団」と「無限母集団」があります。したがって、母集団のサイズは、母集団に含まれる要素の数です。通常、大文字のNで示されます。

母集団が非常に多い場合、調査の実施には多くの費用がかかる可能性があります。そのため、場合によっては、すべての要素を考慮することができません。したがって研究者は通常、母集団から得たサンプル(標本)からいくつかの要素を選択します。

ご存知でしたか?:
統計におけるばらつきの測定

2.アイテム

アイテムは、母集団の個々の要素です。現在、これらの要素は必ずしも人である必要はありません。しかし、心理学では、通常人を意味します。

3.サンプルサイズ

母集団から無作為にサンプルをとりだしたときの観測データの個数が「サンプルサイズ」です。サンプルは母集団の特性を反映した代表的なものです。また、1つの標本に含まれる要素の数のことを指します。通常は小文字のnで表されます。

サンプルと母集団のサイズが一致する場合、それは全数調査と呼ばれます。

こちらもご参考に:
ハンス・ロスリング:人口統計の予言者

4.変数

変数(X)は、研究者が測定またはカウントできる母集団の特性、数、量を表す記号です。データ(r)は、変数内で変更できる値です。その値は、測定するアイテムによって異なります。

基本的 統計 概念

変数の種類

定性的変数

このタイプの変数は、数字では測定できない特性を表します。したがって、一方が他方よりも価値があるとは言えません。

変数の例としては性別があります。変数の違いは品質または特性であるため、これらの変数は定性的と呼ばれます。

順序変数

順序変数はカテゴリに分類できます。さらに、価値によってランク付けしたり順番に並べることが可能です。定性的変数がある場合、それらをランク付けできます。

たとえば、学校の成績がその例です。 「A」は「B」よりも優れています。同様に、「B」の方が「F」よりも優れています。

量的変数

量的変数は数値として意味があります。したがって、これは数値で測定可能です。以下の2つのタイプがあります。

測定位置

記述統計では、測定位置を利用してデータを決定できます。

中心的傾向の測定

平均値や中心的傾向の測定値は、統計において非常に典型的で代表的です。これらの目的は、すべてのデータをひとつに要約することです。

中心傾向の代表値は、最頻値(質的変数)、中央値(カテゴリー変数)、および平均値(量的変数)です。

基本的な統計の概念

  • 最頻値。最頻値とは、データの中で最も頻繁に出現する値のことです。最頻値は「最も頻繁に出現する値」のみを反映するため、他の値から大きく離れた『外れ値』の影響を受けにくいという強みがあります。これらの値が複数ある場合、変数は複数の形式をとります。さらに、様々な変数の最頻値を計算できます。
  • 中央値。カテゴリ変数について計算します。有限個のデータを小さい順に並べたとき中央に位置する値のことを言います。中央値は、平均値と違って外れ値の影響をほとんど受けないため、「普通のデータ」の値を知りたいときは平均よりも中央値の方が適しています。
  • 平均値。代表値として最も有名なのが、平均値です。均値(算術平均)は、各データの値の合計をデータの総数で割った値です。それを計算するためには量的変数が必要です。平均は、幾何学的な中心がある場所です。サンプルを代表するわけでもなく、またサンプルからの実際の値でもないケースもあります。つまり、その値は実際にはサンプルに存在していない可能性があります。

最終的な考え

統計ではさらに多くの概念が使用されますが、今回ご紹介したものは、おそらく最も基本的な概念です。 これにより、統計とデータ表現を整理および計算できます。 統計は研究者および科学界にとって素晴らしいツールです。 研究においてより明白な結果を提供することができるからです。

  • de Datos, A. E. (1983). Estadística Descriptiva.
  • Fernández, S. F., Sánchez, J. M. C., Córdoba, A., Cordero, J. M., & Largo, A. C. (2002). Estadística descriptiva. Esic Editorial.
  • García Pérez, A. (2008). Estadística aplicada: Conceptos básicos.