【看護学博士が解説する看護研究のための統計】統計の基本とサンプリング【part1】

この記事では、看護学研究のための統計学について、主に初学者向けに解説していこうと思います。主な対象は大学院修士課程や、臨床で量的に研究をしてみたいという方で、かつきちんと基本を理解したいという方向けです。とりあえず理解は置いておいて、結果が得られれば良いという方は、安価な別の教科書を参考にすることをお勧めします。

第1回では、統計の基本的考え方とサンプリングについて解説します。学習の心構えや研究とは何か?ということについては第0回の記事にありますので、参照してください。


統計の基本:統計的推測

自然科学、社会科学いずれの領域でも、私達は対象集団そのものの特徴や対象集団に起きている現象を明らかにしたいという目的がある。その目的に対し、現象をデータ化し数理的な処理によって明らかにする行為が「統計的推測」である[1]

私達は、対象集団の現象を明らかにしたいとき、本来であればその対象集団(母集団)全体からデータを収集したい。しかしながらそうしたことは現実的に不可能であり、通常私達はその母集団から一部の対象を抽出(サンプリング)し、擬似的に母集団の特性を反映した集団(標本、サンプル)を用意することしかできない。統計的推測は、こうしたサンプルのデータを用い、「(擬似的に母集団の特性を反映した集団は○○であるから)きっと母集団は〇〇なのではないか」と数理的に推測することである。

統計的推測には、古典的には2つのアプローチが存在する。①統計的推定と②仮説検定がその2つである。具体的に何をしているのか、感覚的な理解は次のとおりである:

①統計的推定…母集団の特徴を推測する
例)日本の31才男性の身長は○〜△cmである

②仮説検定…観察者(研究者)が考える仮説を検定する
例)身長が高くなればなるほど体重が増加する

 


サンプリング

上記のように、対象集団を推測する際は母集団に属する一部の標本を抽出して統計的推測を行うため、抽出(サンプリング)する際は、母集団の特徴を反映した標本でなくてはならない。そのための原則抽出は無作為に抽出される必要がある。

母集団から無作為に抽出するとき、標本は確率的に得られる。このとき、母集団の分布は確率分布[2]であるともいえ、多くの場合母集団分布(確率分布)は正規分布を仮定している。母集団分布(確率分布)が正規分布である場合、大数の法則[3]から標本自体の分布も正規分布に近似する(図1)。

図1.母集団分布から無作為に抽出された標本分布

注)「母集団分布=確率分布」を理解するためには、無作為抽出の過程を想像してみると良い。左の分布から無作為に(=目を瞑って)標本を抽出するとき、山が高くなっている部分周辺から抽出される確率が高くなることが感覚的に理解できる。つまり、抽出を繰り返してできる標本分布は母集団の分布によって確率的に決まる、ということである。

統計的推定や仮説検定で汎用されている統計的手法の多くは、母集団分布を特定の分布であると仮定して行われる[4]。つまり、得られた標本が母集団分布を正しく反映していなければ、推定や検定の結果に影響を及ぼす。こうした影響を除外するため、一般的に無作為での標本抽出が推奨されている。


[1] この営みは量的研究だけにあてはまる事象ではない。質的研究もまた、現象を明らかにする手段のひとつである。研究疑問や目的に合わせて、研究者がどのような立ち位置で研究を行い、また学術的にどのような立ち位置で研究を遂行するのが妥当であるかを吟味する必要がある。詳しくは「科学哲学」関連の書籍を参照されたい。

[2] 確率変数に対し、各値がとる確率を表す分布。確率分布の正しい理解は統計学手法を理解する上で近道となる。

[3] 極限定理のひとつで、「確率pで起こる事象において、試行回数を増やすほどその事象が実際に起こる確率はpに近似する」という法則。例えば、サイコロの出る目は試行回数を増やすとすべて1/6に近似する。ただし、試行における確率は独立している必要がある。

[4] ベイズ統計や一般化推定方程式(GEE)は特定の分布関数の強い仮定をおかない推定法である。詳細は専門書を参照されたい。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)