2017/09/14

文献によく出てくるt検定の種類、3つ。


医療系の論文に出てくるt検定には、対応のあるt検定、対応のないt検定、Welchのt検定の大きく3つがあります。t分布を使うという意味では、いずれも広義にはt検定でいいようにも思います。文献を複数用いる資材の作成で表記がずれる場合の目安にしていただければと思います。

対応のないt検定


t検定は、2群間の平均値の差に差があるかどうかをデータの散らばり具合から調べる方法です。
対応のないt検定はスチューデントのt検定とも呼ばれます。統計では、内容が同じなのに違う呼ばれ方をする場合が多くあります。

  • unpaired t-test(英語表記)
  • Student t-test=Student's t-test
  • 独立t検定

同じ検定に複数の名称があるのには、理由いろいろあるようです。例えば、スチューデントは学生そのままの意味のようです。t検定の開発者であるゴセット (William Sealy Gosset)さんは、実は会社勤めのサラリーマン研究者だったのです。本来はWilliam's t testでも良さそうなものですが、そこはいわゆる大人の事情ということで、皮肉を込めて偽名のような感じで「学生の考えたt検定(=Student's t-test)」と名付けたとか。
もう一つの名前である、「独立t検定」は、これはただの翻訳の問題です。医療統計の分野では、ほとんど「対応のあるt検定」と訳しています。

対応のないt検定は、医薬品の効果を試すために、ある医薬品を使ったグループと使わなかったグループの2つに分けて試験する時に使われます。例えば、降圧薬を投与した群と投与しない群で、その血圧値(平均値)に差があるかどうかを検定するような場合に用いられます。具体的に検定について知りたい場合は、電子書籍を作成したので、ご参照ください。


対応のあるt検定


対応のあるt検定は、t検定のうちでも、医薬品の効果を試すために、ある医薬品を使った被験者の前後値を比べる試験などで使われます。例えば、降圧薬投与前後の血圧値の差(血圧降下度)の検定があります。「対応のあるt検定」は「対応のないt検定」とは別物です。「対応の有無」とは、「同一個体からデータがとられているか、否か」と言うことです。血圧の前後値は同一個体(被験者)からデータを取ることになるので、「対応あり」となります。

この降圧薬投与前後の血圧値の差(血圧降下度)の検定は、1標本試験デザインとして、最も単純な試験デザインになります。対応のあるt検定は、同一個体からデータを得るので、対応のあるt検定の方が対応のないt検定より縛りが強くなります。このため「対応のある」血圧値の前後のデータを「対応なし」として無理やり「対応のないt検定」で処理することが可能ですが、結果が異なってしまいます。検定方法は試験デザインと密接に関係しています。

上記の1標本試験デザインで降圧薬による血圧効果度の検定を例として取り上げた電子書籍を作成しました。医療統計の入門書です。添付文書や製品情報概要など、図表の下に小さく書いてある検定方法を知るのに、どこから検定を理解したらいいのか迷っている方もいるかも知れません。この電子書籍では、どうしても必要な基礎的事項のみに絞り、枝葉を削ぎ落としました。最終的には数式で理解を進めることも必要だと思います。ただ、統計の全体像を俯瞰してからでないと数式を追ってもつまずくことになります。そのため、極力数式を使わない形で、t検定の他、ANOVAまで解説しました。t検定の対応の有無についてもきっと理解できると思います。



Welchのt検定


データのバラツキが群間で違いそうな場合に、Welchのt検定が使われます。 外れ値の存在やバラツキ方がいわゆる釣り鐘型の正規分布をしていない場合があります。Welchのt検定はデータのバラツキが群間で違うかどうかを検定します。

この検定が少し異質に感じるのは、文献になった図表を見る時には、生のデータではなく、平均値の棒グラフなどになっているため実データを見ることがないからだと思います。

現場では外れ値を捨てたり、対数をとったりすることで分散を揃えます。等分散性がある場合に対応のあるt検定や対応のないt検定が使われます。

まとめ


対応のあるt検定、対応のないt検定、Welchのt検定の3種類を紹介しました。複数文献から1つの資料を作成する場合など混乱するときがあるかもしれませんので、参考にしてください。

統計の理解に不安を感じたら、医療統計を俯瞰できる電子書籍「医療統計入門」をご一読ください。t検定の前提となる計量データの説明や分散、標準偏差から解説しています。数式を使わず、数字の大小が分かれば、図表を見て内容を理解できるようにすることを目標としました。パラパラと読めるようにしたつもりなので、是非統計の入門書としてご活用ください。

iBooksバージョン(Apple Books




Kindleバージョン(Amazon