2018/01/02

検定の多重性について

多重比較の必要性

多重比較が臨床試験に登場するのは、複数の評価項目がある場合です。
多重検定をする理由は、一度の臨床試験結果から、複数の比較して沢山の情報を得たいという倫理面の問題が大きいように思います。

多重比較について、深く求められることがあるのは、検定回数を増やすと、どこかで有意差が出る(第1種の過誤)可能性/確率があるためです。この多重比較の問題を解決するために検出量の調整方法(多重性の調整)と手順の2つのアプローチがあります。
まず、検定を複数行う中で調整して行く考え方が、Familywise error rateとして発展してきました。また、手順としては、検定に順序をつけ、各段階で有意水準を守るようにすれば全体として有意水準を保てるという考え方(閉検定手順:閉手順)が利用されています。


多重性の検出力による調整

多群比較の後に全ての群の組み合わせについて比較を行うテューキーの多重比較検定(Tukey's multiple comparison test)もありますが、下記の2つが知られています。

  • bonferroni法 (検定する数で検出力を調整)
  • holm法 (Holm法は、bonferroniを多段階に改良したもの) 

多重性の手順による調整

統計的手順をコントロールすることで全体として有意水準を保つGatekeeping法があります。 このGatekeeping法には、下記の3種類があります。

  • 非劣性試験が検証された後に優越性試験を行う直列型 
  • 標準薬と治験薬の両方がプラセボより優越した場合に、標準薬と治験薬を比較を行う並列型 
  • 中間解析のようにエンドポイントが分岐する分岐型 

最近の作成要領とのルールに照らして

製薬協の作成要領(医療用医薬品における広告の自主規制)では、臨床研究の結果を医師に知らせるために試験の概要を書くことになっています。最近の改定では、臨床試験の結果だけでなく、どのように行われたか(解析手順)まで書くようになりましたので、これれについても触れてみました。