医薬品開発における薬効評価|臨床試験におけるバイアスについて知ろう

臨床試験では治験薬の有効性と安全性を評価するというけれど、薬効評価はどのようにして行われるのだろう?
正確な薬効評価をするうえで大切な要素は何だろう?

この記事の対象者
製薬業界に興味がある方、製薬企業の開発職で働きたいと思う方
臨床試験における統計学、特にバイアスについて知りたい方

「製薬業界に興味がある・医薬品の臨床開発職に興味があるけれど、臨床試験の詳しい内容や臨床開発に必要な知識が何かについてはあまりわからない…」という方はいらっしゃるのではないでしょうか?

上記の悩みは薬学部でない方はもちろんですが、薬学部の方でも意外と多いと思います。薬学部で勉強することの多くは薬剤師として必要な知識の習得で、医薬品の法規制や統計学、臨床試験の実行に必要な知識というのはあまり勉強していないことが現状です。

この記事では上記の悩みを解決するために、臨床試験におけるバイアスとその回避方法について解説しします。

バイアスとランダム誤差

バラつきには系統的なバラつきと誤差的なバラつきがあります。

系統的なバラつきはバイアスと呼ばれ、誤差的なバラつきはランダム誤差と呼ばれます。

バイアス

バイアスと呼ばれるバラつきには、バラつき方に方向性(偏り)があります

一定の方向にバラつきがあるということは、バラつきを平均してもその効果は相殺されないということになります。つまり、バイアスは試行回数を増やしても解消されません。

たとえば、ある体温計Aで体温を測ったとしましょう。体温計Aはあなたの現在の真の体温より常に0.1℃高く測定してしまいます。

この場合、あなたはこの体温計で100回体温を測ったとしても、得られる体温の平均値は真の値より0.1℃高くなってしまいます。

このように、バイアスはデータの正確度(妥当性)に関わります。

ランダム誤差

ランダム誤差と呼ばれるバラつきには、バラつき方に方向がありません。言い換えると、真の値を中心としてランダムに(確率的に)バラつくということです。

バラつき方に方向がなければ、バラつきを平均すると真の値に近づきます。理論的には、試行回数を十分に多くするとランダム誤差の影響が小さくなり、観測値は真の値に収束します。

たとえば、ある体温計Bで体温を測ったとしましょう。体温計Bはあなたの現在の真の体温に対して±0.1℃のランダム誤差で測定してしまいます。

この場合、1回だけ体温を測った場合は最大0.1℃の誤差が生じますが、100回体温を測った場合はランダム誤差が真の値周りでバラつくので、誤差が打ち消しあうことで、100回測定した平均値は真の値に近づきます。

このように、ランダム誤差はデータの精密度(信頼性)に関わります。

臨床試験におけるバイアスの原因

臨床試験におけるバイアスとは、ある医薬品について対照薬との真の薬効差を知りたいのに何らかの理由で系統的にズレが生じてしまうことなどを指します。

バイアスの原因となるものは数えきれないほどあり、臨床試験のおいては計画・実施・解析・報告のあらゆる段階で生じます

主なバイアスとしては、被験者の選択バイアス、被験者の過少報告等による情報バイアス、暴露因子とアウトカムの両方に関係する交絡バイアスがあります。

バイアスは前項で説明した通り、試行回数を重ねても効果が残り続ける系統的なバラつきであるため、できる限り取り除く必要があります。

エンドポイントに必要な性質

バイアスを減らすにはどうすればよいでしょうか?

一つの方法として、エンドポイントの信頼性と妥当性を高めることが考えられます。

エンドポイントとは、臨床試験等において仮説の検証のために測定する評価項目のことです。エンドポイントは治験薬の有効性を示すうえで最も重要な評価項目なので、その信頼性と妥当性の確保がランダム誤差やバイアスの低減につながります。

信頼性は先ほどランダム誤差で説明したように、エンドポイントの精密度に関わります。

信頼性を確保するためには、同じ人が複数回測定した場合に同じ精度で測れるか、違う人が測定しても精度は変わらないかといった点が大切です。つまり、エンドポイントは客観的に評価できるものが望ましく、測定精度の向上のためにマニュアルの作成やトレーニングの実施が望まれます。

妥当性はバイアスの説明の通り、エンドポイントの正確度に関わります。

妥当性を確保するためには、評価したい項目を適切に測定できているかということが大切です。例えば精神疾患系における評価項目は、血圧等と違って客観的な評価が難しいことがあります。うつ病の状態をどれくらい改善できたかということを評価したい場合に、測定しているエンドポイントがどれくらいその評価に対して妥当であるのかということを知る必要があります。

内的妥当性と外的妥当性

ところで、妥当性には2種類あります。それは、内的妥当性と外的妥当性です。

これらの言葉は因果推論の世界で有名なドナルド・キャンベルが初めて使った言われています。

内的妥当性(Internal validity)

内的妥当性は比較可能性とも呼ばれ、観察された2つの事象において因果関係が成り立つかということを表します。一般に相関関係≠因果関係ですが、内的妥当性が高いということは、観察された2つの事象の相関関係から因果関係を導くことができることを意味します。

内的妥当性を高める方法として、無作為化(無作為割付)があります。代表的な無作為化の手法はランダム化比較試験(Randomised Contorolled Trial, RCT)でしょう。RCTとは、どの対象集団がどの介入を受けるかを決める際に、乱数表などを使って無作為に(ランダムに)割り付ける方法です。RCTは観測された交絡因子だけでなく未知の交絡因子によるバイアスも排除できるため、最も内的妥当性が高い研究デザインといわれています。

外的妥当性(External validity)

外的妥当性は一般化可能性とも呼ばれ、ある集団から得られた結果が、他の集団に対しても同じように得られるかということを表します。例えば、東京のある病院Aで実施された治験から得られた薬の有効性や安全性は、ほかの集団(別の地域、時代)に対してどの程度同じような結果となるのかということが外的妥当性を表します。つまり、外的妥当性は研究結果を外挿することに対する妥当性といえます。

外的妥当性を高める方法として、無作為抽出があります。無作為抽出とは、母集団から標本集団を抽出する際に、無作為に(ランダムに)個体を抽出することを意味します。つまり、選ばれた標本集団は母集団を正確に代表していることが重要です。

例えば、日本の20歳から74歳までの男性のコレステロール値の平均を求めたいのに60歳以上の男性から標本を抽出すると、その推定値は母集団の平均値にしては高すぎますよね。抜き取られる標本は無作為だからこそ、標本集団から得られた知見を一般化(=母集団に適用)できます

交絡因子(Confounding)

ところで、ここまで交絡因子という言葉が何度か出てきました。

交絡因子とは、原因とされる因子と、結果と想定される因子の両方に影響を与える第3の因子のことです。交絡因子は内的妥当性で説明した因果関係を検討するうえで、見かけ上の因果関係を作ってしまうことが問題となります。

交絡因子を図で表すとこのようになります。

交絡因子を正しく制御しないと、本当は因果関係がないかもしれない2つの事象に因果関係があるように見えてしまう

交絡因子を制御する方法として、先ほど無作為化を紹介しました。

交絡因子は原因となる因子と結果となる因子の両方に影響を与えますが、交絡因子と結果となる因子との関係を断ち切ることはできません。しかし、交絡因子と原因となる因子との関係を断ち切ることができます。その方法が無作為化です。

たとえば、性別と肺がんとの関係を調べているとします。男性の方が肺がんにかかりやすいというデータがあった場合、喫煙という因子は男性に多く、肺がんの発症に影響を与える交絡因子と考えられますが、喫煙と肺がんとの関係を断ち切るのは無理ですよね。しかし、交絡因子と性別との関係は無作為化によって断ち切ることができます。

バイアスの回避-無作為割り付けの方法

最後に、臨床試験における無作為割付のバリエーションについて簡単に紹介します。

割付方法は静的割付と動的割付に大別されます。

静的割付とは、事前に決まった乱数表を用いた割付です。静的割付の例としては、完全無作為化、置換ブロック法などがあります。

動的割付とは、それ以前に割り付けられた情報に応じて次の割付を決める方法です。動的割付の例としては最小化法などがあります。

完全無作為化

完全無作為化は、乱数表を用いてその名の通り完全に無作為に割り付ける方法です。

サンプルサイズが十分に大きい場合は確率的に均等に割り付けられますが、そうでない場合は極端な不均衡が起こる可能性があります。(コインを10回投げた程度では7,8回同じ目が出る可能性も小さくないですよね。)

完全に無作為なので、患者や医師は自分がどちらの群なのかを予測することが不可能であるメリットはありますが、上記のデメリットから実際はほとんど使われません。

置換ブロック法

置換ブロック法は、一定のブロックサイズのもとで均等に割り付ける方法です。

例えばブロックサイズが4の場合、4人ごとに均等な割付を行います。(A1, A2, A3, A4) = (X, X, Y, Y), (A5, A6, A7, A8) = (Y, X, X, Y)といったような形です。

この場合、サンプルサイズが4の倍数のとき必ず均衡となり、不均衡は高々2症例となります。

ブロックサイズが大きくなるほど最大の不均衡例が多くなりますが、逆にブロックサイズが小さいほど割付を行う側は次の患者がどちらの群に投与されるのか予想がしやすくなります。(上の例では、X, Xと続いたら次はYだと予想できます。)

置換ブロック法の発展として、ブロックサイズを複数用いた可変長の置換ブロック法、重要な既知の予後因子の均衡を図る層別置換ブロック法などがあります。

最小化法

最小化法は、研究対象者が割り付けられるごとにある背景因子の群間における不均衡を確かめて、その不均衡を減らすように次の対象者を割り当てる方法です。

静的割付と違ってその手順が煩雑なので、事前に入念なシステムの設計をすることが重要となります。

なお、次の対象者を割り当てる際は、決定論的に(100%の確率で)割り付けると予測可能性がなくなるため、確率的に(80%など)割り付けます。

まとめ

今回はバイアスを中心としたさまざまな用語の説明と、臨床試験におけるバイアスの回避方法について解説しました。

医薬品の開発を知るうえで、また関連した論文を読むうえで統計学的な知識は少なからず必要となります。

今後も、医薬品の開発で必要となる統計学の知識について説明していきます。

コメント

タイトルとURLをコピーしました