漢方や薬膳の効果が証明されない理由は?研究の質を科学的に検証
「多成分・多標的だから効果サイズが測れない」という言い訳
薬膳や漢方の議論でよく聞くこの言葉。
「複雑だから」「個別化が必要だから」「西洋医学の枠組みでは評価できない」と。
効果サイズ原理主義者の俺にとって、これは最も受け入れがたい言い訳だ。
Nature Reviews Clinical Oncology 2017は、パーソナライズド医療でもRCT(ランダム化比較試験)が必要だと明言している。
「精密医療にはランダム化比較試験が必要」
個別化医療でも、バイオマーカーの予測的役割を確定するには、ランダム化が必須。
単腕試験(対照群のない試験)では、治療効果ではなく、ターゲットの予後的性質を反映している可能性がある。
つまり、「複雑だから」「個別化だから」という言い訳は、科学的に無効。
では、なぜ薬食同源の効果サイズが測れないのか?
結論から言うと、「研究デザインの質が低いから」。
効果サイズが測れない5つの理由
中国の88 RCTを評価した研究(2013-2023)が、この問題を明確に示している。
1. ランダム化・盲検化の欠如
- ランダム化の記述: 27/88(30.68%)のみ
- 割り付けの隠蔽: 3/88(3.41%)のみ
- 盲検化: 3/88(3.41%)のみ
これが何を意味するか?
ランダム化がなければ、**選択バイアス(参加者選択の偏り)**が入り込む。期待の高い患者を治療群に入れる可能性。
盲検化がなければ、期待バイアスと評価バイアスが入り込む。治療群に高い評価をつける可能性。
つまり、真の治療効果と、バイアスの区別が不可能。
効果サイズを測る以前の問題だ。
2. サンプルサイズが小さい
Cochraneレビューでも「サンプルサイズが小さい」ことが繰り返し指摘されている。
- Shengmai(生脈)のレビュー: 14 RCT、858名
- 癒着性腸閉塞のレビュー: 5 RCT、664名
- 鍼治療のレビュー: 6 RCT、462名
50名未満/群の研究が多い。
検出力不足で、真の効果サイズを検出できない。
偶然による有意差(Type I error:第一種過誤)の可能性が高い。
3. 出版バイアス
中西医結合の脳卒中リハビリのメタアナリシス(58研究、6,339名)が、重大な指摘をしている:
「Most studies were short in duration (2 to 4 weeks) and prone to different types of biases, which prevents making any conclusion regarding the long-term effects and raises concerns regarding true efficacy in context of high likelihood of Hawthorn bias.」
**ホーソン効果(実験参加による行動変化)**とは、著者の期待が結果に影響するバイアス。
さらに、ほとんどの研究が中国で実施されている。
ポジティブな結果のみが出版されている可能性(出版バイアス)が高い。
西洋諸国での再現性が検証されていない。
4. 短期間の研究
2-4週間の研究が多い。
長期的効果のエビデンスなし。
プラセボ効果(偽薬効果)と真の治療効果の区別が困難。
5. 主観的アウトカムの多用
不眠症に対する鍼治療のCochraneレビュー(7 RCT、590名)が示している:
- 睡眠の質(vs placebo): SMD(標準化平均差) = -1.08 (-1.86 to -0.31, p=0.006) - 有意な改善
- しかし、睡眠潜時、総睡眠時間、中途覚醒では一貫性なし
- 主観的改善(3研究統合): RR(リスク比) = 1.66 (0.68-4.03) - 有意差なし、有意な異質性
主観的指標(睡眠の質、疼痛、「total efficiency rate」等)では効果があるように見えるが、客観的指標では効果が一貫しない。
プラセボ効果の影響が大きい可能性。
Cochraneレビューの評価:「エビデンス不十分」
コクラン共同計画は、世界で最も厳格なエビデンス評価機関だ。
複数のTCM/CAMレビューで、以下のように結論している:
Shengmai(生脈)のCochraneレビュー
- 14 RCT、858名
- NYHA(ニューヨーク心臓協会分類)改善: RR 0.37 (0.26-0.51) - 有意な改善
- しかし: バイアスリスクが高い(特に割り付けの隠蔽、盲検化)、サンプルサイズが小さい、有意な異質性
- 死亡率のエビデンスなし
結論: 「レビュー結果は、バイアスリスクが高いため慎重に解釈すべき」
癒着性腸閉塞に対するTCMのCochraneレビュー
- 5 RCT、664名
- 改善率: OR(オッズ比) 4.24 (2.83-6.36) TCM+従来治療 vs 従来治療のみ
- しかし: 不十分な報告、方法論的質が低い、さまざまなバイアスの蔓延
- 有害事象の議論なし
結論: 「このシステマティックレビューは、TCMの客観的有効性と安全性を支持する十分なエビデンスを見出せなかった」
神経障害性疼痛に対する鍼治療のCochraneレビュー
- 6 RCT、462名(403名中国、59名UK)
- 疼痛強度: MD(平均差) -0.4 (-1.83 to 1.03) - 有意差なし
- VAS(視覚的アナログスケール)平均: 5.8(鍼治療)vs 6.2(偽処置)- どちらも「軽度の疼痛」を達成せず
結論: 「神経障害性疼痛に対する鍼治療の使用を支持または否定する十分なエビデンスなし」「極めて質の低いエビデンス」
パーソナライズド医療でもRCTが必要
Nature Reviews Clinical Oncology 2017が明確に述べている:
「The apparent improvements in outcomes observed in an early single-arm trial of a new therapy might reflect the prognostic nature of the target, rather than a true treatment effect. Moreover, the predictive role of biomarkers cannot be definitively ascertained without randomly assigning patients to a control arm.」
つまり、単腕試験で観察された改善は、治療効果ではなく、ターゲットの予後的性質を反映している可能性がある。
バイオマーカー(生体指標)の予測的役割も、ランダム化なしでは確定できない。
精密がん医療のレビューも、複雑な腫瘍生物学を克服するには、複数の標的治療の組み合わせが必要だと述べているが、それでもRCTで効果サイズを測定している。
「個別化が必要だから」「多成分・多標的だから」という言い訳は、科学的に無効。
「測れない」のではなく「測っていない」
88 RCTの評価(PMID 39177352)が示したのは:
- すべてのRCTで以下が欠如:
- 完全な介入措置の記述
- 被験者フローチャート
- 臨床試験登録
- 研究プロトコル
問題は「効果サイズが測れない」のではなく、「測っていない」か「測る気がない」か「測ったら効果が小さすぎて困る」かのどれか。
研究デザインの質を上げれば、効果サイズは測定可能だ。
実際、質の高いハーブ医学のメタアナリシスは、効果サイズを報告している:
- Ashwagandha(ストレス・不安): 不安 SMD -0.37 to -0.62(中程度)、ストレス SMD -0.60 to -1.10(中〜大)
- Cinnamon/Fennel/Ginger(月経痛): 疼痛強度 MD -1.36 to -2.66 (VAS 0-10)(大)
- Vitex agnus castus(PMS): PMS症状 MD -0.25 to -0.40(小〜中)
これらは、研究の質にばらつきがあるものの、効果サイズを測定している。
測れないのではなく、測っていないだけ。
竹内の結論
「効果サイズが測れない」のは「多成分・多標的」が理由ではなく、「研究デザインの質が低い」から。
5つの理由:
- ランダム化・盲検化の欠如: 30.68%しか記述なし
- サンプルサイズが小さい: 検出力不足、偶然による有意差の可能性
- 出版バイアス: 中国での研究が多い、ホーソン効果
- 短期間の研究: 2-4週間、長期的効果不明
- 主観的アウトカム: 客観的指標では効果が一貫しない
Cochraneレビューは繰り返し「エビデンス不十分」「極めて質の低いエビデンス」「バイアスリスクが高い」と結論している。
Nature Reviews Clinical Oncologyは、パーソナライズド医療でもRCTが必要だと明言している。
「伝統だから」「個別化だから」という言い訳は、科学的に無効。
問題は「測れない」のではなく、「測っていない」か「測る気がない」か「測ったら効果が小さすぎて困る」かのどれかだ。
効果サイズ原理主義者として、この現実を直視する。
研究デザインの質を上げれば、効果サイズは測定可能だ。
そして、測定された効果サイズが、投資に見合うかどうかを判断する。
それが、科学的思考だ。
参考文献
本記事は以下の12論文に基づいています:
- 精密医療にはランダム化比較試験が必要 - Nature Reviews Clinical Oncology 2017
- TCMのRCT方法論と報告の質 - 前立腺肥大症、88 RCT評価、中国2013-2023
- Shengmai(生脈)のCochraneレビュー - 14 RCT、858名
- 癒着性腸閉塞に対するTCMのCochraneレビュー - 5 RCT、664名
- 神経障害性疼痛に対する鍼治療のCochraneレビュー - 6 RCT、462名
- 精密がん医療のレビュー - Cancer Treatment Reviews 2020
- BPH/前立腺癌に対するニュートラシューティカル - Serenoa repens等のレビュー
- Danggui-Shaoyao-San(当帰芍薬散)の認知症メタアナリシス - MMSE改善MD 4.60
- 中西医結合の脳卒中リハビリ、メタアナリシス - 58研究、6,339名、Hawthorn bias指摘
- vestibular Migraineに対するTCM、メタアナリシス - 21研究、1,650名
- 妊娠時嘔吐に対するCAM、メタアナリシス - 33 RCT、low-quality evidence
- 不眠症に対する鍼治療、Cochraneレビュー - 7 RCT、590名
おすすめの関連書籍
エビデンスベース医学(EBM)を理解する
エビデンスに基づく医学(EBM)の歴史と現状を批判的に検証。研究デザインの質を理解したい人に。
¥5,720 (記事作成時の価格です)
rakuten.co.jp
漢方のエビデンスを知る
科学的エビデンスに基づいた漢方の活用法。質の高い研究デザインの重要性を示す実践的書籍。
¥3,080 (記事作成時の価格です)
rakuten.co.jp
誰におすすめか
竹内の視点:効果サイズ原理主義者
俺にとって、これは重要な記事だ。
「多成分・多標的だから測れない」という言い訳が、科学的に無効だと分かった。
問題は「測れない」のではなく、「測っていない」。
研究デザインの質を上げれば、効果サイズは測定可能だ。
そして、測定された効果サイズが、投資に見合うかどうかを判断する。
それが、科学的思考だ。
おすすめする人:
- 効果サイズを重視する人
- 科学的エビデンスを求める人
- 「伝統だから」という言い訳に納得できない人
- 研究デザインの質を理解したい人
おすすめしない人:
- 「伝統だから効く」と信じたい人
- 主観的体験を重視する人
- 批判的分析を受け入れられない人