漢方や薬膳の効果が証明されない理由は？研究の質を科学的に検証

竹内翔

投稿日 : 2026-05-13

約9分で読めます

比較

「多成分・多標的だから効果サイズが測れない」という言い訳

薬膳や漢方の議論でよく聞くこの言葉。

「複雑だから」「個別化が必要だから」「西洋医学の枠組みでは評価できない」と。

効果サイズ原理主義者の俺にとって、これは最も受け入れがたい言い訳だ。

Nature Reviews Clinical Oncology 2017は、パーソナライズド医療でもRCT（ランダム化比較試験）が必要だと明言している。

「精密医療にはランダム化比較試験が必要」

個別化医療でも、バイオマーカーの予測的役割を確定するには、ランダム化が必須。

単腕試験（対照群のない試験）では、治療効果ではなく、ターゲットの予後的性質を反映している可能性がある。

つまり、「複雑だから」「個別化だから」という言い訳は、科学的に無効。

では、なぜ薬食同源の効果サイズが測れないのか？

結論から言うと、「研究デザインの質が低いから」。

効果サイズが測れない5つの理由

中国の88 RCTを評価した研究（2013-2023）が、この問題を明確に示している。

1. ランダム化・盲検化の欠如

ランダム化の記述: 27/88（30.68%）のみ
割り付けの隠蔽: 3/88（3.41%）のみ
盲検化: 3/88（3.41%）のみ

これが何を意味するか？

ランダム化がなければ、**選択バイアス（参加者選択の偏り）**が入り込む。期待の高い患者を治療群に入れる可能性。

盲検化がなければ、期待バイアスと評価バイアスが入り込む。治療群に高い評価をつける可能性。

つまり、真の治療効果と、バイアスの区別が不可能。

効果サイズを測る以前の問題だ。

2. サンプルサイズが小さい

Cochraneレビューでも「サンプルサイズが小さい」ことが繰り返し指摘されている。

50名未満/群の研究が多い。

検出力不足で、真の効果サイズを検出できない。

偶然による有意差（Type I error：第一種過誤）の可能性が高い。

3. 出版バイアス

中西医結合の脳卒中リハビリのメタアナリシス（58研究、6,339名）が、重大な指摘をしている：

「Most studies were short in duration (2 to 4 weeks) and prone to different types of biases, which prevents making any conclusion regarding the long-term effects and raises concerns regarding true efficacy in context of high likelihood of Hawthorn bias.」

**ホーソン効果（実験参加による行動変化）**とは、著者の期待が結果に影響するバイアス。

さらに、ほとんどの研究が中国で実施されている。

ポジティブな結果のみが出版されている可能性（出版バイアス）が高い。

西洋諸国での再現性が検証されていない。

4. 短期間の研究

2-4週間の研究が多い。

長期的効果のエビデンスなし。

プラセボ効果（偽薬効果）と真の治療効果の区別が困難。

5. 主観的アウトカムの多用

不眠症に対する鍼治療のCochraneレビュー（7 RCT、590名）が示している：

睡眠の質（vs placebo）: SMD（標準化平均差） = -1.08 (-1.86 to -0.31, p=0.006) - 有意な改善
しかし、睡眠潜時、総睡眠時間、中途覚醒では一貫性なし
主観的改善（3研究統合）: RR（リスク比） = 1.66 (0.68-4.03) - 有意差なし、有意な異質性

主観的指標（睡眠の質、疼痛、「total efficiency rate」等）では効果があるように見えるが、客観的指標では効果が一貫しない。

プラセボ効果の影響が大きい可能性。

Cochraneレビューの評価：「エビデンス不十分」

コクラン共同計画は、世界で最も厳格なエビデンス評価機関だ。

複数のTCM/CAMレビューで、以下のように結論している：

Shengmai（生脈）のCochraneレビュー

14 RCT、858名
NYHA（ニューヨーク心臓協会分類）改善: RR 0.37 (0.26-0.51) - 有意な改善
しかし: バイアスリスクが高い（特に割り付けの隠蔽、盲検化）、サンプルサイズが小さい、有意な異質性
死亡率のエビデンスなし

結論: 「レビュー結果は、バイアスリスクが高いため慎重に解釈すべき」

癒着性腸閉塞に対するTCMのCochraneレビュー

5 RCT、664名
改善率: OR（オッズ比） 4.24 (2.83-6.36) TCM+従来治療 vs 従来治療のみ
しかし: 不十分な報告、方法論的質が低い、さまざまなバイアスの蔓延
有害事象の議論なし

結論: 「このシステマティックレビューは、TCMの客観的有効性と安全性を支持する十分なエビデンスを見出せなかった」

神経障害性疼痛に対する鍼治療のCochraneレビュー

6 RCT、462名（403名中国、59名UK）
疼痛強度: MD（平均差） -0.4 (-1.83 to 1.03) - 有意差なし
VAS（視覚的アナログスケール）平均: 5.8（鍼治療）vs 6.2（偽処置）- どちらも「軽度の疼痛」を達成せず

結論: 「神経障害性疼痛に対する鍼治療の使用を支持または否定する十分なエビデンスなし」「極めて質の低いエビデンス」

パーソナライズド医療でもRCTが必要

Nature Reviews Clinical Oncology 2017が明確に述べている：

「The apparent improvements in outcomes observed in an early single-arm trial of a new therapy might reflect the prognostic nature of the target, rather than a true treatment effect. Moreover, the predictive role of biomarkers cannot be definitively ascertained without randomly assigning patients to a control arm.」

つまり、単腕試験で観察された改善は、治療効果ではなく、ターゲットの予後的性質を反映している可能性がある。

バイオマーカー（生体指標）の予測的役割も、ランダム化なしでは確定できない。

精密がん医療のレビューも、複雑な腫瘍生物学を克服するには、複数の標的治療の組み合わせが必要だと述べているが、それでもRCTで効果サイズを測定している。

「個別化が必要だから」「多成分・多標的だから」という言い訳は、科学的に無効。