ウェルネスフード・ワールド第127回｜SRとメタアナリシスは何が違うのか――定性的SRで機能性表示することは科学的に妥当か

こんにちは、GNG武田です。

機能性表示食品（FFC）では、科学的根拠の提示方法の一つとしてシステマティックレビュー（SR）が位置づけられています。また、2025年4月1日以降に行われる届出から、SR作成にあたってPRISMA2020に準拠することが必須になっています。

一方で、「SR＝定性的レビュー」「メタアナリシス（MA）＝定量的SR」という整理は理解の助けになる反面、そこから「効果推定はMAでしかできないのでは」「定性的SRで機能性を評価するのは不適切では」といった疑問が生まれやすい構造になっています。

今号では、まずSRとMAの違いを基礎から整理し、そのうえで「定性的SRで機能性表示することの科学的妥当性」を、何ができて何ができないのかという観点で整理します。

1. SRは何をする方法か（“集め方・評価の仕方”のルール）
システマティックレビュー（SR）は、ある問い（リサーチクエスチョン）に対して、既存研究を「体系的なルール」に従って集め、選び、評価し、全体としての結論をまとめる方法です。
SRの特徴は、結論以前に「手順」を定める点にあります。一般に、次の要素を明確にします。

• どんな対象者・介入・比較・評価項目を扱うのか（PICO/PECOの考え方）
• どのデータベースを、どの検索式で検索するのか
• どんな研究を採用し、どんな研究を除外するのか（選択基準・除外基準）
• 採用研究のバイアスリスクをどう評価するか
• 研究結果をどう統合して結論を書くか（文章による整理か、統計統合か）

FFCの手引書でも、PICO/PECOに見合った基準設定や、食品の性状・摂取量・対象者、機能性関与成分の同等性などを踏まえて選択・除外基準を設定する重要性が示されています。
また、SRの報告の質を担保する枠組みとしてPRISMA2020が参照され、FFCでも準拠が求められる運用になっています。

2. MAは何をする方法か（“結果のまとめ方”の一手段）
メタアナリシス（MA）は、SRの中で行われることがある「統計的統合」の手法です。複数研究の結果を同じ尺度（効果量）にそろえ、全体としての効果を数値として推定します。通常は、効果量と信頼区間、研究間のばらつき（異質性）などを提示します。
ここで重要なのは、関係が次のようになっている点です。
• SRは“枠組み（方法論）”です
• MAは“統合の手法（SRの中の一工程になり得る）”です
したがって、SRはMAを「含む場合」と「含まない場合」があります。SRがMAを必ず伴うわけではありません。

3. 「効果推定」はMAしかできないのか
統計学において「推定（estimation）」とは、通常、点推定値や区間推定値を算出する行為を指します。
その意味での「効果の推定」は、複数研究を統計的に統合するメタアナリシス（MA）が担う領域です。
一方、メタアナリシスを行わないSRでも、
・効果が示された研究が存在するかどうか
・結果の方向性が概ね一致しているかどうか
を評価することは可能です。
したがって、より厳密に整理すれば、
定性的SRは「効果の有無や方向性を評価する方法」、
MAは「効果の大きさを定量化する方法」と位置づけられます。
つまり、「複数研究を統合した効果量（推定値）を出す」という意味での効果推定は、MAが中心になります。一方で、「複数研究を総覧して、全体として支持されるかどうか」を整理することは、MAなしでも行えます。

ここで混乱が起きやすいのは、「MAができない＝科学的評価ができない」という連想です。しかし、科学的評価は本来、効果量の統合推定だけで完結しません。採用研究の質、バイアス、結果の一貫性、アウトカムの妥当性などを含めて評価する必要があります。
この点は海外の評価でも共通で、たとえば米国ではFDAが健康関連表示の科学的評価において「利用可能な科学的証拠の全体性（totality of publicly available scientific evidence）」を考慮する枠組みを示しており、FTCも広告の裏付けとして「信頼できる科学的根拠（competent and reliable scientific evidence）」を求めています。(Guidance for Industry: Substantiation for Dietary Supplement Claims Made Under Section 403(r) (6) of the Federal Food, Drug, and Cosmetic Act)

4. FFCが「定性的SR」で機能性表示することは科学的に妥当か
結論を先に言うと、「方法論としては妥当になり得るが、その妥当性は採用研究の質評価と統合プロセスの透明性に依存する」という整理になります。
ここでいう「妥当性」は、制度上認められているかどうかではなく、科学的方法として、どの程度の主張を、どの程度の根拠で支えられるかという意味です。

4-1. 定性的SRで「支えやすい」主張
定性的SRが比較的支えやすいのは、次のような場合です。
• 主要アウトカムが明確で、研究間で概ね共通している
• 結果の方向性が概ね一貫している
• 研究の質（バイアスリスク）が許容できる範囲にある
• 効果が“統計的に有意かどうか”だけでなく、評価指標として意味のあるアウトカムである
このように、MAで統合推定を行わなくても、「全体として支持されるかどうか」を、透明性のある手順で示すことは可能です。

4-2. 定性的SRの限界が表面化しやすい領域
一方で、定性的SRの限界が出やすいのは、次のような場合です。
• 研究間のアウトカムが揃っていない（統合以前に比較が難しい）
• 効果が小さく、研究ごとの揺れが大きい（方向性が揃わない）
• 研究の質にばらつきがあり、どれを重く見るべきかが難しい
• サブグループや条件次第で結果が反転する可能性がある
• 「どれくらい変化するか」を示さないと、表示文言の強さとの整合が取りにくい
さらに、健康関連研究では、研究報告における解釈の強調や選択的提示（いわゆるspin）が議論されることがあります。
日本の機能性食品分野においても、その傾向を指摘する研究が報告されています（Journal of Clinical Epidemiology 169 (2024) 111302）。このような背景を考えると、MAを行わない場合ほど、採用研究の質評価とアウトカムの扱い（何を主要アウトカムとみなすか）が重要になります。

4-3. 「妥当性」を保つために鍵になる論点
定性的SRで機能性表示を行う場合、科学的妥当性を保つ鍵は、次の2点に集約されます。

1. “何を示したいのか”に対して、採用した研究が同じ問いに答えていること
　FFCの手引書でも、食品の性状・摂取量・対象者、機能性関与成分の同等性などを踏まえた選択基準設定の重要性が示されています。
2. “どの程度の主張をしているか”と“示せる根拠の粒度”が釣り合っていること
　MAがない場合、統合効果量や信頼区間を提示しにくくなります。そのとき、表示文言が「効果の大きさ」を暗に含んでしまう設計だと、根拠との整合が取りにくくなります。
この問題は「制度」以前に、「科学的主張の強さ」と「示せる証拠の形」の整合性の問題です。

5. まとめ

SRは、既存研究を体系的に集め、評価し、統合する枠組みです。MAは、そのSRの中で行われることがある統計的統合手法です。「統合した効果量の推定」という意味ではMAが中心になりますが、「全体として支持されるかどうか」を透明性のある手順で示すことは、定性的SRでも可能です。
一方で、定性的SRで機能性表示を行う場合ほど、採用研究が同じ問いに答えているか、研究の質評価が妥当か、表示文言の強さが根拠の粒度と釣り合っているか、といった点が妥当性の鍵になります。

＜GNG研究会について＞

GNG研究会では、過去十数年にわたるニューズレターのバックナンバーを会員ページにてすべて公開しています。

そして、例えば「免疫」、「プロテイン」、「乳酸菌」、「腸内細菌叢」など特定のキーワードで過去の記事を見出し検索できるので、トレンド把握に役立ちます。
GNGでは、国内および「海外のいま」をお届けできるよう全力で取り組んでおります。

グローバルニュートリション研究会

皆様のウェルネスフードビジネスに少しでもお役に立てましたら幸いです。

━━━━━━━━━━━━━━━━━

無料メルマガに登録いただけると、更新をメールでお知らせします。

無料メルマガ「ウェルネスフード・ワールド」のご登録はこちら

┗━━━━━━━━━━━━━━━┛

免疫サポート市場は、いかにして成立したのか― 医薬品と食品の役割分担を考える｜ウェルネスフード・ワールド第126回

ウェルネスフード・ワールド第128回｜「エビデンスの強さ」とは何か

ウェルネスフード・ワールド第127回｜SRとメタアナリシスは何が違うのか――定性的SRで機能性表示することは科学的に妥当か

＜GNG研究会について＞

最近の記事

ウェルネスフード・ワールド第129回｜機能性食品は「症状」から「生活シーン」へと語られる時代へ

ウェルネスフード・ワールド第128回｜「エビデンスの強さ」とは何か