論文での統計手法や統計結果の書き方と留意点
卒業論文・修士論文・博士論文・投稿論文で、統計解析のMethodsやResultsをどのように書けばよいか迷っている方へ
論文で統計解析を扱うとき、多くの方が悩むのは「どの統計手法を使うか」だけではありません。 実際には、統計手法を選んだ後に、 Methodsに何を書けばよいのか、Resultsでp値や信頼区間をどう示せばよいのか、表や図をどこまで整えるべきか という問題が生じます。
統計解析の結果は、ソフトの出力をそのまま貼り付ければよいものではありません。 SPSS、R、EZR、Stata、JMPなどで得られた出力を、論文の文脈に合わせて整理し、 研究目的、対象者、変数、解析方法、効果量、信頼区間、p値、モデルの調整変数、研究上の限界が読者に伝わる形にする必要があります。 つまり論文における統計記載は、 「数値を並べる作業」ではなく、「研究の問いに対する根拠を文章・表・図で説明する作業」 です。
本記事では、 論文 統計手法 書き方、 統計結果 書き方、 統計解析 Methods 書き方、 論文 Results 統計、 p値 書き方、 信頼区間 書き方、 投稿論文 統計解析 などを調べている方に向けて、論文での統計手法や統計結果の書き方と留意点を具体的に整理します。 医学論文、看護研究、心理学、教育学、社会科学、経営学、アンケート調査、臨床研究、質的・量的混合研究のいずれでも参考になるよう、 Methods、Results、Discussion、表・図、査読対応の観点から解説します。
まず押さえたいのは、 論文では「どの統計ソフトを使ったか」よりも、「なぜその統計手法を選び、結果から何をどこまで言えるのか」を明確に書くこと です。p値だけを強調するのではなく、効果量、95%信頼区間、調整変数、サンプルサイズ、欠測値処理、解析対象者数を含めて説明することで、 統計結果の説得力が高まります。
論文における統計記載で最初に確認すべきこと
論文で統計手法や統計結果を書く前に、まず確認すべきなのは、研究目的、主要アウトカム、解析対象、変数の種類、解析手法の関係です。 統計解析の記載は、MethodsとResultsだけを整えればよいものではありません。 Introductionで提示した研究課題に対して、Methodsでどのように分析し、Resultsでどのような結果が得られ、 Discussionでどこまで解釈できるのかが一貫している必要があります。
たとえば、「介入前後でスコアが改善したか」を検討する研究であれば、対応のあるt検定やWilcoxon符号付順位検定が候補になります。 「疾患の有無に関連する因子」を検討する研究であれば、ロジスティック回帰分析が候補になります。 「死亡や再発までの期間」を扱う研究であれば、Kaplan-Meier曲線、Log-rank検定、Cox比例ハザードモデルなどが候補になります。 このように、 研究の問いと統計手法が対応しているか を確認することが、統計記載の出発点です。
研究目的と主要アウトカムを対応させる
主要アウトカムとは、研究で最も明らかにしたい結果指標のことです。 論文では、主要アウトカムが連続変数なのか、カテゴリ変数なのか、順序尺度なのか、時間データなのかによって、統計手法の書き方が変わります。 たとえば、HbA1c、血圧、尺度得点、テスト得点などは連続変数として扱われることが多く、 合併症の有無、再発の有無、合格・不合格などは二値変数として扱われます。
Methodsでは、主要アウトカムと副次アウトカムを区別したうえで、それぞれに使用した統計手法を明記します。 Resultsでは、主要アウトカムの結果を優先して示し、副次解析や探索的解析は位置づけを明確にすると、論文全体の構造がわかりやすくなります。
解析対象者数と除外基準を明確にする
統計結果を書くうえで、解析対象者数の記載は非常に重要です。 研究参加者が100名であっても、欠測値や除外基準により、実際の解析対象が85名になることがあります。 この場合、本文や表で「何名を対象に解析したのか」を明確にしなければ、結果の信頼性が伝わりにくくなります。
解析対象者数、除外理由、欠測値の扱い、完全ケース解析を行ったのか、多重代入を行ったのかなどは、MethodsとResultsの両方に関係します。 医学論文や臨床研究では、フローチャートで対象者の流れを示すこともあります。 アンケート調査でも、配布数、回収数、有効回答数、分析対象数を明記することが大切です。
Methodsでの統計手法の書き方
Methodsの統計解析欄では、使用した統計手法、データの表記方法、有意水準、使用ソフト、欠測値の扱い、多変量解析で調整した変数などを記載します。 ここで大切なのは、分析手法を羅列するだけでなく、どのデータにどの手法を用いたのかが読者にわかるように書くことです。
| 記載項目 | Methodsで書く内容の例 |
|---|---|
| 記述統計 | 連続変数は平均値±標準偏差または中央値[四分位範囲]、カテゴリ変数は人数と割合で示した。 |
| 群間比較 | 連続変数にはt検定またはMann-Whitney U検定、カテゴリ変数にはカイ二乗検定またはFisherの正確確率検定を用いた。 |
| 多変量解析 | 主要アウトカムに関連する因子を検討するため、ロジスティック回帰分析または線形回帰分析を行った。 |
| 調整変数 | 年齢、性別、重症度、既往歴など、臨床的・理論的に重要と判断した変数を調整した。 |
| 有意水準・ソフト | 両側検定でp<0.05を統計的に有意とし、解析にはSPSS version XXまたはR version X.X.Xを用いた。 |
Methodsでは、結果を先取りして書く必要はありません。 しかし、どのような基準で統計手法を選び、どのような手順で解析したのかを、第三者が理解できる程度に説明する必要があります。 特に投稿論文では、 解析方法の透明性が結果の信頼性に直結する ため、曖昧な表現は避けるべきです。
Resultsでの統計結果の書き方
Resultsでは、統計結果を客観的に示します。 Discussionのように意味づけを広げるのではなく、得られた結果を過不足なく書くことが重要です。 「有意差があった」「有意差がなかった」だけでは不十分であり、平均値、割合、差、オッズ比、回帰係数、ハザード比、95%信頼区間、p値などを組み合わせて示します。
p値だけでなく効果量と信頼区間を書く
p値は統計的有意性を判断するための指標ですが、効果の大きさを直接示すものではありません。 そのため、Resultsではp値だけでなく、平均差、標準化平均差、相関係数、回帰係数、オッズ比、ハザード比、95%信頼区間などを併記することが望ましいです。
たとえば、ロジスティック回帰分析でオッズ比が2.10、95%信頼区間が1.20から3.68、p=0.009であれば、 その要因がアウトカムと正の関連を示していることが読み取りやすくなります。 一方、p値だけを示すと、どの程度の関連なのか、推定の不確実性がどの程度なのかが伝わりません。
有意差がない結果も丁寧に示す
論文では、有意差がない結果も重要です。 「有意差は認められなかった」と書くだけではなく、実際の数値、信頼区間、サンプルサイズ、推定の方向を示すことで、 読者は結果の意味を判断しやすくなります。
たとえば、p=0.08であっても、効果量が大きく、信頼区間が広い場合には、症例数不足や検出力不足の可能性があります。 逆に、効果量が小さく信頼区間も臨床的に重要な範囲を含まない場合には、差が小さい可能性があります。 このように、有意差の有無だけでなく、 効果の大きさと不確実性を含めて結果を示す ことが重要です。
統計手法別の書き方例
統計手法ごとに、論文で書くべき情報は異なります。 t検定であれば平均値と標準偏差、平均差、p値などが中心になります。 カイ二乗検定であれば人数と割合、p値が中心になります。 回帰分析であれば回帰係数、標準誤差、95%信頼区間、p値、調整変数が重要になります。
| 統計手法 | Resultsで示したい主な情報 |
|---|---|
| t検定 | 各群の平均値±標準偏差、平均差、95%信頼区間、p値 |
| Mann-Whitney U検定 | 各群の中央値[四分位範囲]、p値 |
| カイ二乗検定 | 人数、割合、p値 |
| 相関分析 | 相関係数、95%信頼区間、p値、散布図 |
| 線形回帰分析 | 回帰係数、標準誤差、95%信頼区間、p値、決定係数、調整変数 |
| ロジスティック回帰分析 | オッズ比、95%信頼区間、p値、調整変数、イベント数 |
| Cox回帰分析 | ハザード比、95%信頼区間、p値、追跡期間、打ち切り、調整変数 |
重要なのは、表や本文にどの情報を載せるかを研究目的に合わせて選ぶことです。 すべての出力を載せる必要はありませんが、読者が結果を判断するために必要な情報は省略しないようにします。
t検定・分散分析・カイ二乗検定の記載例
t検定や分散分析、カイ二乗検定は、論文で頻繁に使用される基本的な統計手法です。 しかし、基本的な手法であっても、書き方が不十分だと結果の意味が伝わりにくくなります。
t検定では、単に「有意差があった」と書くのではなく、各群の平均値と標準偏差、平均差、p値を示します。 例として、「介入群の平均得点は82.4±10.2点、対照群は75.1±11.8点であり、介入群で有意に高かった(p=0.018)」のように書くと、 読者は差の方向と大きさを理解しやすくなります。
分散分析では、3群以上の平均値を比較するため、群間差の有無だけでなく、必要に応じて多重比較の結果を示します。 「一元配置分散分析の結果、群間に有意差が認められた(p=0.004)。多重比較の結果、A群はC群より有意に高かった」のように、 全体検定と事後比較を分けて書くことが大切です。
カイ二乗検定では、人数と割合を示したうえでp値を記載します。 たとえば、「合併症発生率はA群で12.0%、B群で25.0%であり、B群で有意に高かった(p=0.032)」のように書きます。 症例数が少ない場合はFisherの正確確率検定を用いたことも明記します。
相関分析・回帰分析の記載例
相関分析では、相関係数の値と方向を示すことが重要です。 「相関があった」と書くだけでは不十分であり、正の相関なのか負の相関なのか、相関の強さはどの程度なのかを示します。 例として、「年齢と反応時間の間には有意な正の相関が認められた(r=0.42, p=0.003)」のように記載します。
回帰分析では、目的変数と説明変数の関係を示します。 線形回帰分析の場合、回帰係数、95%信頼区間、p値を示すことで、説明変数が目的変数にどの程度関連しているかを表現できます。 多変量回帰分析では、どの変数で調整したのかも重要です。
例として、「年齢、性別、ベースライン値で調整した線形回帰分析の結果、介入群は対照群と比較して得点が5.8点高かった (β=5.8, 95%CI: 1.9?9.7, p=0.004)」のように記載します。 このように書くと、比較群、調整変数、効果の大きさ、不確実性、統計的有意性が一文で伝わります。
ロジスティック回帰・Cox回帰の記載例
ロジスティック回帰分析は、アウトカムが二値変数の場合に使用されます。 結果はオッズ比として示されることが多く、95%信頼区間とp値を併記します。 例として、「年齢、性別、重症度で調整したロジスティック回帰分析の結果、介入群では合併症発生のオッズが低かった (adjusted OR=0.48, 95%CI: 0.25?0.91, p=0.025)」のように記載できます。
ここで重要なのは、単にオッズ比を示すだけでなく、何で調整したのかを明記することです。 未調整オッズ比と調整オッズ比の両方を示す場合は、表で整理すると読みやすくなります。 また、イベント数に対して説明変数が多すぎるとモデルが不安定になるため、変数選択の根拠もMethodsで説明しておくことが望ましいです。
Cox回帰分析は、死亡、再発、退院、治療中止など、イベント発生までの時間を扱う場合に使用されます。 結果はハザード比として示されます。 「Cox比例ハザードモデルの結果、治療群では再発リスクが有意に低かった (adjusted HR=0.62, 95%CI: 0.41?0.94, p=0.024)」のように、ハザード比、信頼区間、p値、調整変数を示します。
表・図で統計結果を示すときの留意点
論文では、統計結果を本文だけで説明するのではなく、表や図に整理することが多くあります。 表は数値を正確に示すのに向いており、図は傾向や差を視覚的に伝えるのに向いています。 どちらを使うかは、研究結果をどのように読者に理解してもらいたいかによって決めます。
患者背景や対象者属性はTable 1として示されることが多く、年齢、性別、主要な背景因子、群間比較のp値などを整理します。 回帰分析の結果は、オッズ比や回帰係数、95%信頼区間、p値を含む表として示すと読みやすくなります。 生存時間解析では、Kaplan-Meier曲線を図として示し、Log-rank検定やCox回帰の結果を本文または表で補足します。
表や図を作成するときは、 単位、丸め方、小数点桁数、略語の説明、欠測値、解析対象者数 を明確にします。 特に投稿論文では、雑誌ごとの投稿規定に合わせて表の形式を整える必要があります。
p値・95%信頼区間・効果量を書くときの注意
p値を書くときは、単に「p<0.05」と書くだけでなく、可能な範囲で具体的な値を示すことが望ましいです。 ただし、非常に小さいp値については「p<0.001」と表記することもあります。 雑誌や学会の規定がある場合は、その指示に従います。
95%信頼区間は、推定値の不確実性を示す重要な情報です。 オッズ比やハザード比の場合、95%信頼区間が1をまたぐかどうかが統計的有意性の判断に関係します。 平均差や回帰係数の場合は、信頼区間が0をまたぐかどうかが重要になります。
効果量は、差や関連の大きさを示します。 統計的に有意であっても、効果量が非常に小さければ実質的意義が乏しい場合があります。 一方で、有意差がなくても、効果量や信頼区間から今後の研究価値が示唆される場合があります。 論文では、 統計的有意性と実質的・臨床的意義を分けて書く ことが重要です。
統計ソフト名・バージョン・有意水準の書き方
統計解析欄では、使用した統計ソフト名とバージョンを記載します。 たとえば、「All statistical analyses were performed using IBM SPSS Statistics version XX」や 「Statistical analyses were conducted using R version X.X.X」のように書きます。 日本語論文では、「統計解析にはSPSS Statistics version XXを用いた」のような記載になります。
有意水準については、「両側検定でp<0.05を統計的に有意とした」と書くことが一般的です。 ただし、多重比較補正を行った場合や、片側検定を用いた場合、ベイズ統計を用いた場合などは、その基準を明確に書く必要があります。
また、EZR、Stata、JMP、GraphPad Prism、jamovi、JASPなどを使用した場合も、ソフト名とバージョンを記録しておくことが大切です。 解析後に論文を書き始めると、使用バージョンを忘れてしまうことがあるため、解析時点で記録しておくと安心です。
査読で指摘されやすい統計記載の問題
投稿論文では、統計記載が不十分だと査読で修正を求められることがあります。 よくある指摘としては、使用した検定名が不明確、正規性の確認が書かれていない、欠測値の扱いが不明、 多変量解析の調整変数が説明されていない、サンプルサイズの根拠が弱い、効果量や信頼区間が示されていない、などがあります。
- Methodsに統計手法名だけが並び、どの変数に使ったのか不明確である
- Resultsでp値だけを示し、効果量や95%信頼区間がない
- 解析対象者数が表・本文・フローチャートで一致していない
- 欠測値処理、外れ値処理、除外基準が記載されていない
- 多変量解析で調整した変数の選定理由が説明されていない
- 多重比較や探索的解析の位置づけが不明確である
- 使用ソフト名・バージョン・有意水準が記載されていない
査読対応では、単に指摘箇所を修正するだけでなく、Methods、Results、Tables、Figures、Discussionの整合性を確認する必要があります。 ある箇所だけを直すと、別の箇所との数値不一致が生じることがあるため注意が必要です。
スタットエージェントで対応できる統計記載支援
スタットエージェントでは、大学・大学院・医療機関・研究機関・企業・自治体の研究データに対して、 統計解析、解析方針の整理、SPSS・R・EZR・Stata等による分析、表・図の作成、Methods・Resultsの記述支援、 投稿論文や査読対応に向けた統計記載の整理を行っております。
特に、統計ソフトの出力結果を論文に使える形へ整える作業では、 p値だけでなく、効果量、95%信頼区間、調整変数、解析対象者数、欠測値処理、研究デザインとの整合性 を確認しながら、読み手に伝わる表現へ整えることを重視しています。
「SPSSの出力結果をどのように論文へ書けばよいかわからない」 「Rで得られた結果をMethodsとResultsに落とし込みたい」 「査読で統計解析の追記を求められた」 「表と本文の数値を整合させたい」 といった場合でも、研究内容に応じて具体的にサポートいたします。
よくある質問
Q1. 論文ではp値だけを書けばよいですか?
p値だけでは不十分な場合が多いです。 p値は統計的有意性を示す指標ですが、効果の大きさや推定の不確実性は示しません。 平均差、オッズ比、回帰係数、ハザード比、95%信頼区間、効果量などを併記することで、結果の解釈がしやすくなります。
Q2. Methodsにはどこまで詳しく統計手法を書くべきですか?
読者や査読者が、どのデータにどの統計手法を使ったのか理解できる程度に書く必要があります。 使用した検定、データの表記方法、有意水準、使用ソフト、欠測値の扱い、多変量解析の調整変数などは、必要に応じて明記します。
Q3. 有意差が出なかった結果は書かなくてもよいですか?
主要アウトカムや研究目的に関係する結果であれば、有意差がなくても書くべきです。 有意差がない結果も、効果量や信頼区間とともに示すことで、研究の解釈に役立ちます。 不都合な結果を省略すると、研究の透明性が損なわれる可能性があります。
Q4. 統計ソフトの出力表をそのまま論文に貼ってもよいですか?
通常は、そのまま貼るのではなく、論文の形式に合わせて整理します。 ソフトの出力表には不要な情報が多く含まれることがあり、読者にとって読みづらい場合があります。 論文では、研究目的に必要な数値を選び、見出し、単位、脚注、略語説明を整えることが重要です。
Q5. 査読で統計解析の書き方を指摘された場合、どう対応すべきですか?
まず、指摘がMethodsの説明不足なのか、Resultsの数値不足なのか、解析手法そのものの問題なのかを切り分けます。 必要に応じて追加解析、表の修正、本文の追記、限界の説明を行います。 修正後は、本文、表、図、回答書の数値が一致しているかを確認することが大切です。
まとめ|論文の統計記載は「手法名」ではなく「結果を説明する根拠」である
論文での統計手法や統計結果の書き方では、検定名やp値を並べるだけでは不十分です。 研究目的、主要アウトカム、解析対象者数、データの種類、統計手法、効果量、95%信頼区間、調整変数、欠測値処理、 使用ソフト、有意水準を一貫して示すことで、論文の説得力が高まります。
特に投稿論文や査読対応では、 「どの解析を行ったか」だけでなく、「なぜその解析が妥当で、結果から何をどこまで言えるのか」 が問われます。 統計結果は、研究の主張を支える根拠であると同時に、研究の限界を誠実に示す材料でもあります。
スタットエージェントでは、統計解析そのものだけでなく、論文における統計手法の書き方、Resultsの整理、 表・図の作成、査読コメントへの対応、Methods・Results・Discussionの整合性確認までサポートしております。 統計結果を論文にどう書けばよいかわからない、 査読で統計記載の修正を求められた、 投稿論文として説得力のある表・図に整えたい といった場合には、お気軽にご相談ください。

