統計解析とその結果の書き方―記述統計編
卒業論文・修士論文・投稿論文・研究報告書で、平均値・標準偏差・中央値・割合をどのように書けばよいか迷っている方へ
統計解析というと、t検定、分散分析、相関分析、回帰分析、ロジスティック回帰などの検定やモデルに注目しがちです。 しかし、論文や研究報告書で最初に読者が確認するのは、多くの場合、 対象者やデータの特徴を示す記述統計 です。平均値、標準偏差、中央値、四分位範囲、人数、割合、最小値、最大値などを正しく示せていなければ、 その後の検定結果や考察の説得力も弱くなります。
記述統計は、単なる集計結果ではありません。 研究対象がどのような集団なのか、データに偏りがあるのか、群間で背景に差があるのか、分析に進んでよい状態なのかを確認するための基礎情報です。 特に卒業論文、修士論文、博士論文、投稿論文、医学論文、看護研究、心理学研究、教育学研究、社会調査、アンケート分析では、 記述統計をどのように表にし、どのように本文で説明するか が非常に重要です。
本記事では、 記述統計 書き方、 統計解析 結果 書き方、 平均値 標準偏差 書き方、 中央値 四分位範囲 書き方、 論文 記述統計、 卒論 記述統計、 SPSS 記述統計、 R 記述統計 などを調べている方に向けて、記述統計の基本と、論文での結果の書き方を具体的に整理します。
まず押さえたいのは、 記述統計は「分析前の単純なまとめ」ではなく、研究結果を読むための土台 だということです。平均値だけ、p値だけ、グラフだけでは不十分です。 データの種類に応じて、平均値と標準偏差、中央値と四分位範囲、人数と割合などを適切に使い分ける必要があります。
記述統計とは何か
記述統計とは、収集したデータの特徴を整理し、わかりやすく要約するための統計です。 代表的な指標として、平均値、標準偏差、中央値、四分位範囲、最小値、最大値、人数、割合、度数分布などがあります。 たとえば、対象者の年齢、性別、学年、職業、疾患の有無、尺度得点、テスト得点、満足度などを整理するときに使います。
記述統計は、研究の出発点です。 どのような対象者から得られたデータなのか、変数の分布はどうなっているのか、外れ値や欠測値はないか、 群間比較の前に背景が偏っていないかを確認する役割を持ちます。 したがって、記述統計を丁寧に示すことは、 その後の統計解析結果を読者が正しく理解するための前提 になります。
推測統計との違い
推測統計は、標本データから母集団について推測するための統計です。 t検定、分散分析、カイ二乗検定、相関分析、回帰分析などは推測統計に含まれます。 一方、記述統計は、手元のデータそのものを整理して示すものです。
たとえば、「対象者100名の平均年齢は21.4歳であった」と示すのは記述統計です。 「A群とB群の平均年齢に統計的な差があるか」を検討するのは推測統計です。 論文では、記述統計と推測統計を混同せず、役割を分けて記載することが重要です。
論文で記述統計が重視される理由
論文では、読者が最初に対象者の特徴やデータの状態を確認します。 特に医学論文や看護研究では、Table 1として対象者背景を示すことが多く、年齢、性別、疾患背景、介入群・対照群の構成などが整理されます。 社会科学や教育学、心理学でも、対象者の属性、尺度得点の平均値、標準偏差、回答傾向などを示すことが一般的です。
記述統計が不十分だと、読者は「どのようなデータからこの結論が出たのか」を判断できません。 そのため、記述統計は論文全体の透明性を高める重要な要素です。
記述統計で最初に確認するデータの種類
記述統計を書く前に、まず変数の種類を確認します。 連続変数、カテゴリ変数、順序尺度、二値変数では、適切な記述方法が異なります。 たとえば、年齢や身長、体重、テスト得点のような連続変数では平均値や標準偏差を用いることがあります。 性別、所属、疾患の有無、回答カテゴリのようなカテゴリ変数では、人数と割合を示します。
| 変数の種類 | 記述統計でよく使う表記 |
|---|---|
| 連続変数 | 平均値±標準偏差、中央値[四分位範囲]、最小値、最大値 |
| カテゴリ変数 | 人数、割合、度数分布 |
| 順序尺度 | 中央値、四分位範囲、各選択肢の人数と割合 |
| 二値変数 | あり・なし、該当・非該当、成功・不成功などの人数と割合 |
ここで重要なのは、すべての変数を平均値で示せばよいわけではないという点です。 名義尺度や順序尺度のデータを機械的に平均値で示すと、結果の意味がわかりにくくなることがあります。 研究目的、尺度水準、先行研究の表記、投稿先の規定を確認したうえで、適切な記述方法を選びます。
平均値・標準偏差の書き方
平均値は、データの中心的な傾向を示す代表的な指標です。 標準偏差は、データが平均値の周りにどの程度ばらついているかを示します。 論文では、連続変数について「平均値±標準偏差」の形式で記載することが多くあります。
平均値±標準偏差を使う場面
平均値±標準偏差は、データが極端に歪んでいない場合や、連続変数として解釈しやすい場合に使いやすい表記です。 たとえば、年齢、身長、体重、テスト得点、尺度得点、血圧などで用いられることがあります。 本文では、「対象者の平均年齢は21.4±2.3歳であった」のように記載します。
群別に示す場合は、「介入群の平均得点は82.4±10.2点、対照群は75.1±11.8点であった」のように書くと、 群ごとの水準とばらつきがわかります。 表では、列見出しに「平均値±標準偏差」または「Mean±SD」と明記します。
平均値だけを書いてはいけない理由
平均値だけでは、データのばらつきがわかりません。 たとえば、平均点が70点であっても、全員が70点前後なのか、30点の人と100点の人が混在しているのかでは、結果の意味が異なります。 標準偏差や範囲を併記することで、データの散らばりを読者に伝えることができます。
論文では、平均値を示すときには、基本的に標準偏差、標準誤差、信頼区間などのばらつきや推定の不確実性を示す指標を併記します。 卒論・修論では、まず平均値と標準偏差をセットで示すことを意識するとよいでしょう。
中央値・四分位範囲の書き方
中央値は、データを小さい順に並べたときに中央に位置する値です。 四分位範囲は、第1四分位数から第3四分位数までの範囲を示し、データの中央50%のばらつきを表します。 分布が歪んでいるデータや外れ値の影響を受けやすいデータでは、平均値よりも中央値と四分位範囲を示したほうが適切な場合があります。
たとえば、在院日数、収入、利用回数、反応時間、医療費、アクセス数などは、右に歪んだ分布になりやすい変数です。 このような場合、「在院日数の中央値は7日[四分位範囲:4?12日]であった」のように記載します。
表記方法には、「中央値[四分位範囲]」「median [IQR]」「中央値(第1四分位数?第3四分位数)」などがあります。 どの表記を用いる場合でも、表の脚注やMethodsで意味を明確にしておくことが大切です。
人数・割合・パーセントの書き方
性別、学年、所属、疾患の有無、喫煙の有無、回答カテゴリなどのカテゴリ変数は、人数と割合で示します。 たとえば、「男性は45名(45.0%)、女性は55名(55.0%)であった」のように記載します。
割合を書くときには、分母が何であるかを明確にすることが重要です。 全対象者100名に対する割合なのか、有効回答者95名に対する割合なのか、特定の群50名に対する割合なのかによって、数字の意味が変わります。 表では、列見出しや脚注に「n(%)」と記載し、必要に応じて分母を示します。
パーセントの小数点以下の桁数は、論文全体で統一します。 たとえば、45.0%、12.5%、3.2%のように小数第1位までそろえると読みやすくなります。 ただし、対象者数が少ない場合は、割合だけでなく人数を必ず示します。
最小値・最大値・範囲の示し方
最小値と最大値は、データの範囲を示すために使われます。 たとえば、対象者の年齢について「18?24歳」と示すことで、対象者の年齢幅がわかります。 ただし、最小値・最大値だけではデータの中心やばらつきはわからないため、平均値や中央値と併記することが多いです。
例として、「対象者の年齢は平均21.4±2.3歳であり、範囲は18?29歳であった」のように書くと、 中心傾向、ばらつき、範囲が同時に伝わります。 外れ値が含まれる場合には、最小値・最大値だけでなく、箱ひげ図や四分位範囲を用いて分布を示すこともあります。
卒論・修論では、すべての変数に最小値・最大値を示す必要はありません。 研究目的に照らして、分布や範囲が重要な変数に絞って示すと、表が見やすくなります。
アンケート調査における記述統計の書き方
アンケート調査では、回答者属性、各質問項目の回答分布、尺度得点の平均値・標準偏差、信頼性係数などを示すことがあります。 たとえば、5件法の項目では、各選択肢の人数と割合を示す方法と、複数項目を合成した尺度得点として平均値と標準偏差を示す方法があります。
単一項目の5件法回答を平均値だけで示すと、回答分布の偏りが見えにくくなる場合があります。 一方、複数項目で構成された尺度の場合は、逆転項目の処理や信頼性確認を行ったうえで、合計得点または平均得点として扱うことがあります。
アンケート調査の記述統計では、 回答者数、有効回答数、欠測値、各選択肢の割合、尺度得点の算出方法 を明確にすると、読者にとって理解しやすい結果になります。
医学論文・看護研究でのTable 1の作り方
医学論文や看護研究では、対象者背景をTable 1として示すことがよくあります。 Table 1には、年齢、性別、BMI、疾患背景、既往歴、介入群・対照群、重症度、ベースライン値などを整理します。 この表は、研究対象の特徴を読者に伝えるだけでなく、群間比較の前提を確認する役割も持ちます。
| 項目 | Table 1での表記例 |
|---|---|
| 年齢 | 平均値±標準偏差、または中央値[四分位範囲] |
| 性別 | 男性 n(%)、女性 n(%) |
| 疾患・既往歴 | あり n(%)、なし n(%) |
| 検査値 | 分布に応じて平均値±標準偏差または中央値[四分位範囲] |
| 群間比較 | 必要に応じてp値を示す。ただし、表の目的に応じて扱いを検討する。 |
Table 1では、変数ごとに適切な記述方法を選び、単位や略語を脚注で説明します。 また、群間比較のp値を入れる場合は、どの検定を用いたのかMethodsで説明しておく必要があります。
SPSS・R・Excelの出力を論文用に整える方法
SPSS、R、Excelなどで記述統計を出力すると、多くの数値が表示されます。 しかし、ソフトの出力表をそのまま論文に貼り付けるのは避けたほうがよい場合が多いです。 出力表には、論文には不要な列や、読者にとってわかりにくい表記が含まれていることがあります。
論文用の表に整える際には、研究目的に必要な指標だけを選びます。 たとえば、年齢であれば平均値±標準偏差、性別であれば人数と割合、歪みのある検査値であれば中央値[四分位範囲]を示します。 小数点の桁数、単位、変数名、脚注、群名を統一すると、読みやすい表になります。
Rを用いる場合は、コードを残すことで再現性を確保しやすくなります。 SPSSを用いる場合も、出力結果とともにSyntaxや操作手順を保存しておくと、修正や再分析が必要になったときに役立ちます。 Excelでは入力ミスや式の範囲指定ミスに注意し、元データと集計表を分けて管理することが重要です。
記述統計の本文記載例
記述統計は、表だけでなく本文でも要点を説明します。 ただし、表にある数値をすべて本文で繰り返す必要はありません。 本文では、研究目的に関係する主要な特徴や、結果理解に必要なポイントを中心に書きます。
- 対象者100名の平均年齢は21.4±2.3歳であり、女性が55名(55.0%)であった。
- 尺度Aの平均得点は3.82±0.64、尺度Bの平均得点は3.41±0.72であった。
- 在院日数の中央値は7日[四分位範囲:4?12日]であった。
- 有効回答数は312件であり、有効回答率は78.0%であった。
- 介入群と対照群のベースライン特性はTable 1に示した。
本文での記述は、簡潔であることが大切です。 表を見ればわかる細かな数値をすべて文章化するのではなく、読者が結果を理解するための導入として記述統計を示します。
記述統計でよくあるNG表現
記述統計でよくある失敗は、平均値だけを書く、割合だけを書く、分母を示さない、単位を省略する、データの種類に合わない指標を使う、といったものです。 これらは一見小さな問題に見えますが、論文全体の読みやすさと信頼性に影響します。
- 平均値だけを書き、標準偏差や範囲を示していない
- 割合だけを書き、人数を示していない
- 分母が全体なのか有効回答者なのか不明である
- 名義尺度の変数を無理に平均値で示している
- 中央値を示しているのに四分位範囲がない
- 小数点の桁数が表の中で統一されていない
- 単位や略語の説明がない
- 表と本文の数値が一致していない
記述統計は基本的な部分だからこそ、粗さが目立ちやすい箇所です。 卒論・修論・投稿論文では、表と本文の整合性、数値の丸め方、単位、欠測値、分母を丁寧に確認することが重要です。
スタットエージェントで対応できる記述統計支援
スタットエージェントでは、卒業論文、修士論文、博士論文、投稿論文、医学論文、看護研究、心理学研究、教育学研究、 社会調査、企業調査、自治体調査などに向けて、記述統計、アンケート集計、クロス集計、グラフ作成、表作成、 SPSS・R・Excel出力の整理を支援しております。
特に、記述統計の支援では、 平均値・標準偏差・中央値・四分位範囲・人数・割合・欠測値・分母・小数点桁数 を確認し、論文や報告書にそのまま使いやすい形へ整えることを重視しています。
「SPSSの出力表を論文用に整えたい」「アンケート結果を見やすい表にしたい」 「平均値と中央値のどちらを使うべきかわからない」「Table 1を作成したい」 「記述統計から本文の結果記述まで整えたい」といった場合でも、研究目的とデータ内容に応じて具体的にご相談いただけます。
よくある質問
Q1. 記述統計では平均値だけを書けばよいですか?
平均値だけではデータのばらつきがわからないため、通常は標準偏差を併記します。 分布が歪んでいる場合は、平均値ではなく中央値と四分位範囲を示したほうが適切なこともあります。
Q2. 割合を書くときに人数も必要ですか?
必要です。割合だけでは分母がわからず、結果の意味が判断しにくくなります。 論文では「45名(45.0%)」のように、人数と割合をセットで示すことが一般的です。
Q3. 5件法アンケートは平均値で示してよいですか?
研究目的や尺度の扱いによります。 単一項目では各選択肢の人数と割合を示したほうがわかりやすい場合があります。 複数項目で構成された尺度得点として扱う場合は、平均値と標準偏差を示すこともあります。
Q4. SPSSやExcelの表をそのまま論文に貼ってよいですか?
そのまま貼るよりも、論文用に整えることが望ましいです。 不要な列を削除し、変数名、単位、人数、割合、小数点桁数、脚注を整えることで、読者に伝わりやすい表になります。
Q5. 記述統計にもp値は必要ですか?
記述統計そのものはデータを要約するためのものなので、必ずp値が必要とは限りません。 群間比較を行う場合には、必要に応じてp値を示します。 ただし、表の目的が対象者背景の記述なのか、群間差の検定なのかを明確にすることが大切です。
まとめ|記述統計は統計解析結果を読むための土台である
統計解析とその結果の書き方において、記述統計は最も基本的でありながら、非常に重要な部分です。 平均値、標準偏差、中央値、四分位範囲、人数、割合、最小値、最大値を適切に使い分けることで、 研究対象やデータの特徴を読者に正確に伝えることができます。
記述統計では、 データの種類に合った指標を選び、分母、単位、欠測値、小数点桁数、表と本文の整合性を確認すること が大切です。 そのうえで、必要に応じて推測統計へ進むことで、論文や研究報告書全体の説得力が高まります。
スタットエージェントでは、記述統計、アンケート集計、SPSS・R・Excel出力整理、Table 1作成、グラフ化、 Methods・Resultsの記述支援まで対応しております。 記述統計の表を整えたい、 平均値と中央値の使い分けがわからない、 卒論・修論・投稿論文に使える結果記述にしたい といった場合には、お気軽にご相談ください。

