ごあいさつ

論文抄読のまとめ 2024〜 (歯科関連の方へ)

2024-03-26 22:40:00

統計用語 まとめ

二項検定 (binomial test

対応なし 

説明変数は1つのみ 

従属変数は二分するカテゴリカルデータ 

ノンパラメトリック 

 

2つのカテゴリに分類されたデータの比率が、理論的に期待される分布から有意に偏っているかどうかを、二項分布を利用して調べる統計学的検定

 

例)サイコロは1/6 じゃんけんは1/3 商品ABに差がないとすれば1/2 などと理論値を用いて検定する

 

カイ2乗検定(Chi-squared test

対応なし 

説明変数:カテゴリカルデータ 

従属変数:カテゴリカルデータ

ノンパラメトリック

 

1つまたは複数のカテゴリにおいて、予想されたことと見られたことの間の差異を決定する統計的な方法

 

例)開発中のチョコレート菓子を試食してもらい、おいしいか否かの2択で回答

 

マクネマー検定(McNemar's test

対応あり 

説明変数:カテゴリカルデータ 

従属変数:カテゴリカルデータ

ノンパラメトリック

 

対応のある2分型の2つの処理の結果に差があるかどうかを検定

 

例)選挙前後の特定政党支持率の調査 投薬前後の被験者の状態評価

 

 

 

 

T検定(t-test

対応なし 

説明変数:カテゴリカルデータ 

従属変数:連続変数

     パラメトリック

 

2つのサンプルの平均値を比較する際に、統計的に意味のある差があるのかを判断する際に用いられる分析手法

 

例)学校の二つのクラスにおいて、和食だけを食べるクラスと洋食だけを食べるクラスに分けて、3ヶ月後の体重増減を比較する場合で、以下のような結果になったとする。

 

クラス平均

出席番号1

出席番号2

出席番号3

出席番号4

出席番号5

出席番号……

和食

-1.0kg

+0.5kg

-1kg

-2kg

2kg

±0kg

……

洋食

+1.0kg

+1kg

+1.5kg

+2kg

±0kg

-0.5kg

……

和食クラスの体重増減平均は-1.0kgで、洋食クラスの体重増減平均は+1.0kgで。和食は1.0kgの減量になって、洋食は1.0kgの増量になるという結果が、統計的に正しいのか、それとも誤差の範囲かを検定するために用いる

 

ロジスティック回帰分析(Logistic regression

説明変数:カテゴリカル・連続変数どちらでも

従属変数:カテゴリカル          の多変量解析

ノンパラメトリック 

 

多変量解析の一つで、ある特定の事象が起きる確率を分析するもの

 

例)癌や糖尿病など特定の病気の有無を目的変数にし、喫煙本数やアルコール摂取量、睡眠時間、コレステロール値などを説明変数にすれば、患者の検査結果から特定の病気を引き起こす要因の予測が可能

→仮に睡眠時間、コレステロール値と糖尿病発症有無の相関関係が見つかれば、発症前にある程度の予測ができるようになり、患者に対して予防やケアの指導が行える

 

 

2標本T検定(Two-sample t-test

対応なし 

説明変数:カテゴリカルデータ

 従属変数:連続変数 

パラメトリック

 

2つの独立した母集団から抽出した標本の平均に差があるかどうかの検定

 

例) 学校で行ったテストの点数が1組と2組とで差があるかどうかの検定

 

対応のあるT検定(Paired t-test

対応あり 

説明変数:カテゴリカルデータ 

従属変数:連続変数 

パラメトリック

 

2つの独立した母集団から抽出した標本の平均に差があるかどうかの検定

 

例) ある薬を投与する前後で血圧がどう変化したかの検定

 

ANOVAanalysis of variance

対応なし 

説明変数3群以上のカテゴリカルデータ 

従属変数:連続変数 

パラメトリック

 

異なるグループの平均値の違いを比較する手法

 

例)犬種、月齢、運動量と犬の体重との関連

 

 

 

 

 

 

 

単回帰分析(single linear regression

パラメトリック

 

1つの目的変数に対して説明変数が1つである回帰分析

 

例)九九の習熟度(従属変数)と学習時間(説明変数)の因果関係の検証

  両親の身長(説明変数)をもとにした子どもの身長(従属変数)の予測 

 

重回帰分析(Multiple linear regression

説明変数:カテゴリカル・連続変数どちらでも

従属変数:連続変数            の多変量解析

パラメトリック

 

結果となる数値と要因となる数値の関係を調べて、それぞれの関係を明らかにする手法

 

例)宣伝広告、店舗の立地、当日の気温といった要因とアイスクリームの売り上げの関係

 

反復測定分散分析(Repeated mesures ANOVA

対応あり 

従属変数が連続変数 

パラメトリック

 

同一個体内での条件の違いなど対応関係のある要因 (群内要因) によって生じる群内変動について、3条件以上の反復測定を行い、誤差変動 (全体変動から群間変動と群内変動を引いたもの) に比べて大きいかどうかを判断する方法

 

2条件の差を調べたいときは,対応のあるt検定が適用

・「3条件以上の対応のあるt検定」というイメージ
・対象者は全ての条件に参加している必要があり,ある条件では別の対象  

者が入る,ということはない

 

例)整形外科疾患の術後患者10名を対象として,術後1週目の膝伸展筋力,2週目の膝伸展筋力,3週目の膝伸展筋力,と3つ以上の時期に分けて,術後の膝伸展筋力が変化する(差がある)かどうかを調べる場合

 

例)健常人15名を対象として股関節回旋可動域を測定するとき,背臥位で股関節90度屈曲位,背臥位で股関節0度屈曲位,端座位といった3条件で,回旋可動域がどう変化するかを調べる際

 

 

線形混合モデル(Linear Mixed Model

セミパラメトリック

 

複数の条件で反復測定されたデータに対して条件による平均の差を検定する手法

 

これまでの一般的な統計手法は、カテゴリカルな従属変数以外は、なんでもかんでもデータを正規分布に当てはめようとし、当てはまらなかったらデータ変換を行い、それでも当てはまらなかったらノンパラメトリック手法を利用するというものだった。しかし、この10年間のパソコンの性能向上とともに、より適切な統計手法が普及してきている。その代表的なものは一般化線形モデルであり、データの性質により分布を選択でき、最尤法によりパラメターを推定するものである。さらに、一般化線形モデルを発展させたもので一般化線形混合モデルという手法が普及し始めている。この手法は、決められた地点から時期をずらし何度もサンプリングを行ったデータや、多数の地域から複数のサンプリングを行ったときに適切なものである。特に、繰り返しの頻度や地域が多いときに効果を発揮し、従属変数が連続変数でなくとも対応できる。

 

例)反復測定分散分析と同じように,整形外科疾患の術後患者10名を対象とした例をあげます.術後1週目・2週目・3週目の3つの時期に分けて,術後の膝伸展筋力が時期によって変化する(差がある)かどうかを調べたいとします.ここで, 1週目・2週目・3週目のすべての時期で対象者全10名の膝伸展筋力を測定できた場合には,反復測定分散分析と線形混合モデルのどちらを適用しても構いません.しかし,対象者Aさんがやむを得ない事情により2週目の測定を行えず,データに欠損値が生じてしまったとします.このような場合,もし反復測定分散分析を適用しようとするならば,Aさんのデータは除外しなければいけません.一方,線形混合モデルであれば2週目の測定値が欠損しているAさんのデータを含めたままで適用することができます.

 

例)数学の成績と宿題の量の関係

 

一般化推定方程式(Generalized Estimating Equations

セミパラメトリック 

 

正規分布ではなく、アウトカム間に未知の相関関係がある可能性のある反復測定データを解析するための方法

 

例)喘息患者に一定期間新薬を投与した際の発作の回数と非投与患者との比較

 

 

 

ログランク検定(log-rank test

生存曲線の比較 

ノンパラメトリック

 

2つの標本の生存分布を比較する仮説検定

 

例)新しい治療法の有効性を対照群と比較する場合

 

COX比例ハザードモデル(Cox proportional hazards models

従属変数が生存時間データの多変量解析 

ノンパラメトリック

 

説明変数が生存時間に与える影響を調べる

 

例)ある薬を服用した場合の脳卒中発症のハザード率、

製造部品の構成材料を変更した場合の故障のハザード率

 

 

 

 

 

 

 

 

 

一般線形モデル(general linear modelGLM

  正規分布を仮定した検定や解析手法(t検定 F検定 分散分析 ANOVA 等)全体のこと 

あまり普及していない名称

 

回帰式 Y= XB + U

 

 

一般化線形モデルGeneralized Linear ModelGLM

         正規分布を仮定しないで正規分布を含む、ポアソン分布、ガンマ分布、二項分布等の指数型分布族から誤差構造を選択できる

ロジスティック回帰分析やCox比例ハザードモデルなど

一般的にGLMといえばこちらを指す

 

回帰式 Y= β0 + β1Xi1 + …… +βpXip + εi

 

 

線形混合モデルLinear Mixed ModelLMM

一般化線形混合モデル(generalized linear mixed modelGLMM

 混合効果モデル(mixed effect model

 線形混合効果モデル(linear mixed effect modelLME

 反復測定による混合効果モデル(mixed effect model for repeated measuresMMRM

複数の条件で反復測定されたデータに対して、条件による平均の差を検定する手法

 

      一般線形モデルでは固定効果のみのモデルを考えていたが、このモデルでは変量効果も考え合わせる

 

回帰式 https://ja.wikipedia.org/wiki/一般化線形混合モデル

 

 

 

 

一般化推定方程式Generalized Estimating Equations, GEE

 

正規分布ではなく、アウトカム間に未知の相関関係がある可能性のある反復測定データを解析するための方法

 くり返しのあるデータを取り扱う場合の一般化線形モデルというイメージ

 

 

回帰式 https://ja.wikipedia.org/wiki/一般化推定方程式

    https://mstour.hatenablog.com/entry/2021/03/12/205654

 

参考 https://healthpolicyhealthecon.com/2016/09/08/regression-2