③生存分析
ハザード:瞬間死亡率
ハザード比
比例ハザード性:ハザード比一定
調整ハザード
④ロジスティック回帰分析
オッズの対数→直線的低下
オッズ→指数的低下
確率→S字的低下
調整オッズ
- 人口相対危険度(population relative risk; PRR)
- Rate Ratio(人年法)とRiskRatio(累積)
Relative RiskはRate Ratio、RiskRatio、さらにOdds Ratioの全てをさす語
www.jspe.jp/education/files/jspe_kogi.ppt
- 過剰相対リスク:Excess Relative Risk
代表値:平均値(算術・幾何・調和・加重),中央値(パーセンタイル),最頻値
散布度:範囲(最大値,最小値),四分位範囲,標準偏差(分散の平方根),分散(偏差の平方和)
最大値・最小値
95%・5% 外れ値
箱ひげ図
平均値±標準偏差(標準誤差)
中央値(50%)±25%,75%
Zスコア(平均値0,標準偏差1)
Zスコア(中央値0,四分位範囲1)
変動係数(標準偏差/平均値)
母集団:母数
標本:統計量
- 度数,相対度数
- 累積度数,累積相対度数
- ヒストグラム,度数多角,度数分布曲線
- 散布図:量×量
- ドットプロット図(プロット図):質×量
- 分割表(クロス表):質×質
- ロジスティック回帰
- 比例ハザード回帰(コックス回帰)
単回帰
重回帰
線形回帰
対数変換後
逆数変換後
非線形回帰
回帰係数
独立変数:説明変数,予測変数
従属変数:目的変数,基準変数
従属変数=切片+回帰係数×独立変数+残差=従属変数の予測値+残差
従属変数の予測値=切片+回帰係数×独立変数
残差=従属変数-従属変数の予測値
残差:データのプロット点から縦軸に平行に回帰直線に引いた線の長さ
回帰直線:どのデータに対しても残差が小さくなるようにするために、残差の分散が最小になるように切片と傾き(回帰係数)を決めた直線
回帰係数:独立変数と従属変数の相関係数×(従属変数の標準偏差/独立変数の標準偏差)
切片:従属変数の平均値-回帰係数×独立変数の平均値
残差 誤差 偏差
<単回帰>
従属変数と、1つの独立変数の相関係数
従属変数と、1つの独立変数で単回帰分析を行った場合の回帰係数
独立変数が1だけ変化した場合に、従属変数の予測値は回帰係数だけ変化
各変数をその変数の標準偏差で除算してから単回帰分析を行った場合の回帰係数
独立変数が独立変数の1標準偏差だけ変化した場合に、従属変数の予測値は標準(化)回帰係数×従属変数の1標準偏差だけ変化
独立変数が1つの場合は、独立変数の標準(化)回帰係数=独立変数と従属変数との相関係数
従属変数の分散=従属変数の予測値の分散+残差の分散
決定係数=従属変数の予測値の分散/従属変数の分散
=1-残差の分散/従属変数の分散
=(従属変数の分散-残差の分散)/従属変数の分散
決定係数1:従属変数の予測値=従属変数
決定係数0:従属変数の予測値=切片=従属変数の平均値(独立変数に関わらず一定)
(相関係数0→回帰係数0→決定係数0)
従属変数と、従属変数の予測値の相関係数
重相関係数^2=決定係数(R二乗)
重相関係数=√(決定係数)
独立変数が1つの場合は、従属変数と従属変数の予測値の相関係数=独立変数と従属変数との相関係数より、
重相関係数(R)=相関係数(r)より、決定係数(R二乗)=重相関係数^2=相関係数^2
<重回帰分析>
従属変数と、2つ以上の独立変数の相関係数
従属変数と、2つ以上の独立変数で重回帰分析を行った場合の回帰係数
独立変数が2つ以上の場合、他の独立変数の影響を除いた時に、
独立変数が1だけ変化した場合に、従属変数の予測値は回帰係数だけ変化
各変数をその変数の標準偏差で除算してから重回帰分析を行った場合の回帰係数
独立変数が2つ以上の場合、他の独立変数の影響を除いた時に、
独立変数が独立変数の1標準偏差だけ変化した場合に、従属変数の予測値は標準(化)回帰係数×従属変数の1標準偏差だけ変化
独立変数が2つ以上の場合は、各独立変数の標準(化)編回帰係数≠各独立変数と従属変数との相関係数
従属変数に対する、それぞれの独立変数の影響の強さを比較可能
独立変数間の相関関係がほとんどない場合、標準(化)偏回帰係数が大きい独立変数の方が、従属変数に対する影響が大きい
独立変数間の相関関係が強い場合、多重共線性の問題が生じる
従属変数の分散=従属変数の予測値の分散+残差の分散
重決定係数=従属変数の予測値の分散/従属変数の分散
従属変数と、従属変数の予測値の相関係数
重相関係数^2=決定係数(R二乗)
重相関係数=√(重決定係数)
独立変数の個数が増加すると、一般に決定係数も増大するため、独立変数の個数に応じた調整が必要
通常の決定係数(重決定係数)は、予測に有効でない独立変数の追加でも増加または普遍
自由度調整済みの決定係数は、予測に有効でない独立変数の追加により減少:追加した独立変数が有効かどうかの指標になる
O=P/(1-P)
P=O/(1+O)
OR=O1/O2={P/(1-P)}/{Q/(1-Q)}={P(1-Q)}/{(1-P)Q}
O1→0 OR→0
O2→0 OR→∞
logit P=log {P/(1-P)}=log P-log (1-P)
logit Q=log {Q/(1-Q)}=log Q-log (1-Q)
確率を変数とするロジット関数は、オッズの対数に等しい。
logit P-logit Q={log P-log (1-P)}-{log Q-log (1-Q)}=log {P/(1-P)}-log {Q/(1-Q)}=log [{P/(1-P)}/{Q/(1-Q)}]
オッズ比の対数をとると、2つの確率のロジットの差に等しい。
ロジステック関数:N=K/[1+exp{rK(t0-t)}]において、N=y,r=a,K=1,t0=0,t=xとした、
シグモイド関数:y=1/{1+exp(-ax)}において、a=1とした、
標準シグモイド関数:y=1/{1+exp(-x)}=exp(x)/{exp(x)+1}
p=O/(O+1)=exp(log O)/{exp(log O)+1}であり、log O=logit pより、
p=exp(log O)/{exp(log O)+1}=exp(logit p)/{exp(logit p)+1}
ロジット関数はロジスティック関数(標準シグモイド関数)の逆関数で、ロジスティック回帰分析でオッズ比は重要な意味を持つ。
P=ある事象の確率
logit P=確率Pのロジット
p/(1-p)=オッズ
logit P=log {P/(1-P)}:ロジット=オッズの対数
正規分布:確率密度関数
exp(-x^2)
N(μ,σ^2)=1/sqr(2πσ^2)・exp{-(x-μ)^2/2σ^2}
N(0,1)=1/sqr(2π)・exp{-x^2/2}
正規分布:累積分布関数
プロビットの逆関数
プロビット(Probit):正規分布累積関数(累積正規分布関数)の逆関数
最終更新:2014年08月22日 20:09