人口統計應用於選舉預測-蔡佳泓
- 8. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
迴歸模型二
隨機樣本的迴歸模型表示為 yi = β0 + β1xi + ϵi。
迴歸對於 x 沒有任何假設,但是假設 ϵi 的平均值為 0,這樣才能得
到 β1 的無偏估計,也就是等於母體的 β1。而且假設變異數不隨著 x
變動而變動,這樣的估計 β1 才有最小的不確定性。
y 可以是任意數,但是當 y 只有 0 與 1,雖然 β1 仍然是無偏估計,
但是並非最佳估計,進行假設檢定時會得到錯誤的結論。
因為 y 只有 0 與 1,所以平均值 E(Y) 介於 0 與 1,可詮釋成機率
Pr(yi = 1)。
當 y 只有 0 與 1,有可能出現 x 對於 y 的影響 β1 會隨著抽樣得到 x
(例如家庭收入)的範圍改變而改變,而不是固定不變。
因此,當 y 只有 0 與 1,而我們又希望用線性模型逼近 x 與 y 之間的
關係時,把 y 轉換成 log Pi
(1−Pi) ,變成沒有上下限的依變數。
蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 8/378/22/2015 8 / 37
- 16. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Table 1: Linear Mixed Effect Models of Voting for Saenuri in South Korean
Presidential Election, 2012
Intercept Individual-level Province-level
Intercept 0.470∗∗∗
−0.081 −0.262∗
(0.057) (0.070) (0.108)
Saenuri identification 0.696∗∗∗
0.695∗∗∗
(0.023) (0.023)
Conservative 0.020∗∗∗
0.020∗∗∗
(0.005) (0.005)
Retrospective Economic Evaluation 0.060∗∗∗
0.060∗∗∗
(0.014) (0.014)
Age 0.017∗
0.017†
(0.009) (0.009)
Education −0.000 −0.002
(0.017) (0.017)
Female 0.005 0.004
(0.018) (0.018)
Change in Individual Income 2.311∗
(1.028)
AIC 1447.765 470.773 466.248
BIC 1462.611 515.313 515.736
Log Likelihood -720.882 -226.386 -223.124
Num. obs. 1042 1042 1042
Num. groups: Province 15 15 15
Variance: Province.(Intercept) 0.044 0.005 0.003
Variance: Residual 0.225 0.085 0.085
Notes: ***p < 0.001, **p < 0.01, *p < 0.05. Standard errors are in parentheses.
蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 14/378/22/2015 14 / 37