廣告贊助

與panel data 有關的stata 指令

Panel data指的是針對同一群人/團體/國家/地區等進行多年份的調查。

例如: 針對同一群人在1990, 1994, 1998進行問卷調查;歐洲國家在1990, 1994, 1998的每年經濟成長率、人口數、福利支出、選舉投票率

假設你想知道國家人口數的增長(x)會不會影響到消費率CPI(y)

所以你從world bank蒐集了所有國家的資料

首先要先定義你的資料是panel data

xtset country year

 

有些國家是大國,例如美國的國土面積比台灣大很多,他的人口增長可能會比較快,因為她所能容納的人數也較多

這時候就需要考慮fixed effect,控制國家:比較同一國家在不同年份的人口數的增長會不會影響到消費率。

或是有些年分,你覺得

 

在panel data中,我們經常討論的是前一年份對於這一年份的影響

所以我們要知道每一國家在前一年人口的增長率 以產生lag_pop這個變數

country year population% CPI Lag_pop
USA 1991 1.5   .
USA 1992 2.3   1.5
USA 1993 1.6   2.3

在你只有一個國家 多個年份的資料中,產生lag變數很簡單

gen lag1 = x[_n-1]

 x是你的變數名稱

但當你有很多個國家 多個年份時,你需要讓stata去考慮到國家

不然他就會把上一個資料(不同國家)拿過來變成你的lag變數

所以你要先sort你的資料

sort state year 
by state: gen lag1 = x[_n-1]

​​​​​​​如果你有missing data的話,要用下面這個指令

by state: gen lag1 = x[_n-1] if year==year[_n-1]+1

​​​​​​​

 

文章標籤
創作者介紹
創作者 Douceline 的頭像
Douceline

小國民眾思維

Douceline 發表在 痞客邦 留言(0) 人氣()