Panel Veri Analizi
Ekonometrik analizlerde herhangi bir konuda hem zamana göre hem de birimlere göre analiz yapılması gerektiğinde, genellikle bu analizler zamana ve birime göre ayrı ayrı yapılmaktadır. Zamana göre yapılan analizler zaman serileri analizi olmakta, birimlere göre yapılan analizler ise yatay kesit analizi olmaktadır. Zaman serileri ve yatay kesit analizinin birleştirilmesini ve uygun modellerin test edilmesini sağlayan yönteme panel veri analizi denilmektedir (Greene, 2003: 612).
Zaman serisi ve yatay kesit verilerinin birleştirilmesi ile oluşturulan verilere “Longitudinal veya Havuzlanmış Veri (Pooled Data) denilmektedir. Yatay Kesit birimlerinin değişmeden aynı kaldığı, bu nedenle zamana göre aynı birimler kümesinin değişimini gösteren havuzlanmış veya longitudinal veriler panel veri analizinin temelini oluşturmaktadır. Panel veri, N sayıda birim ve her birime karşılık gelen T sayıda gözlemden oluşmaktadır. Örneğin bir bankanın bir yılda verdiği kredi miktarı panel veriyi oluşturmaktadır.
Panel veriler kullanılarak oluşturulan panel veri modelleri yardımıyla ekonomik ilişkilerin tahmin edilmesi yöntemine “Panel Veri Analizi” denilmektedir. Bu analizde genelde, yatay kesit biriminin ( N) sayısının dönem sayısından fazla olduğu durumlarda çalışmaktadır. Genel bir panel veri modeli aşağıdaki formülasyon ile gösterilmektedir (Tatoğlu, 2016: 4);
Yit = αit + βitXit + μit i = 1,……..,N ; t = 1,….….,T (1)
Bu denklemde:
Y: Bağımlı değişken
X: Bağımsız değişken
α: Sabit parametre
β: Eğim parametreleri
μ: Hata terimi
i: Birim indisi, t: Zaman indisini göstermektedir.
Panel veri analizi ilk olarak; Hildreth (1950) ve Kuh (1959) tarafından yapılan çalışmalarda kullanılmıştır. Ancak gerçek anlamda popülerliği 1990 yıllardan itibaren başlamıştır (Tatoğlu, 2016: 3). Son yıllarda panel verilere ilgideki artışın nedeni olarak, panel veri analizinde zaman serisi ve yatay kesit serisinin birlikte kullanılması, veri kalitesi ve miktarını artırarak analizciye daha fazla esneklik sağlayabilmesi gösterilmektedir (Ayaydın, 2012: 121).
Panel veri analizinde çalışılan panel verilerde tüm zamanlar boyunca kullanılacak her birim varlık gösteriyorsa dengeli panel; bazı birimler bazı zamanlarda yoksa dengesiz panel söz konusu olmaktadır. Yani analiz dönemi boyunca tüm birimlerin verileri süreklilik gösteriyorsa dengeli, süreklilik göstermiyorsa dengesiz panel veri denilmektedir. Çalışmada 2007-2016 yılları arasındaki 10 yıllık süreçte birimleri temsil eden imalat sanayi firmalarınin sayısı farklılık gösterdiğinden çalışma dengesiz panel özelliği göstermekte olup analizler bu duruma göre gerçekleştirilmiştir.
Panel veri analizinde kullanılan birimler genellikle heterojen yani birbirlerinden farklı özellikler göstermektedir. Bahsedilen heterojenliği hesaba katmamak, ilgili parametrelerin tutarsız tahminlerine yol açabilecektir. Heterojenliği modele dahil etmenin en kolay yolu sabit ve/veya eğim parametrelerinin heterojen olduğunu varsaymaktır (Tatoğlu, 2016: 7). Ancak varsayımlara rağmen beklenen sonuçlar elde edilemediğinde, panel verinin alt gruplara bölünerek her grup için ayrı ayrı tahmin yapılması daha iyi sonuçlar almaya imkan sağlayacaktır. Ayrıca bu problemin çözümü için kukla/gölge değişken (dummy variables) kullanımı da yaygındır (Guriş, 2015: 10). Çalışmadaki analizlerde bu durum dikkate alınarak kukla/gölge değişken kullanılması suretiyle ilgili problem aşılmıştır.
Birimlere veya zamana göre oluşabilecek farklılıklar, tahmin edilecek modelin katsayılarını değiştirmeye yetecek kadar önemli olabileceği gibi; modelin katsayılarını değiştiremeyecek önemsiz bir düzeyde olabilmektedir. Söz konusu farklılıkların, yapılacak testler sonucunda anlamsız bulunması durumunda incelenecek modeller; katsayıları sabit modeller, anlamlı olması durumunda incelenecek modeller ise değişken katsayılı modeller olarak adlandırılmaktadır (Er ve Bolat, 2005: 4-5). Panel veri analizi ile gözlenemeyen birim etkilerin ortaya çıkması olası bir durumdur. Eğer etkilere hata terimi gibi tesadüfi bir değişken olarak davranılıyorsa, Tesadüfi Etkiler; her bir yatay kesit gözlem için tahmin edilen parametre olarak davranılıyorsa Sabit Etkiler söz konusu olmaktadır. Aynı şekilde yatay kesiti oluşturan birimler ana kütleden tesadüfi olarak alınmışsa tesadüfi etkiler, özel olarak alınmışsa sabit etkilerden söz edilmektedir (Tatoğlu, 2016: 80).
Yukarıdaki bölümde bahsedildiği üzere panel veri analizlerinde hem zaman serisi hem de yatay kesit serisi verilerinin uyarlanmasındaki farklılıkları tahmin etmede kullanılan iki temel yöntem bulunmaktadır. Bu yöntemler sabit etkiler modeli ve tesadüfi etkiler modeli olarak bilinmektedir. Yöntemler aşağıdaki bölümde kısaca açıklanmıştır.
1.Sabit Etkiler Modeli
Sabit etkiler modelini oluşturan katsayılar, birimlere ve/veya zamana göre farklılık göstermektedirler. Bu varsayım altında gerçekleştirilen tüm tahmin modellerine sabit etkiler modeli denilmektedir. Bu modelin temelinde, birimler arası farklılıkların modelde yer alan sabit terimdeki farklılıklar aracılığıyla yok edilebileceğini düşüncesi yatmaktadır. Bundan dolayı her birimi temsil edecek farklı sabit terimler kullanılmaktadır (Gökbulut, 2009: 150).
Bu modelde yatay kesit birimleri arasındaki farklılıklar sabit terimdeki farklar ile açıklandığı ve kukla/gölge değişken yardımıyla tahmin edildiği için model kukla değişkenli model olarak da bilinmektedir. Genel olarak sabit etkiler modelinin formülasyonu temel panel veri formülasyonuna benzemekle beraber aşağıdaki şekilde gösterilmektedir.
Yit = β0+ β1Xit + γ2D2i + γ3D3i +……….+ γnDni + μit i = 1,……..,N ; t = 1,. ….,T (2)
Formülasyonda, D1, D2 şeklinde temsil edilen kukla/gölge değişkenler modele dahil edilmektedirler. β0 modelin sabit terimini temsil etmekte olup, modeldeki bireysel farklılıkları bünyesinde barındırmaktadır. Sabit etkiler modelinde çoklu doğrusallık problemi ile karşılaşmamak amacıyla kukla değişken/gölge değişken sayısı birim sayısının bir eksiği (N-1) şeklinde alınmalıdır. Çalışmada bu kurala uyulmuş ve analize dahil edilen 169 firma için 168 adet kukla/gölge değişken oluşturulmuştur.
2.Tesadüfi Etkiler Modeli
Sabit etkiler modelinde birimler arası farklılığın sabit olduğu ve bunun sabit terimdeki farklılıklarla giderileceği varsayılmaktadır. Ancak bazı çalışmalarda birimlerin tesadüfi olarak seçildiği durumlar olabilmektedir. Bu birimler arası farklılıklar da tesadüfi olduğu için tesadüfi etkiler modeli sabit etkiler modeline alternatif olarak geliştirilmiş bir yöntemdir. Tesadüfi etkiler modelinin avantajı, zaman değişmezi değişkenleri modele ilave edebilmektedir. Tesadüfi etkiler modelinde birim ve zaman etkileri tesadüfi değişken olarak modelde hata teriminin bileşeni olarak analize dahil edilmektedirler (Guriş, 2015: 22). Tesadüfi etkiler modelinde önemli olan birime veya zaman özel katsayıların bulunması değil, aksine birime veya zamana özel hata bileşenlerinin bulunmasıdır (Özer, 2012: 149).
Genel panel veri formülünden farklı olarak tesadüfi etkiler modelinde birim etki sabit olmadığından sabit parametre içerisinde gösterilmemektedir. Bunun yerine birim etki hata payı içerinde gösterilmektedir. Bu modeldeki hata terimi aşağıdaki gibi gösterilmektedir.
vit = εit + μit
(3)
Formüldeki εit artık (bilinen) hataları gösterirken, μit birim hatayı, daha açıklayıcı bir anlatımla zamana göre birimler arasındaki değişmeyi göstermektedir (Tatoğlu, 2016: 103).
Bu farklılıklar ile birlikte tesadüfi etkiler modelinin genel formülü aşağıda gösterilmiştir.
Yit = β0+ β1Xit + β2X2it + ………+ βkiXkit + uit + μit (4)
Panel verinin genel formasyonunda açıklandığı gibi denklemde Yit modele ait bağımlı değişkenleri, Xit bağımsız değişkenleri, β0 başlangıç eğim parametresini, uit bilinen hataları ve μit birim hatayı göstermektedir.
Panel veri analizlerinde sabit etkiler modeli ile tesadüfi etkiler modeli beraber kullanılabilmektedir. Ancak analiz için hangi yöntemin sonucunun daha iyi olduğu sorusunun cevabı için birden çok istatistiki testler geliştirilmiştir. Bu testlerden en bilineni ve çalışmada kullanılan test Hausman (1978) testidir (Wooldridge, 2002: 289).
Hausman Testi ile sabit etkiler modeli parametre tahmincileri ile rassal etkiler modelinin parametre tahmincileri arasındaki farkın istatistiksel olarak anlamlı olup olmadığı incelenmektedir. Hausman test istatistiğinin hipotezleri şu şekildedir (Ayaydın, 2012: 125).
H0: Açıklayıcı değişkenler ve birim (zaman) etki arasında korelasyon yoktur.
H1: Açıklayıcı değişkenler ve birim (zaman) etki korelasyonludur.
Eğer yapılacak test sonucunda temel hipotez olan H0 hipotezi kabul edilirse sabit ve tesadüfi etkilerin tahmincileri arasında fark çok küçüktür. Bu durumda araştırmacının tesadüfi etkiler modelini (random effect) kullanması daha uygun olacaktır. Diğer hipotezin kabülü durumunda ise, tesadüfi etkiler tahmincileri sapma göstermektedir, dolayısıyla sabit etkiler modelinin (fixed effect) kullanılması daha uygun olacaktır (Tatoğlu, 2016: 185).
Ekonometrik analizlerde herhangi bir konuda hem zamana göre hem de birimlere göre analiz yapılması gerektiğinde, genellikle bu analizler zamana ve birime göre ayrı ayrı yapılmaktadır. Zamana göre yapılan analizler zaman serileri analizi olmakta, birimlere göre yapılan analizler ise yatay kesit analizi olmaktadır. Zaman serileri ve yatay kesit analizinin birleştirilmesini ve uygun modellerin test edilmesini sağlayan yönteme panel veri analizi denilmektedir (Greene, 2003: 612).
Zaman serisi ve yatay kesit verilerinin birleştirilmesi ile oluşturulan verilere “Longitudinal veya Havuzlanmış Veri (Pooled Data) denilmektedir. Yatay Kesit birimlerinin değişmeden aynı kaldığı, bu nedenle zamana göre aynı birimler kümesinin değişimini gösteren havuzlanmış veya longitudinal veriler panel veri analizinin temelini oluşturmaktadır. Panel veri, N sayıda birim ve her birime karşılık gelen T sayıda gözlemden oluşmaktadır. Örneğin bir bankanın bir yılda verdiği kredi miktarı panel veriyi oluşturmaktadır.
Panel veriler kullanılarak oluşturulan panel veri modelleri yardımıyla ekonomik ilişkilerin tahmin edilmesi yöntemine “Panel Veri Analizi” denilmektedir. Bu analizde genelde, yatay kesit biriminin ( N) sayısının dönem sayısından fazla olduğu durumlarda çalışmaktadır. Genel bir panel veri modeli aşağıdaki formülasyon ile gösterilmektedir (Tatoğlu, 2016: 4);
Yit = αit + βitXit + μit i = 1,……..,N ; t = 1,….….,T (1)
Bu denklemde:
Y: Bağımlı değişken
X: Bağımsız değişken
α: Sabit parametre
β: Eğim parametreleri
μ: Hata terimi
i: Birim indisi, t: Zaman indisini göstermektedir.
Panel veri analizi ilk olarak; Hildreth (1950) ve Kuh (1959) tarafından yapılan çalışmalarda kullanılmıştır. Ancak gerçek anlamda popülerliği 1990 yıllardan itibaren başlamıştır (Tatoğlu, 2016: 3). Son yıllarda panel verilere ilgideki artışın nedeni olarak, panel veri analizinde zaman serisi ve yatay kesit serisinin birlikte kullanılması, veri kalitesi ve miktarını artırarak analizciye daha fazla esneklik sağlayabilmesi gösterilmektedir (Ayaydın, 2012: 121).
Panel veri analizinde çalışılan panel verilerde tüm zamanlar boyunca kullanılacak her birim varlık gösteriyorsa dengeli panel; bazı birimler bazı zamanlarda yoksa dengesiz panel söz konusu olmaktadır. Yani analiz dönemi boyunca tüm birimlerin verileri süreklilik gösteriyorsa dengeli, süreklilik göstermiyorsa dengesiz panel veri denilmektedir. Çalışmada 2007-2016 yılları arasındaki 10 yıllık süreçte birimleri temsil eden imalat sanayi firmalarınin sayısı farklılık gösterdiğinden çalışma dengesiz panel özelliği göstermekte olup analizler bu duruma göre gerçekleştirilmiştir.
Panel veri analizinde kullanılan birimler genellikle heterojen yani birbirlerinden farklı özellikler göstermektedir. Bahsedilen heterojenliği hesaba katmamak, ilgili parametrelerin tutarsız tahminlerine yol açabilecektir. Heterojenliği modele dahil etmenin en kolay yolu sabit ve/veya eğim parametrelerinin heterojen olduğunu varsaymaktır (Tatoğlu, 2016: 7). Ancak varsayımlara rağmen beklenen sonuçlar elde edilemediğinde, panel verinin alt gruplara bölünerek her grup için ayrı ayrı tahmin yapılması daha iyi sonuçlar almaya imkan sağlayacaktır. Ayrıca bu problemin çözümü için kukla/gölge değişken (dummy variables) kullanımı da yaygındır (Guriş, 2015: 10). Çalışmadaki analizlerde bu durum dikkate alınarak kukla/gölge değişken kullanılması suretiyle ilgili problem aşılmıştır.
Birimlere veya zamana göre oluşabilecek farklılıklar, tahmin edilecek modelin katsayılarını değiştirmeye yetecek kadar önemli olabileceği gibi; modelin katsayılarını değiştiremeyecek önemsiz bir düzeyde olabilmektedir. Söz konusu farklılıkların, yapılacak testler sonucunda anlamsız bulunması durumunda incelenecek modeller; katsayıları sabit modeller, anlamlı olması durumunda incelenecek modeller ise değişken katsayılı modeller olarak adlandırılmaktadır (Er ve Bolat, 2005: 4-5). Panel veri analizi ile gözlenemeyen birim etkilerin ortaya çıkması olası bir durumdur. Eğer etkilere hata terimi gibi tesadüfi bir değişken olarak davranılıyorsa, Tesadüfi Etkiler; her bir yatay kesit gözlem için tahmin edilen parametre olarak davranılıyorsa Sabit Etkiler söz konusu olmaktadır. Aynı şekilde yatay kesiti oluşturan birimler ana kütleden tesadüfi olarak alınmışsa tesadüfi etkiler, özel olarak alınmışsa sabit etkilerden söz edilmektedir (Tatoğlu, 2016: 80).
Yukarıdaki bölümde bahsedildiği üzere panel veri analizlerinde hem zaman serisi hem de yatay kesit serisi verilerinin uyarlanmasındaki farklılıkları tahmin etmede kullanılan iki temel yöntem bulunmaktadır. Bu yöntemler sabit etkiler modeli ve tesadüfi etkiler modeli olarak bilinmektedir. Yöntemler aşağıdaki bölümde kısaca açıklanmıştır.
1.Sabit Etkiler Modeli
Sabit etkiler modelini oluşturan katsayılar, birimlere ve/veya zamana göre farklılık göstermektedirler. Bu varsayım altında gerçekleştirilen tüm tahmin modellerine sabit etkiler modeli denilmektedir. Bu modelin temelinde, birimler arası farklılıkların modelde yer alan sabit terimdeki farklılıklar aracılığıyla yok edilebileceğini düşüncesi yatmaktadır. Bundan dolayı her birimi temsil edecek farklı sabit terimler kullanılmaktadır (Gökbulut, 2009: 150).
Bu modelde yatay kesit birimleri arasındaki farklılıklar sabit terimdeki farklar ile açıklandığı ve kukla/gölge değişken yardımıyla tahmin edildiği için model kukla değişkenli model olarak da bilinmektedir. Genel olarak sabit etkiler modelinin formülasyonu temel panel veri formülasyonuna benzemekle beraber aşağıdaki şekilde gösterilmektedir.
Yit = β0+ β1Xit + γ2D2i + γ3D3i +……….+ γnDni + μit i = 1,……..,N ; t = 1,. ….,T (2)
Formülasyonda, D1, D2 şeklinde temsil edilen kukla/gölge değişkenler modele dahil edilmektedirler. β0 modelin sabit terimini temsil etmekte olup, modeldeki bireysel farklılıkları bünyesinde barındırmaktadır. Sabit etkiler modelinde çoklu doğrusallık problemi ile karşılaşmamak amacıyla kukla değişken/gölge değişken sayısı birim sayısının bir eksiği (N-1) şeklinde alınmalıdır. Çalışmada bu kurala uyulmuş ve analize dahil edilen 169 firma için 168 adet kukla/gölge değişken oluşturulmuştur.
2.Tesadüfi Etkiler Modeli
Sabit etkiler modelinde birimler arası farklılığın sabit olduğu ve bunun sabit terimdeki farklılıklarla giderileceği varsayılmaktadır. Ancak bazı çalışmalarda birimlerin tesadüfi olarak seçildiği durumlar olabilmektedir. Bu birimler arası farklılıklar da tesadüfi olduğu için tesadüfi etkiler modeli sabit etkiler modeline alternatif olarak geliştirilmiş bir yöntemdir. Tesadüfi etkiler modelinin avantajı, zaman değişmezi değişkenleri modele ilave edebilmektedir. Tesadüfi etkiler modelinde birim ve zaman etkileri tesadüfi değişken olarak modelde hata teriminin bileşeni olarak analize dahil edilmektedirler (Guriş, 2015: 22). Tesadüfi etkiler modelinde önemli olan birime veya zaman özel katsayıların bulunması değil, aksine birime veya zamana özel hata bileşenlerinin bulunmasıdır (Özer, 2012: 149).
Genel panel veri formülünden farklı olarak tesadüfi etkiler modelinde birim etki sabit olmadığından sabit parametre içerisinde gösterilmemektedir. Bunun yerine birim etki hata payı içerinde gösterilmektedir. Bu modeldeki hata terimi aşağıdaki gibi gösterilmektedir.
vit = εit + μit
(3)
Formüldeki εit artık (bilinen) hataları gösterirken, μit birim hatayı, daha açıklayıcı bir anlatımla zamana göre birimler arasındaki değişmeyi göstermektedir (Tatoğlu, 2016: 103).
Bu farklılıklar ile birlikte tesadüfi etkiler modelinin genel formülü aşağıda gösterilmiştir.
Yit = β0+ β1Xit + β2X2it + ………+ βkiXkit + uit + μit (4)
Panel verinin genel formasyonunda açıklandığı gibi denklemde Yit modele ait bağımlı değişkenleri, Xit bağımsız değişkenleri, β0 başlangıç eğim parametresini, uit bilinen hataları ve μit birim hatayı göstermektedir.
Panel veri analizlerinde sabit etkiler modeli ile tesadüfi etkiler modeli beraber kullanılabilmektedir. Ancak analiz için hangi yöntemin sonucunun daha iyi olduğu sorusunun cevabı için birden çok istatistiki testler geliştirilmiştir. Bu testlerden en bilineni ve çalışmada kullanılan test Hausman (1978) testidir (Wooldridge, 2002: 289).
Hausman Testi ile sabit etkiler modeli parametre tahmincileri ile rassal etkiler modelinin parametre tahmincileri arasındaki farkın istatistiksel olarak anlamlı olup olmadığı incelenmektedir. Hausman test istatistiğinin hipotezleri şu şekildedir (Ayaydın, 2012: 125).
H0: Açıklayıcı değişkenler ve birim (zaman) etki arasında korelasyon yoktur.
H1: Açıklayıcı değişkenler ve birim (zaman) etki korelasyonludur.
Eğer yapılacak test sonucunda temel hipotez olan H0 hipotezi kabul edilirse sabit ve tesadüfi etkilerin tahmincileri arasında fark çok küçüktür. Bu durumda araştırmacının tesadüfi etkiler modelini (random effect) kullanması daha uygun olacaktır. Diğer hipotezin kabülü durumunda ise, tesadüfi etkiler tahmincileri sapma göstermektedir, dolayısıyla sabit etkiler modelinin (fixed effect) kullanılması daha uygun olacaktır (Tatoğlu, 2016: 185).