= ها مخالف صفر است حداقل یکی از
این آزمون با بهره گرفتن از مجموع مربعات باقیمانده مقید حاصل از مدل ترکیبی به دست آمده از OLS و مجموع مربعات باقیمانده غیر مقید حاصل از تخمین رگرسیون درون گروهی به صورت زیر است:
i =۱,۲,…,N مدل مقید
i =۱,۲,…,N مدل نامقید
آماره آزمون Fبه شرح زیر است:
(۳-۱)
که در آن Nتعداد مقاطع، K تعداد متغیرهای توضیحی و T تعداد مشاهدهها در طول زمان است. با مقایسه آماره F محاسباتی با Fجدول، میتوان در صورت بزرگتر بودن آماره F محاسباتی از روش پانل استفاده کرد.
۳-۷-۵ آزمون هاسمن
برای تشخیص اینکه در برآورد مدلهای پانل دیتا، کدام روش (اثرات ثابت و اثرات تصادفی) مناسب میباشد، از آزمون هاسمن (۱۹۸۰) استفاده می شود. در آزمون هاسمن، فرضیه صفر و فرضیه مقابل آن به صورت زیر بیان میگردد:
فرضیه صفر به معنای این است که بین جمله خطا (که در بر گیرندهی اثرات فردی است) و متغیرهای توضیحی، هیچ ارتباطی وجود ندارد و در واقع مستقل از یکدیگر میباشند. این در حالی است که فرضیه مقابل به این معنی است که بین جزء اخلال و متغیرهای توضیحی، همبستگی وجود دارد(اشرف زاده و مهرگان، ۱۳۸۷).
در صورت رد فرضیه صفر، بهتر است که از روش اثرات ثابت استفاده شود.
اگر b تخمینزننده روش اثرات ثابت، و تخمینزن روش تصادفی باشد، آنگاه میتوان نوشت:
(۳-۲)
هاسمن ثابت نمود که عبارت مذکور دارای توزیع c2K2 میباشد.
(۳-۳)
K: تعداد متغیرهای توضیحی
اگر آماره محاسبه شده از این آزمون از c2K2 بزرگتر باشد، فرضیه صفر مبنی بر اثر تصادفی رد شده و فرض اثر ثابت پذیرفته می شود.
۳-۷-۶ مدل اثرات ثابت
استدلال پایهای مدل اثرات ثابت آن است که در تصریح مدل رگرسیونی نمی توان متغیرهای توضیحی مناسب را که طی زمان تغییر نمیکنند، وارد مدل کنیم. از این رو، وارد کردن متغیرهای مجازی، پوشش و جبرانی بر این بیتوجهی و ناآگاهی میباشد. استفاده از داده های تابلویی با اثرات ثابت، یک راه حل مناسب برای عدم تشخیص رگرسیون به خصوص زمانی که اثرات ویژه هر واحد (اثرات فردی) بر اثرات زمانی آن غالب میباشد، خواهد بود. یک روش متداول در فرمولبندی مدل پانل دیتا بر این فرض استوار است که اختلاف بین مقطعها را میتوان به صورت تفاوت در عرض از مبدأ نشان داد. به فرض که و شامل t مشاهده برای واحد i ام باشد و بردار جزء اختلال بوده و دارای ابعاد بوده باشد، در نتیجه داریم:
که در این فرمولها i بردار یکه با ابعاد میباشد، مدل فوق را میتوان به شکل خلاصه به صورت زیر نوشت.
(۳-۴)
که متغیر مجازی برای نشان دادن i امین مقطع میباشد. حال اگر ماتریس D را به صورت:
(۳-۵)
با ابعاد n و nT تعریف کنیم، خواهیم داشت:
(۳-۶)
که این رابطه به عنوان مدل حداقل مربعات متغیر مجازی (LSDV)نامیده می شود.
مدل اخیر یک مدل رگرسیونی کلاسیک بوده و هیچ شرط جدیدی برای تجزیه و تحلیل آن لازم نیست. میتوان مدل را با بهره گرفتن از روش OLSباK رگرسور در Xو n ستون در D به عنوان یک مدل چند متغیره با n+k پارامتر برآورد کرد. عرض از مبدأ در مدل رگرسیون به این دلیل بین افراد متفاوت است که هر فرد یا واحد مقطعی، ویژگیهای خاص خود را داراست. برای ملاحظه عرض از مبدأهای مختلف میتوان از متغیرهای موهومی استفاده کرد. مدل اثرات ثابت با بهره گرفتن از متغیرهای موهومی مدل حداقل مربعات با متغیر موهومی LSDV)) نامیده می شود. مدل اثرات ثابت در شرایطی مناسب است که عرض از مبدأ خاص فرد با یک یا چند متغیر توضیحی همبستگی داشته باشد. یکی از معایب (LSDV) است که وقتی تعداد واحدهای مقطعی (N) خیلی بزرگ باشد، به تعداد زیادی درجه آزادی نیاز داریم. در چنین حالتی ناچاریم N-1متغیر موهومی وارد مدل کنیم و عرض از مبدأ را نیز داشته باشیم که این کار شرایط ایجاد همخطی را فراهم مینماید(ابریشمی، ۱۳۸۳).
۳-۷-۷ مدل اثرات تصادفی
در مدل اثرات تصادفی فرض می شود که عرض از مبدأ یک واحد تکی، انتخابی تصادفی از جامعهای بزرگتر با یک میانگین ثابت است. بدین ترتیب عرض از مبدأ تکی، به صورت انحرافی از این میانگین ثابت بیان می شود. یکی از مزایای مدل اثر تصادفی نسبت به مدل اثرات ثابت این است که به درجه های آزادی کمتری نیاز دارد، چون نباید N عرض از مبدأ مقطعی تخمین زده شود و تنها لازم است، میانگین و واریانس عرض از مبدأ را تخمین بزنیم. مدل اثرات تصادفی در شرایطی مناسب است که عرض از مبدأ (تصادفی) هر واحد مقطعی با متغیرهای توضیحی، همبستگی نداشته باشد(ابریشمی، ۱۳۸۳).
ایده اساسی و اولیه با معادله زیر شروع می شود:
(۳-۷)
طرفداران روش اثرات تصادفی معتقدند، به جای اینکه در معادله فوق، را ثابت فرض کنید، آن را به صورت یک متغیر تصادفی با میانگین در نظر گرفته و مقدار عرض از مبدأ برای هر مقطع را به صورت زیر بیان نمایید.
(۳-۸)
که در آن جمله خطای تصادفی با میانگین صفر و واریانس است.
فرض اساسی در مدل اثرات تصادفی این است، که مقاطع مورد مطالعه متعلق به جامعهای بزرگتر بوده و میانگین مشترکی برای عرض از مبدأ دارند. اختلاف در مقادیر عرض از مبدأ هر مقطع در جمله خطای منعکس می شود.
بر اساس مدل اثرات تصادفی، معادله به صورت زیر خواهد بود:
(۳-۹)
جمله خطای ترکیبی متشکل از دو جزء (خطای مقطعی) و (خطای ترکیبی) میباشد. اطلاق مدل اجزاء خطا به این دلیل میباشد که جمله خطای ترکیبی ، از دو یا چند جزء خطا تشکیل شده است. ساختار جمله خطا در روش اثرات تصادفی به گونه ای است که باید این روش را با کمک حداقل مربعات تعمیم یافته (GLS) برآورد کرد. خاطر نشان می شود که اگر در الگوی تابلویی مورد نظر فقط اثرات فردی را در جملات خطا (چه با اثرات ثابت و چه با اثرات تصادفی) لحاظ نمایید، الگوی مورد نظر به صورت الگوی جزء خطای یک جانبه خواهد بود. اما اگر علاوه بر اثرات فردی، اثرات زمانی یا پویاییهای مقطع مربوطه در طی زمان نیز لحاظ شود، الگوی مورد نظر به صورت الگوی جزء خطای دو جانبه میباشد.
۳-۷-۸ ضریب تعیین
مهمترین معیاری است که با آن میتوان رابطه بین دو متغیر x و y را توضیح داد و میزان انحراف مشاهدات y را با برآورد خط رگرسیون اندازهگیری میکند. این ضریب بین صفر تا یک در نوسان بوده به طوری که مقدار صفر بیانگر آناست که خط رگرسیون هرگز نتوانسته تغییرات y را به متغیر مستقل x نسبت دهد. مقدار یک نیز بیانگر آن است که خط رگرسیون به طور دقیق توانسته است تغییرات y را به متغیر مستقل x نسبت دهد. در رگرسیون چند متغیره در صورتی که نمونه کوچک باشد، ضریب تعیین تعدیل شده به جای ضریب تعیین استفاده میشود و با بزرگتر شدن حجم نمونه این دو ضریب به همدیگر نزدیک میشوند(مؤمنی و قیومی، ۱۳۸۶، ۱۲۲).
۳-۷-۹ مدلهای رگرسیون
مدلهای رگرسیون انواع مختلفی دارد که متداولترین آنها رگرسیون ساده و مرکب میباشند. رگرسیون ساده شامل ارتباط بین دو متغیر و رگرسیون چندمتغیره، ارتباط یک متغیر را با دو یا چند متغیر بیشتر نشان میدهد. رگرسیون چندمتغیره رابطه بین متغیر وابسته را با یکی از متغیرهای مستقل، در شرایط ثابت بودن دیگر متغیرهای مستقل نشان میدهد.
در رگرسیون ساده (یک متغیر)، معادله معرف خط رگرسیون جامعه میباشد که با برآورد میشود. در رگرسیون خطی چندمتغیره معادله معرف رگرسیون جامعه به شرح زیر میباشد:
که برای برآورد معادله فوق از معادله زیر استفاده میشود:
که در آن