Eid, W., Mahmoud, R. (2023). Detecting The Problem of Heteroscedasticity in Cross-Sectional Data الكشف عن مشكلة عدم ثبات تباين حد الخطأ في البيانات المقطعية. Journal of the Advances in Agricultural Researches, 28(4), 979-989. doi: 10.21608/jalexu.2024.256059.1181
Wafaa A. B. M. Eid; Rania F. Mahmoud. "Detecting The Problem of Heteroscedasticity in Cross-Sectional Data الكشف عن مشكلة عدم ثبات تباين حد الخطأ في البيانات المقطعية". Journal of the Advances in Agricultural Researches, 28, 4, 2023, 979-989. doi: 10.21608/jalexu.2024.256059.1181
Eid, W., Mahmoud, R. (2023). 'Detecting The Problem of Heteroscedasticity in Cross-Sectional Data الكشف عن مشكلة عدم ثبات تباين حد الخطأ في البيانات المقطعية', Journal of the Advances in Agricultural Researches, 28(4), pp. 979-989. doi: 10.21608/jalexu.2024.256059.1181
Eid, W., Mahmoud, R. Detecting The Problem of Heteroscedasticity in Cross-Sectional Data الكشف عن مشكلة عدم ثبات تباين حد الخطأ في البيانات المقطعية. Journal of the Advances in Agricultural Researches, 2023; 28(4): 979-989. doi: 10.21608/jalexu.2024.256059.1181
Detecting The Problem of Heteroscedasticity in Cross-Sectional Data الكشف عن مشكلة عدم ثبات تباين حد الخطأ في البيانات المقطعية
1Cent. Lab. for Design & Stat. Analysis Res., A. R. C., Giza, Egypt.
2Cent. Lab. for Design & Stat. Analysis Res., A. R. C., Giza, Egypt.
Abstract
The current research aims to study the nature of the problem of heteroscedasticity {instability of the error term variation in the regression analysis}, its causes and effects and to apply the most important methods for detecting this problem in the cross-sectional data. Field data were collected during the 2022/2023 agricultural season from lupine farmers in Al-Husseiniyah District, Sharkia Governorate through a questionnaire prepared for this purpose. Two samples were randomly selected, the first one included 25 farmers and the second included 102 farmers. The analysis was done using the Eviews computer program. Tests were conducted to detect the presence of a problem of instability of the error term variation in the regression analysis for production and production factors (amount of seeds, quantity of phosphate fertilizer, number of workers, quantity of irrigation water) for the lupine crop. It was found that there is a problem of instability of the error term variation for quantity of fertilizer and amounted of seeds in the 25 farmers sample. In the case of the 102 farmers sample, there was a problem of instability for amount of phosphate fertilizer and quantity of irrigation water. It was sufficient to explain only one element (amount of fertilizer) as an example to illustrate how to detect the problem using the collected data. In case of the 25 farmers sample, by using Park’s test, the calculated T value was about 2.084 which is greater than the tabulated value that is of about 2.069, so the alternative hypothesis of the existence of the problem of instability of the error term variation is accepted. Data were processed by performing a transformation of the original model using the weighted least squares method. The calculated value of T was about 0.329, which is less than the tabulated value, so the null hypothesis is accepted where the variance of the error term is constant. In case of the 102 farmers sample, by using the Park test, the calculated T value was about 2.005 which is greater than the tabulated T value which was about 1.984. The alternative hypothesis of the existence of the instability of error variance is accepted. After treatment, the calculated T value reached about 1.961, which is less than that of tabular T value. Therefore, the null hypothesis that the variance of the error term is stable is accepted. From the previous results, it is cleared that there is no relationship between sample size and presence or absence of the problem of variance instability of the error term in regression analysis using cross-sectional data. Recommendations: The study recommends that researchers should pay attention to conducting the necessary tests to detect the problem of {heteroscedasticity} and the need to detect it and put the remedy to obtain accurate results.
يعتبر الأسلوب الإحصائي أحد الأساليب العلمية التي تمكن الباحث من الوصول إلي القرارات المثلي، في ظل الإمكانيات المادية المتوفرة لديه وتقييم الآثار المترتبة علي هذه القرارات، لذلك يعتبر الوصف الإحصائي الدقيق والتحليل الإحصائي السليم للعلاقة بين المتغيرات الإحصائية المختلفة، من أهم المؤشرات التي يعتمد عليها الباحث في مجالات العلوم الزراعية، في اتخاذ أي قرار صحيح يستهدف توصية ما مرتبطة بحل المشكلة البحثية، وعليه فان النماذج الإحصائية هي الصياغة الرياضية للعلاقة بين المتغيرات المستقلة والتابعة موضع البحث المبنية علي البيانات الإحصائية، وتمثل نماذج الانحدار جزء هام في دراسة العلاقة بين المتغيرات، وعند استخدام نماذج الانحدار يمكن تقدير قيمة المتغير التابع عند قيم معينة للمتغيرات المستقلة وقياس الخطأ في التقدير، بحيث يكون تقدير النموذج الإحصائي في حقيقة الأمر هو عبارة عن محاولة للوصول إلي تقديرات دقيقة لقيم معاملاتهs ’B ، ولكي تتم عملية التقدير هذه يلزم تجميع البيانات عن المتغيرات المستقلة s’B والمتغير التابع Y وإعدادها للتحليل الإحصائي باستخدام أسلوب تحليل الانحدار ، كما يجب التأكد من عدم وجود مشاكل في القياس باستخدام اختبارات الإحصاء القياسي Econometrics.
المشكلة:
يواجه الباحثين عدة مشاكل عند تقدير النماذج الإحصائية والقياسية ومن أبرزها مشكلة عدم ثبات تباين حد الخطأ (HETEROSCEDASTICITY) بمعنى وجود ارتباط بين الحد العشوائي والمتغير التفسيري التي تكون أكثر شيوع بالبيانات المقطعية Cross Section Data عن بيانات السلاسل الزمنية Time Series Data ويجب علي الباحث معالجتها قبل القيام بتفسير نتائج النموذج الإحصائي أو القياسي المقدر، لما لها من آثار سلبية على نتيجة التحليل الإحصائي، فعلى الرغم من أن مقدرات النموذجparameters تظل غير متحيزة unbiased ومتسقةconsistent إلا أنها لم تعد لها أقل تباين أي لم تعد كفءefficient وبمعنى أخر لم تعد تلك المقدرات تمتاز أفضل مقدر خطي غير متحيز BLUE"" مما لاشك يؤثر على دقة النتائج المتحصل عليها وبالتالي تؤدى لقرارات خاطئة لا تناسب مع المشكلة التي يسعى الباحث لحلها وتؤثر على جودة الأداء العام للنموذج.
الهدف:
يهدف البحث إلي دراسة طبيعة مشكلة عدم ثبات تباين حد الخطأ HETEROSCEDASTICITY، وأسبابه وآثاره وتطبيق أهم طرق الكشف عن عدم ثبات تباين حد الخطأ في البيانات موضوع البحث حتى يتسنى معالجة هذه المشكلة وإيجاد تقديرات إحصائية ذات كفاءة عالية واختبارها إحصائياً بعد التخلص من هذه المشكلة مع توضيح طرق المعالجة الإحصائية المختلفة.
الطريقة البحثية ومصادر البيانات
يعتمد البحث بصفة أساسية علي أساليب التحليل الكمي للكشف عن مشكلة عدم ثبات تباين حد الخطأ من خلال عدة طرق من أهمها اختبار بارك Park Test، اختبار Goldfeld-Quandt، اختبار معامل ارتباط الرتب لـ Spearman، ثم تطبيق الطرق المختلفة لمعالجة عدم ثبات تباين حد الخطأ علي الإنتاج وعناصر الإنتاج (كمية التقاوي، كمية السماد الفوسفاتي، عدد العمال، كمية مياه الري) ، وقد تم الاعتماد على البيانات الميدانية التي تم تجميعها خلال الموسم الزراعي 2022/2023 من بعض مُزارعي الترمس بمحافظة الشرقية عن طريق استمارة استبيان أُعدت خصيصاً لهذا الغرض، حيث تم اختيار عينتين مختلفين في حجم العينة للكشف عن وجود أو عدم وجود مشكلة عدم ثبات تباين حد الخطأ في حالة العينة الصغيرة حجمها 25 مزارع وعينة كبيرة حجمها 102 مُزارع بطريقة عشوائية في مركز الحسينية بمحافظة الشرقية، وقد تم التحليل باستخدام برنامج Eviews.
النتائج البحثية والمناقشة:
أولاً: الإطار النظري والتحليلي:
طبيعة عدم ثبات تباين حد الخطأ
من بين افتراضات نموذج الانحدار الخطي باستخدام طريقة المربعات الصغرى العادية هو ثبات تباين حد الخطأ Homoscedasticity ويترتب علي إسقاط هذا الافتراض حدوث مشكلة عدم ثبات تباين حد الخطأ Heteroscedasticity أي أن حدود الأخطاء ليس لها نفس التباين، مفهوم مشكلة عدم ثبات التباين فى تغير تباين الحد العشوائي مع تغير قيم المتغير التفسيري حيث يلاحظ أن تغير المتغير التفسيري يؤدى لتغير المتغير التابع ويؤدى أيضاً لتغير تباين الحد العشوائي، ومع وجود هذه المشكلة، فإن المعلمات المقدرة باستخدام طريقة المربعات الصغرى العادية تتصف بعدم الكفاءة وإن كانت تتصف بعدم التحيز والاتساق، ويرتبط عدم ثبات تباين حد الخطأ بالبيانات المقطعية (Cross - Section Data) أكثر من بيانات السلاسل الزمنية ((Time – Series Data.
أسباب عدم ثبات تباين حد الخطأ
توجد عدة أسباب لعدم ثبات تباين حد الخطأ إلا انه يمكن حصرها في الأسباب التي تؤدي إلي زيادة تباين الأخطاء ومنها ما يلي:
1- يمكن أن ينشأ اختلاف التباين Heteroscedasticity نتيجة لوجود قيم متطرفة outlier وهي قيم إما صغيرة جدا أو قيم كبيرة جدا، إن إدراج أو استبعاد مثل تلك القيم، خاصة إذا كان حجم العينة صغيرًا، يمكن أن يغير نتائج تحليل الانحدار بشكل كبير.
2- تنشأ أيضا مشكلة اختلاف التباين من عدم توصيف النموذج المقدر يشكل صحيح على سبيل المثال حذف بعض المتغيرات الهامة من النموذج، وإذا أضيفت تلك المتغيرات المحذوفة للنموذج فإن مشكلة اختلاف التباين تختفي.
3- عدم ملائمة أساليب جمع البيانات، وعدم كفاية مفردات العينة وانخفاض كفاءة جامعي البيانات.
طرق الكشف عن مشكلة اختلاف التباين Heteroscedasticity
تستخدم عدة اختبارات للكشف عن مشكلة اختلاف التباين منها:
1- اختبار بارك Park Test
بفرض أن:
i=1,2,…..,N
حيث أن:
= القيمة الفعلية للمتغير التابع، = القيمة الفعلية للمتغير المستقل، = القيمة الفعلية لحد الخطأ، = القيم الفعلية لمعاملات الانحدار، N= عدد المشاهدات.
يمكن بيان كيفية استخدام اختبار Park في اكتشاف عدم ثبات تباين حد الخطأ من خلال الخطوات التالية:
1- تطبيق طريقة المربعات الصغرى العادية فينتج ما يلي:
حيث أن:
= القيمة المقدرة للمتغير التابع، = القيمة المقدرة ل ، = القيم المقدرة ل ، = القيمة المقدرة لحد الخطأ .
2- الحصول علي البواقي أو القيم المقدرة لحد الخطأ( ) من المعادلة التالية:
3- استخدام طريقة المربعات الصغرى العادية في إجراء انحدار علي فينتج ما يلي:
4- إيجاد القيمة المحسوبة لاختبار T بالنسبة ل كما يلي:
حيث:
DF=N-K+1
حيث أن:
= الخطأ المعياري، = التباين، = التباين المقدر لحد الخطأ، X= الوسط الحسابي ل X، DF= درجات الحرية، K= عدد المتغيرات المستقلة، K+1= عدد معاملات الانحدار المقدرة.
5- إيجاد القيمة الجدولية لاختبار T، ويتم بالبحث في الجدول عند درجات حرية معينة (N-K+1) ومستوي معنوية معين.
6- مقارنة القيمة المحسوبة لاختبار T بالقيمة الجدولية:
- فإذا كانت قيمة T المحسوبة اكبر من قيمة T الجدولية، يتم قبول الفرض البديل القائل بان ويقال في هذه الحالة أن معنوية احصائيا، ويدل هذا علي وجود مشكلة عدم ثبات تباين حد الخطأ.
- اما اذا كانت قيمة T المحسوبة اقل من قيمة T الجدولية، يتم قبول فرض العدم القائل فإن ، ويقال في هذه الحالة ان غير معنوية احصائياً، ويدل علي وجود افتراض ثبات تباين حد الخطأ.
2- اختبار Goldfeld-Quandt:
بافتراض النموذج التالي:
i=1,2,…..,N
يمكن بيان كيفية استخدام اختبار Goldfeld-Quandt في اكتشاف عدم ثبات تباين الخطأ من خلال الخطوات التالية:
1- ترتيب مشاهدات X ترتيبا تصاعديا.
2- استبعاد المشاهدات الوسطى لكل من X و Y،ثم تكوين مجموعتين من المشاهدات بحيث يكون لكل مجموعة على حدا معادلة خاصة بها كما يلي :
-المجموعة الأولى: وتتمثل في المشاهدات الخاصة بكل من X و Yالواردة قبل المشاهدات التي تم استبعادها، والمعادلة الخاصة بهذه المجموعة هي :
- المجموعة الثانية: وتتمثل في المشاهدات الخاصة بكل منX و Yالواردة بعد المشاهدات التي تم استبعادها، والمعادلة الخاصة بهذه المجموعة هي:
3- تقدير معاملات المعادلتين السابقتين باستعمال طريقة المربعات الصغرى :
4- الحصول على القيم المقدرة لحد الخطأ:
5- إيجاد القيمة المحسوبة لإحصائية F كما يلي:
6- إيجاد درجات الحرية:
حيث أن:
=nعدد المشاهدات، k : عدد المتغيرات المستقلة، m: عدد المشاهدات المستبعدة.
7- إيجاد القيمة الجدولية لإحصائية F عند درجات الحرية لكل من البسط والمقام، ومستوى معنوية معين.
8- مقارنة بين القيم المحسوبة لإحصائية F والقيمة المجدولة لها:
- فإذا كانت F المحسوبة أكبر من F الجدولية، نقبل الفرضية البديلة أي فرضية عدم ثبات تباين الأخطاء.
- أما إذا كانت F المحسوبة أقل من F الجدولية، يتم قبول فرضية العدم المتمثل في وجود افتراض ثبات تباين حد الخطأ.
لاحظ أن اختبار Goldfeld-Quandt لا يمكن تطبيقه إلا في حالة ما إذا كانت إحدى المتغيرات المستقلة هي المتسببة في وجود مشكلة عدم ثبات تباين حد الخطأ.
2- اختبار معامل ارتباط الرتب لـ Spearman
يقيس معامل ارتباط الرتب لـ Spearman درجة الارتباط بين مجموعتين من الرتب، وبفرض أن:
يمكن بيان كيفية استخدام معامل ارتباط الرتب لـ Spearman في اكتشاف عدم ثبات تباين حد الخطأ من خلال الخطوات التالية:
1- تطبيق طريقة المربعات الصغرى العادية فينتج ما يلي:
2- الحصول علي البواقي أو القيم المقدرة لحد الخطأ( ) من المعادلة التالية:
3- إهمال إشارة أي اخذ القيم المطلقة لـ ( )، ثم ترتيب كل من , طبقاً لتزايد أو تناقص الرتب.
4- تقدير معامل ارتباط الرتب لـ Spearman(rs) كما يلي:
حيث أن:
= الفرق بين كل رتبتين متناظرتين ( - ). N= عدد المشاهدات.
5- إيجاد القيمة المحسوبة لاختبار T كما يلي:
6- إيجاد القيمة الجدولية لاختبار T، ويتم ذلك بالبحث في جدول عند درجات حرية (N-K+1) ومستوي معنوية 5%.
7- مقارنة القيمة المحسوبة لاختبار T بالقيمة الجدولية:
- فإذا كانت قيمة T المحسوبة اكبر من قيمة T الجدولية، يتم قبول الفرض البديل القائل بان ويقال في هذه الحالة أن معنوية إحصائيا، ويدل هذا علي وجود مشكلة عدم ثبات تباين حد الخطأ.
- أما أذا كانت قيمة T المحسوبة اقل من قيمة T الجدولية، يتم قبول فرض العدم القائل فإن ، ويقال في هذه الحالة أن غير معنوية إحصائيا، ويدل علي وجود افتراض ثبات تباين حد الخطأ.
لاحظ انه أذا كان نموذج الانحدار يتضمن أكثر من متغير مستقل واحد، يتم تقدير rs بين وكل متغير مستقل علي حدة ثم القيام باختبار المعنوية الإحصائية بواسطة اختبار T للحكم علي وجود أو عدم وجود افتراض ثبات تباين حد الخطأ.
معالجة عدم ثبات تباين حد الخطأ Remedy of Heteroscedasticity من أبرز الطرق المستخدمة لتصحيح هذه المشكلة هي طريقة المربعات الصغرى العامة أو المرجحة (GLS) Generalized (or weighted) Least Squares وتقوم فكرة هذه الطريقة على إعطاء القيم ذات الانحراف الأقل عن خط الانحدار وزناً أكبر من القيم ذات الانحراف الأكبر في تقدير العلاقة محل الاعتبار ولذا فإن الوزن الذي تتخذه هو مقلوب الانحراف المعياري للبواقي et أي أن الوزن:
من الملاحظ أنه كلما قل تباين البواقي زاد الوزن Wt والعكس صحيح ومن ثم فإذا كان النموذج الأصلي هو:
فإن النموذج المعدل الذي يتم تقديره لتلاشى مشكلة عدم ثبات التباين إن وجدت هو:
وهى نفس الصيغة السابقة:
ثانياً: نتائج الدراسة التطبيقية:
أولا: تقدير النموذج باستخدام العينة الصغيرة
تم الاعتماد على البيانات الميدانية التي تم تجميعها خلال الموسم الزراعي 2022/2023 من بعض مُزارعي الترمس من مركز الحسينية بمحافظة الشرقية، حيث تم اختيار 25 مُزارع بطريقة عشوائية حيث تم تجميع الإنتاج وعناصر الإنتاج (كمية التقاوي، كمية السماد الفوسفات، عدد العمال، كمية مياه الري) للمحصول وذلك للكشف عن وجود مشكلة عدم ثبات تباين حد الخطأ حيث تبين من الشكل (1) حالة عدم ثبات التباين لحد الخطأ لبيانات العينة الصغيرة
المصدر: نتائج تحليل بيانات استمارة استبيان عينة البحث بمحافظة الشرقية موسم 2022/2023.
أولا:- اختبار بارك Park Test
بتطبيق طريقة المربعات الصغرى العادية لبيانات الإنتاج لمحصول الترمس Yوالتسميد X فينتج ما يلي:
ثم إيجاد القيم المقدرة لحد الخطأ( )، وباستخدام طريقة المربعات الصغرى العادية في إجراء انحدار علي فينتج ما يلي:
جدول(1) قيم وقيم
2.71
-1.68
2.71
4.81
2.71
4.66
2.71
4.77
2.71
4.97
3.00
4.85
3.00
4.78
3.00
4.68
3.00
4.06
3.00
4.26
3.22
4.97
3.22
4.93
3.22
3.64
3.22
3.97
3.22
4.81
3.40
5.05
3.40
4.71
3.40
5.47
3.40
4.31
3.40
5.43
3.56
5.44
3.56
5.08
3.56
4.13
3.56
5.70
3.56
5.32
المصدر: جمعت وحسبت من نتائج تحليل بيانات استمارة استبيان عينة البحث بمحافظة الشرقية موسم 2022/2023.
إيجاد القيمة المحسوبة لاختبار T بالنسبة ل والتي بلغت نحو 2.084، وبالكشف في جداول Tتبين أن القيمة الجدولية بلغت نحو 2.069، يتم قبول الفرض البديل القائل بان ويقال في هذه الحالة أن معنوية إحصائيا، ويدل هذا علي وجود مشكلة عدم ثبات تباين حد الخطأ.
ثانيا: اختبار Goldfeld-Quandt:
بافتراض النموذج التالي:
i=1,2,…..,N
وللكشف عن مشكلة عدم ثبات تباين الخطأ باستخدام اختبار Goldfeld-Quandt لابد من إتباع الخطوات التالية:
1- ترتيب مشاهدات X ترتيبا تصاعديا.
2- استبعاد المشاهدات الوسطى لكل من التسميد X والإنتاج Y،ثم تكوين مجموعتين من المشاهدات بحيث يكون لكل مجموعة على حدا معادلة خاصة بها كما يلي :
-المجموعة الأولى: وتتمثل في المشاهدات الخاصة بكل من التسميد X و الإنتاج Yالواردة قبل المشاهدات التي تم استبعادها، والمعادلة الخاصة بهذه المجموعة هي :
- المجموعة الثانية: وتتمثل في المشاهدات الخاصة بكل منX التسميد والانتاج Yالواردة بعد المشاهدات التي تم استبعادها، والمعادلة الخاصة بهذه المجموعة هي:
4-ثم الحصول على القيم المقدرة لحد الخطأ لإيجاد القيمة المحسوبة لإحصائية F لمقارنة بين القيم المحسوبة لإحصائية F والقيمة المجدولة لها :
جدول(2) قيم وقيم
0.006
0.618
3.686
0.046
8.880
0.343
14.592
0.000
7.182
1.241
2.958
2.509
0.608
1.402
31.136
0.389
14.592
4.477
0.672
1.732
المصدر: جمعت وحسبت من نتائج تحليل بيانات استمارة استبيان عينة البحث بمحافظة الشرقية موسم 2022/2023.
- فكانت F المحسوبة(6.61) أكبر من F (3.44) الجدولية، نقبل الفرضية البديلة أي فرضية عدم ثبات تباين الأخطاء (وجود مشكلة Heteroscedasticity).
ثالثاً: اختبار معامل ارتباط الرتب لـ Spearman
تقدير معامل ارتباط الرتب لـ Spearman(rs) كما يلي:
1- يتم ترتيب كل من x،e ترتيب تصاعدي
جدول(3) ترتيب قيم x وe ترتيب تصاعدي
مرتبة ترتيب تصاعديx
مرتبة ترتيب تصاعديe
15
0.432
15
6.172
15
7.272
15
7.622
15
7.872
20
8.422
20
8.622
20
10.272
20
10.362
20
10.522
25
10.872
25
10.922
25
11.072
25
11.072
25
11.322
30
11.772
30
11.972
30
11.972
30
12.522
30
12.672
35
14.272
35
15.122
35
15.172
35
15.422
35
17.272
المصدر: جمعت وحسبت من نتائج تحليل بيانات استمارة استبيان عينة البحث بمحافظة الشرقية موسم 2022/2023.
2- إيجاد رتبة كل من x ، e تبعا لتزايد أو تناقص الرتب
جدول(4) رتبة كل من x ، e
رتبة e
رتبة x
e
x
1
3
0.432
15
13.5
3
11.072
15
8
3
10.272
15
11
3
10.872
15
17.5
3
11.972
15
15
8
11.322
20
12
8
10.922
20
9
8
10.362
20
4
8
7.622
20
6
8
8.422
20
17.5
13
11.972
25
16
13
11.772
25
2
13
6.172
25
3
13
7.272
25
13.5
13
11.072
25
19
18
12.522
30
10
18
10.522
30
24
18
15.422
30
7
18
8.622
30
22
18
15.122
30
23
23
15.172
35
20
23
12.672
35
5
23
7.872
35
25
23
17.272
35
21
23
14.272
35
المصدر: جمعت وحسبت من نتائج تحليل بيانات استمارة استبيان عينة البحث بمحافظة الشرقية موسم 2022/2023.
جدول(5) رتبة كل من x ، e والفروق بين الرتب
رتبة e
رتبة x
d
d 2
1
3
2
4
13.5
3
-10.5
110.25
8
3
-5
25
11
3
-8
64
17.5
3
-14.5
210.25
15
8
-7
49
12
8
-4
16
9
8
-1
1
4
8
4
16
6
8
2
4
17.5
13
-4.5
20.25
16
13
-3
9
2
13
11
121
3
13
10
100
13.5
13
-0.5
0.25
19
18
-1
1
10
18
8
64
24
18
-6
36
7
18
11
121
22
18
-4
16
23
23
0
0
20
23
3
9
5
23
18
324
25
23
-2
4
21
23
2
4
المصدر: جمعت وحسبت من نتائج تحليل بيانات استمارة استبيان عينة البحث بمحافظة الشرقية موسم 2022/2023.
- تقدير معامل ارتباط الرتب لـ Spearman(rs) كما يلي:
- إيجاد القيمة المحسوبة لاختبار T كما يلي:
بمقارنة القيمة المحسوبة لاختبار T بالقيمة الجدولية والتي تقدر بنحو 2.069 تبين أن قيمة T المحسوبة اكبر من قيمة T الجدولية التي بلغت نحو 2.76، وبذلك يتم قبول الفرض البديل القائل بان ويقال في هذه الحالة أن معنوية إحصائيا، ويدل هذا علي وجود مشكلة عدم ثبات تباين حد الخطأ.
معالجة مشكلة عدم ثبات تباين حد الخطأ
يتم معالجة مشكلة عدم ثبات تباين حد الخطأ من خلال إجراء تحويل للنموذج الأصلي بطريقة المربعات الصغرى المرجحة (WLS) Weighted Least Squares، وتقوم هذه الفكرة على إعطاء القيم ذات الانحراف الأقل على خط الانحدار وزنا أكبر من القيم ذات الانحراف الأكبر كما هو موضح بالشكل (2)، وبحساب معادلة الانحدار بعد معالجة البيانات كما هو موضح بالجدول لبيانات الإنتاج لمحصول الترمس Yوالتسميد X ما يلي:
جدول(6) نتائج معالجة مشكلة عدم ثبات تباين حد الخطأ باستخدام برنامج Eviews
Dependent Variable: Y
Method: Least Squares
Included observations: 25
Weighting series: Y
Weight type: Inverse standard deviation (EViews default scaling)
Prob.
t-Statistic
Std. Error
Coefficient
Variable
0.0642
-1.944446
2.602311
-5.06005
C
0
9.643078
0.086256
0.831773
X
Weighted Statistics
17.48708
Mean dependent var
0.801705
R-squared
13.20448
S.D. dependent var
0.793084
Adjusted R-squared
4.965222
Akaike info criterion
2.788108
S.E. of regression
5.062732
Schwarz criterion
178.7915
Sum squared resid
4.992267
Hannan-Quinn criter.
-60.0653
Log likelihood
92.98894
F-statistic
0
Prob(F-statistic)
المصدر:برنامج Eviews.
المصدر: نتائج تحليل بيانات استمارة استبيان عينة البحث بمحافظة الشرقية موسم 2022/2023.
للتأكد من معالجة مشكلة عدم ثبات تباين حد الخطأ يتم الكشف باستخدام:
1- اختبار بارك Parak test من خلال القيم الجديدة لحد الخطأ ( ) التي تم الحصول عليها من المعالجة، وباستخدام طريقة المربعات الصغرى العادية تم إجراء انحدار علي كانت كالتالي:
وإيجاد القيمة المحسوبة لاختبار T بالنسبة ل والتي بلغت نحو 0.329 ، وبالكشف في جداول Tتبين أن القيمة الجدولية بلغت نحو 2.069، يتم قبول فرض العدم القائل فإن ، ويقال في هذه الحالة أن غير معنوية إحصائيا، ويدل علي وجود افتراض ثبات تباين حد الخطأ.
2- اختبار Goldfeld-Quandt من خلال القيم الجديدة لحد الخطأ ( ) التي تم الحصول عليها من المعالجة فكانت F المحسوبة(3.12) أقل من F المجدولية (3.44)، يتم قبول فرضية العدم المتمثل في وجود افتراض ثبات تباين حد الخطأ.
1- اختبار معامل ارتباط الرتب لـ Spearman(rs) تبين بمقارنة القيمة المحسوبة لاختبار T بالقيمة الجدولية والتي تقدر بنحو 2,069 تبين أن قيمة T المحسوبة أقل من قيمة T الجدولية، يتم قبول فرض العدم القائل فإن ، ويقال في هذه الحالة أن غير معنوية إحصائيا، ويدل علي وجود افتراض ثبات تباين حد الخطأ.
تم إجراء اختبارات الكشف علي وجود مشكلة عدم ثبات تباين حد الخطأ ما بين الإنتاج وعناصر الإنتاج (كمية التقاوي، كمية السماد الفوسفات، عدد العمال، كمية مياه الري) الخاصة بمحصول الترمس كلا علي حدا فتبين وجود مشكلة عدم ثبات تباين حد الخطأ في كمية السماد و كمية التقاوي وتم الاكتفاء بشرح علي عنصر واحد فقط كمثال لتوضيح كيفية الكشف عن المشكلة بالبيانات.
ثانيا: تقدير النموذج باستخدام العينة الكبيرة
تم الاعتماد على البيانات الميدانية التي تم تجميعها خلال الموسم الزراعي 2022/2023 من بعض مُزارعي الترمس من مركز الحسينية بمحافظة الشرقية، حيث تم اختيار 102 مُزارع بطريقة عشوائية حيث تم تجميع بيانا الإنتاج والتسميد للمحصول وذلك للكشف عن وجود مشكلة عدم ثبات تباين حد الخطأ حيث تبين من الشكل (3) حالة عدم ثبات التباين لحد الخطأ لبيانات العينة الكبيرة
المصدر: نتائج تحليل بيانات استمارة استبيان عينة البحث بمحافظة الشرقية موسم 2022/2023.
أولا:-الكشف باختبار بارك Park Test
بتطبيق طريقة المربعات الصغرى العادية لبيانات الإنتاج لمحصول الترمس Yوالتسميد X فينتج ما يلي:
جدول(7) قيم وقيم
lnx
lne2
العينة
lnx
lne2
العينة
lnx
lne2
العينة
2.995732
-0.8957
69
3.218876
-8.5374
35
2.70805
-0.61305
1
2.995732
0.362976
70
3.218876
-3.08356
36
2.70805
-5.49774
2
2.995732
2.741854
71
3.218876
3.520538
37
2.70805
-0.29237
3
2.995732
2.287809
72
3.218876
3.101074
38
2.70805
-0.61305
4
3.218876
-8.5374
73
3.218876
3.708216
39
2.70805
-0.35825
5
3.218876
-3.08356
74
3.218876
-1.76378
40
2.995732
-2.86258
6
3.218876
3.520538
75
3.218876
3.611982
41
2.995732
-0.8957
7
3.218876
3.101074
76
3.218876
4.41347
42
2.995732
0.362976
8
3.218876
-0.17985
77
3.218876
3.769892
43
2.995732
2.741854
9
3.401197
-4.39645
78
3.401197
0.92621
44
2.995732
2.287809
10
3.401197
1.272095
79
3.401197
3.519505
45
3.218876
-8.5374
11
3.401197
2.204544
80
3.401197
3.14181
46
3.218876
-3.08356
12
3.401197
2.664204
81
2.70805
4.765748
47
3.218876
3.520538
13
3.401197
-0.68217
82
2.70805
-0.35825
48
3.218876
-0.41159
14
2.70805
-5.49774
83
2.995732
-2.86258
49
3.218876
-0.17985
15
2.70805
-0.29237
84
2.995732
-0.8957
50
3.401197
-4.39645
16
2.70805
-2.66361
85
2.995732
0.362976
51
3.401197
1.272095
17
2.70805
-0.35825
86
2.995732
4.019379
52
3.218876
2.956835
18
2.995732
-2.86258
87
2.995732
3.992392
53
3.401197
2.664204
19
3.218876
-3.08356
88
3.218876
-8.5374
54
3.401197
1.994635
20
3.218876
3.520538
89
3.218876
-3.08356
55
3.401197
-0.68217
21
3.218876
3.101074
90
3.218876
3.520538
56
3.218876
3.769892
22
3.218876
3.708216
91
3.218876
3.101074
57
3.401197
0.92621
23
3.218876
-1.76378
92
3.218876
-0.17985
58
3.401197
4.111066
24
2.70805
-0.61305
93
3.218876
-3.08356
59
3.401197
3.14181
25
2.70805
-0.35825
94
3.218876
3.520538
60
2.70805
-5.49774
26
2.995732
-2.86258
95
3.218876
3.101074
61
2.70805
-0.29237
27
2.995732
-0.8957
96
3.401197
2.204544
62
2.70805
-0.35825
28
2.995732
0.362976
97
2.70805
0.124071
63
2.70805
-0.35825
29
2.995732
2.741854
98
2.70805
-5.49774
64
2.995732
-2.86258
30
2.995732
2.287809
99
2.70805
-0.29237
65
2.995732
-0.8957
31
3.218876
-8.5374
100
2.70805
-2.66361
66
2.995732
4.046007
32
3.218876
-3.08356
101
2.70805
-0.35825
67
2.995732
1.880796
33
3.218876
3.520538
102
2.995732
-2.86258
68
2.995732
1.783176
34
المصدر: جمعت وحسبت من نتائج تحليل بيانات استمارة استبيان عينة البحث بمحافظة الشرقية موسم 2022/2023.
ثم إيجاد القيم المقدرة لحد الخطأ( )، وباستخدام طريقة المربعات الصغرى العادية في إجراء انحدار علي فينتج ما يلي:
إيجاد القيمة المحسوبة لاختبار T بالنسبة ل والتي بلغت نحو 2.005، وبالكشف في جداول Tتبين ان القيمة الجدولية بلغت نحو 1.984، يتم قبول الفرض البديل القائل بان ويقال في هذه الحالة أن معنوية إحصائيا، ويدل هذا علي وجود مشكلة عدم ثبات تباين حد الخطأ.
معالجة مشكلة عدم ثبات تباين حد الخطأ
يتم معالجة مشكلة عدم ثبات تباين حد الخطأ من خلال اجراء تحويل للنموذج الاصلي بطريقة المربعات الصغرى المرجحة، وتقوم هذه الفكرة على إعطاء القيم ذات الانحراف الأقل على خط الانحدار وزنا أكبر من القيم ذات الانحراف الأكبر كما هو موضح بالشكل (4)، وبحساب معادلة الانحدار بعد معالجة البيانات كما هو موضح بالجدول لبيانات الإنتاج لمحصول الترمس Yوالتسميد X ما يلي:
جدول(8) نتائج معالجة مشكلة عدم ثبات تباين حد الخطأ باستخدام برنامج Eviews
Dependent Variable: Y
Method: Least Squares
Sample: 1 102
Included observations: 102
Prob.
t-Statistic
Std. Error
Coefficient
Variable
0.5922
-0.53745
1.602045
-0.86102
C
0
9.673094
0.069773
0.674916
X
14.25843
Mean dependent var
0.483388
R-squared
4.912464
S.D. dependent var
0.478222
Adjusted R-squared
5.390329
Akaike info criterion
3.54848
S.E. of regression
5.441799
Schwarz criterion
1259.171
Sum squared resid
5.411171
Hannan-Quinn criter.
-272.907
Log likelihood
93.56875
F-statistic
0
Prob(F-statistic)
المصدر:برنامج Eviews.
المصدر: نتائج تحليل بيانات استمارة استبيان عينة البحث بمحافظة الشرقية موسم 2022/2023.
للتأكد من معالجة مشكلة عدم ثبات تباين حد الخطأ يتم الكشف باستخدام:
1- اختبار بارك من خلال القيم الجديدة لحد الخطأ ( ) التي تم الحصول عليها من المعالجة، وباستخدام طريقة المربعات الصغرى العادية تم إجراء انحدار علي كانت كالتالي:
وإيجاد القيمة المحسوبة لاختبار T بالنسبة ل والتي بلغت نحو 1.961، وبالكشف في جداول Tتبين أن القيمة الجدولية بلغت نحو 1.984، يتم قبول فرض العدم القائل فإن ، ويقال في هذه الحالة أن غير معنوية إحصائيا، ويدل علي وجود افتراض ثبات تباين حد الخطأ.
تم إجراء اختبارات الكشف علي وجود مشكلة عدم ثبات تباين حد الخطأ الإنتاج وعناصر الإنتاج (كمية التقاوي، كمية السماد الفوسفات، عدد العمال، كمية مياه الري) الخاصة بمحصول الترمس فتبين وجود مشكلة عدم ثبات تباين حد الخطأ في كمية السماد الفوسفاتي وكمية مياه الري وتم الاكتفاء بشرح علي عنصر واحد فقط كمثال لتوضيح كيفية الكشف عن المشكلة بالبيانات.
الملخص:
يهدف البحث إلي دراسة طبيعة مشكلة عدم ثبات تباين حد الخطأ، أسبابه وآثاره وتطبيق أهم طرق الكشف عن عدم الثبات في البيانات المقطعية، وتم الاعتماد على البيانات الميدانية التي تم تجميعها خلال الموسم الزراعي 2022/2023 من مُزارعي الترمس بمحافظة الشرقية عن طريق استمارة استبيان أُعدت لهذا الغرض، حيث تم اختيار عينتين الأولي 25 مزارع والثانية 102 مُزارع بطريقة عشوائية في مركز الحسينية بمحافظة الشرقية، وقد تم التحليل باستخدام برنامج Eviews.
تم إجراء اختبارات الكشف علي وجود مشكلة عدم ثبات تباين حد الخطأ الإنتاج وعناصر الإنتاج (كمية التقاوي، كمية السماد الفوسفات، عدد العمال، كمية مياه الري) لمحصول الترمس فتبين وجود مشكلة عدم ثبات تباين حد الخطأ في كمية السماد وكمية التقاوي بالعينة 25 مزارع، بينما في حالة العينة 102 مزارع تبين وجود مشكلة عدم الثبات في كمية السماد الفوسفاتي وكمية مياه الري وتم الاكتفاء بشرح علي عنصر واحد(كمية السماد) فقط كمثال لتوضيح كيفية الكشف عن المشكلة بالبيانات.
فتبين في حالة العينة (25 مزارع) باستخدام اختبار بارك أن قيمة T المحسوبة بلغت نحو 2.084 وهي اكبر من القيمة الجدولية التي بلغت نحو 2.069، فيتم قبول الفرض البديل بوجود مشكلة عدم الثبات، وتم معالجة البيانات من خلال إجراء تحويل للنموذج الأصلي بطريقة المربعات الصغرى المرجحة فبلغت قيمة T المحسوبة نحو 0.329 وهي اقل من القيمة الجدولية فيتم قبول فرض العدم بوجود ثبات تباين حد الخطأ.
وفي حالة العينة (102مزارع) باستخدام اختبار بارك ان قيمة T المحسوبة بلغت نحو 2.005، وهي اكبر من قيمة T الجدولية التي بلغت نحو 1.984 فيتم قبول الفرض البديل بوجود مشكلة عدم الثبات، وبعد المعالجة بلغت قيمة T المحسوبة نحو 1.961 وهي اقل من قيمة T الجدولية فيتم قبول فرض العدم القائل بوجود ثبات تباين حد الخطأ، ويتضح من ذلك أن حجم العينة ليس له أي علاقة بوجود أو عدم وجود مشكلة عدم ثبات تباين حد الخطأ بالبيانات المقطعية.
التوصيات:
توصي الدراسة بضرورة اهتمام الباحثين بإجراء الاختبارات اللازمة للكشف عن مشكلة عدم ثبات تباين حد الخطأ وضرورة معالجتها قبل البدء في التحليل الإحصائي للحصول علي نتائج دقيقة ثم استخدام البيانات بالصورة المناسبة لطبيعة البيانات المقطعية.
References
1- جابر أحمد بسيوني & سالم الحاسية(2007)، الإحصاء التطبيقي، منشورات جامعة عمر المختارـ البيضاء.
2- جابر أحمد بسيوني (2014)، الإحصاء العام، دار الوفاء لدنيا الطباعة والنشر، الطبعة الأولي (رقم الإيداع: 24053/2013 الترقيم الدولي: 2-082-735-977-978)، الإسكندرية.
3- عبد القادر محمد عبد القادر عطية، الحديث في الاقتصاد القياسي بين النظرية والتطبيق،(2005)، الدار الجامعية، الإسكندرية.
4- وليد اسماعيل السينو، احمد محمد مشعل،(2003)، الاقتصاد القياسي التحليلي، دار مجدلاوي للنشر والتوزيع.
5- وليد إسماعيل السيفو، (2006)، أساسيات الاقتصاد القياسي التحليلي، الأهلية للنشر والتوزيع والطباعة- لبنان.
6-Andreas G. Klein , Carla Gerhard , Rebecca D. Büchner , Stefan Diestel & Karin Schermelleh-Engel.(2015). The Detection of Heteroscedasticity in Regression Models for Psychological Data,Psychological Test and Assessment Modeling, Volume 58, (4): 542-568.
7-Gujarati,D.N.(2004) Basic Econometrics, 4th Edition, the mc Grow-Hill Companies,new York, 387-426.
8- Kiefer, N. and Vogelsang, T. (2002a). Heteroskedasticity-autocorrelation robust testing using bandwidth equal to sample size. Econometric Theory, 18:1350–1366.
9- Kiefer, N. and Vogelsang, T. (2002b). heteroskedasticity-autocorrelation robust standard errors using the bartlett kernel without truncation. Econometrica, 70:2093–2095.
10- Kim, M. and Sun, Y. (2013). Heteroskedasticity and spatiotemporal dependence robust inference for linear panel models with fixed effects. Journal of Econometrics, 177:85– 108.
11- Rosopa, P. J., Schaffer, M. M., & Schroeder, A. M. (2013). Managing heteroscedasticity in general linear models. Psychological Methods, 18(3): 335-351.
12- Stanislaus S. Uyanto,(2022) Monte Carlo power comparison of seven most commonly used heteroscedasticity tests, Communications in Statistics - Simulation and Computation, 2065-2082
13- Sun, Y. (2013). A heteroskedasticity and autocorrelation robust f test using orthonormal series variance estimator. Econometrics Journal, 16:1–26