Abstract
Abstract
Discriminant Analysis has been widely used to classify data into subgroups based on certain criteria. The classification process depends on choosing any variable that shows a statistical significance, then use the selected variables to build the discriminant function. In order to investigate the statistical significance of the variables in our data, we used Roy-Bose procedure for finding confidence intervals and t-test, which is one of the popular variable-selection methods in discriminant analysis. In addition, some other variable-selection techniques has been employed, namely, Forward-Selection, Backward-Selection, and Stepwise-Selection methods, which are usually used to select variables in linear regression analysis. Furthermore, a principal component analysis has been carried out for the purpose of choosing the variables with high statistical significance. The selected variables have been used to build the discriminant function.
Keywords
Main Subjects
Highlights
1. The forward selection method is quite similar to the gradient selection method in regression analysis and discriminant analysis.
2. There is no significant difference between the Roy-Boss bounds of confidence method and the principal components, as the two methods proved significant for the variables (x4, x5, x6, x7, x8, x9, x10), and the only difference is the addition of the variable x12 by the principal components method.
3. It was noticed that the variables (x4, x5, x8) proved significant in all the methods used, and this is evidence that these variables are very important and have a great impact. And that the variables (x1, x2, x3) did not appear significant in all methods, which means that these variables are not important.
4. We note that all classification results are close and relatively few, which means the efficiency of the methods used.
Full Text
یعد التحلیل التمییزی أحد الإجراءات المهمة فی تحلیل متعدد المتغیرات Multivariate Analysis وذلک بالاستناد إلى مقاییس معینة وعلى خصائص المشاهدة التی لابد أن تتوافق مع خصائص المجتمع الذی ستنسب إلیه بدرجة اکبر من درجة توافقها مع أی مجتمع آخر. ویعد التحلیل التمییزی من الأسالیب الإحصائیة المهمة والذی یستخدم فی کثیر من مجالات الحیاة؛ فعلى سبیل المثال، تستخدم دوال التمییز لغرض الوقوف على مدى إمکانیة التنبؤ بحدوث الظواهر المختلفة اعتماداً على مقاییس محددة. کذلک یمکن استخدام هذه التقنیة لمعرفة المتغیرات التی تساهم فی التصنیف، وهی کما فی تحلیل الانحدار الذی لدیه استخدامین الوصف (التمییز) والتنبؤ (حمودات ،2005). ان من الافتراضات الخاصة بالتحلیل التمییزی یجب ان تکون المجامیع المدروسة تتوزع توزیع الطبیعی متعدد المتغیرات ،ففی حالة الدالة الممیزة الخطیة یشترط فیها ان تکون مصفوفة التباین والتباین المشترک متساویة للمجامیع کافة، ویتم استخدام الدالة الممیزة التربیعیة فی حالة عدم التساوی.(عکار،2008) . ان التحلیل التمییزی یختلف عن تحلیل الانحدار فی أن المتغیر المعتمد فی التحلیل التمییزی هو متغیر اسمی ( ) وهو من المتغیرات النوعیة ( ) بینما المتغیر المعتمد فی تحلیل الانحدار هو على الأکثر متغیر مستمر ( ) وهو من المتغیرات الکمیة ( ). مع ذلک، فإنه هنالک أوجها عمیقة من التشابه بین التحلیلین من ناحیة الهدف الأساسی للتحلیل، حیث أن کلا التحلیل یُستخدمان لوصف العلاقة بین المتغیر المعتمد والمتغیرات المستقلة وذلک من خلال نمذجة البیانات (الحمدانی ، 2014). ویستخدم التحلیل التمییزی فی مجالات متعددة، فعلى سبیل المثال یوظف التحلیل التمییزی فی مجالات الطب والزراعة والتعلیم وعلم الاجتماع والجغرافیة وغیرها من المجالات التطبیقیة. فعلى سبیل المثال فی مجال التعلیم، تستخدم دالة التمییز الخطیة فی معرفة مستوى کفاءة الأداء للطلبة وذلک بالاعتماد على درجات أو تقدیرات الطلبة فی مجموعة من الاختبارات؛ حیث یُمکِننا التحلیل التمییزی من معرفة مدى تأثیر الاختلاف فی البیئة والجنس ونوع التدریس (خصوصی، عام) على تفوق الطلاب وکفاءتهم. وکذلک فان القبول فی المدارس یمکن معالجته من خلال إیجاد ترکیبة خطیة من المقاییس (المؤشرات) والتی من خلالها نستطیع تحدید المعاییر الملائمة للقبول أو عدمه. أما فی علم الجغرافیة، فان الدالة الممیزة تعد الأسلوب الأکثر استخداما فی علوم الأرض من بین الأسالیب متعددة المتغیرات الأخرى فی دراسة مختلف الظواهر الجغرافیة (الزوبعی والمشهدانی، 1988).
2.التحلیل التمییزی Discriminant analysis یعد التحلیل التمییزی من الأسالیب الإحصائیة المهمة فی متعدد المتغیرات التی تهتم بتمیز بین مجموعتین أو أکثر من خلال إیجاد توافیق خطیة للمتغیرات التوضیحیة، حیث یعد التمییز والذی یسمى بدالة فیشر (Fisher) طریقة فعالة لنمذجة البیانات فیما لو تحققت فروض التحلیل. حیث یُشترط أن یکون توزیع المتغیرات التوضیحیة توزیعاً طبیعیاً، وأن المجامیع المصنفة لها مصفوفات تباین وتباین المشترک متساویة، وأیضا یشترط عدم وجود ارتباط بین المتغیرات التوضیحیة وعدم وجود قیم شاذة (حمودات،2005).
2-1 الافتراضات الخاصة بالتحلیل التمییزی
ان من الافتراضات الخاصة بالتحلیل التمییزی ان تکون المجامیع ذات توزیع طبیعی متعدد متغیرات فی حالة الدالة التمییزیة الخطیة یشترط فیها ان تکون مصفوفة التباین والتباین المشترک متساویة للمجامیع کافة ، کذلک یتطلب ان تکون حجم العینة کبیرة وان المجامیع المختلفة تتضمن على الأقل 20 مشاهدة لکل متغیر توضیحی وأیضا یشترط عدم وجود ارتباط بین المتغیرات التوضیحیة وعدم وجود قیم شاذة بینها( (Demosthenes, 2006
2-2 دالة التمییز الخطیة Linear Discriminant Function
هی الدالة التی یمکن من خلالها التمییز بین المجموعات ای بمعنی الفصل بین المشاهدات ووضع کل مشاهدة فی المجموعة التی تعود لها، وتعد الدالة التمییزیة نموذج ریاضی بالإمکان صیاغته من خلال مؤشرات عینة اختیرت بشکل عشوائی من مجموعتین مختلفتین وان هذه الدالة تمکننا من اختبار أی مفردة وتحدد المجموعة التی تعود إلیها. (الشکرجی والنعیمی، 2007). ویستخدم التحلیل التمییزی فی عملیة التوقع حیث یأتی الباحث بعدة متغیرات یتوقع أن تمیز بین المجتمعین المراد دراستهما لنحصل على دالة تمییزیة تستخدم فی تصنیف المشاهدات بین المجتمعین تسمى هذه الدالة بدالة فیشر أو الدالة الممیزة الخطیة لمجموعتین. نفترض بأن لدینا مجتمعین، المجتمع الأول یُخصص له الرقم (0)، والمجتمع الثانی یُخصص له الرقم (1)، کذلک لدینا n0، n1 التی تم اختیارها من کل مجتمع على التوالی , نفترض أن لدینا قیم مشاهدة لـ m من المتغیرات العشوائیة التی یمکن الاعتماد علیها بالتصنیف وهی X1 , X2 ,…, Xm لتکون الدالة التصنیفیة هی: (anderson,1985)
حیث أن:
: معلمات النموذج وتستخدم فی عملیة التصنیف.
m: عدد المتغیرات.
X : متجه المتغیرات.
علماً أن:
α= …(3)
حیث أن: هی التباین المجمع pooled variance تحسب من مصفوفة التباین والتباین المشترک .
… (4)
یمکن کتابة النقطة الفاصلة بین المجموعتین کما یلی :
(5)...
وهی النقطة الفاصلة بین المجموعتین فإذا کانت قیمة الدالة بعد تعویض قیم المفردة فیها اکبر من هذه النقطة إذن المفردة تعود للمجموعة الأولى أما إذا کانت قیمة الدالة اکبر من هذه النقطة إذن المفردة تعود للمجموعة الثانیة.(Zhang, 2000)
3.الطرائق المستخدمة فی اختیار المتغیرات للدالة التمییزیة
أن من أهم الأهداف عند إدخال عدداً من المتغیرات فی دراسة لظاهرة ما هو کیفیة اختیار مجموعة المتغیرات التوضیحیة المتضمنة فی النموذج، أی بمعنى کیفیة اختیار أفضل نموذج یتوصل إلى الهدف المنشود (الراوی، 1987). ومن هذه الطرائق:
3.1 حدود الثقة لـRoy -Bose
یتم استخدام حدود الثقة لروی- بوس لتعیین المتغیرات المهمة التی ستدخل فی الدالة، ویمکن تلخیص هذه الطریقة بالخطوات التالیة:
-1نجد قیمة F الجدولیة بالرجوع إلى جداول خاصة به:
... )6)
-2 تعیین قیمة T الجدولیة وکالآتی:
(7)...
-3 إیجاد Selection Vectorویرمز له بالرمز (a) وهو متجه غیر صفری، حیث یکون عدد هذه المتجهات بعدد المتغیرات التوضیحیة (m). حیث أن:
-4ثم بعد ذلک نجد حدود الثقة لروی-بوس وتکتب بالصیغة التالیة:
…(8)
.5 تکتب المتباینة
والقرار هو انه إذا احتوت المتباینة على الصفر یعنی عدم وجود أهمیة لذلک المتغیر أی أن المتغیر لا یختلف وسطه الحسابی فی کلا المجموعتین ، إما إذا لم تحتوی المتباینة على الصفر یعنی وجود أهمیة لذلک المتغیر.
3.2 اختبار الفرق بین متوسطی المجموعتین (اختبارt (
لاختبار هل ان الفرق معنوی بین متوسطی مجموعتین نستخدم اختبار (t) للمقارنة بین الأوساط الحسابیة، ، والفرضیة الخاصة باختبار (t) هی:
ویمکن حساب المختبر الاحصائی t حسب الصیغة التالیة:
… (9)
حیث أن: : التباین المجمع pooled variance للمجموعتین. :الوسط الحسابی للمجموعة i
وبمقارنة قیمة هذه الأحصاءة مع قیمة t الجدولیة بدرجة حریة (n1+n2-2) ومستوى معنویة (a/2) یتم معرفة المتغیر معنویاً أو غیر معنوی. (الراوی،1979)
33. التحلیل العاملی Factor Analysis
هو أسلوب إحصائی الغرض منه تبسیط الارتباطات بین مختلف المتغیرات الداخلة فی التحلیل من اجل الوصول إلى العوامل المشترکة التی تصف وتفسر العلاقة بین المتغیرات الداخلة فی التحلیل ومن طرق التحلیل العاملی طریقة المرکبات الرئیسیة.(دبدوب,1990)
3.3 1.المرکبات الرئیسیة Principal Component
ان تحلیل المرکبات الرئیسیة یستعمل لإیجاد مجموعة صغیرة من التراکیب الخطیة للتباینات وتکون غیر مترابطة مع بعضها وهذه التراکیب الخطیة تختار أعلى التباینات وان تحلیل المرکبات الرئیسیة فی حالة وحدات القیاس متشابهة للمتغیرات نستعمل القیم الأصلیة ،وعندما تختلف تحول الى القیم المعیاریة وبعدها یتم حساب مصفوفة الارتباط ثم إیجاد القیم الذاتیة والمتجهات الممیزة , والمرکبات الرئیسیة تعتبر تراکیب خطیة لــــ m من المتغیرات:
(10)...
حیث أن: PCij: القیمة i للمکون الرئیسی j. aij: قیم المتجهات الممیزة (aj) (Characteristic Vectors) وقد تسمى أیضاً Eigen Vector المرافقة للجذور الممیزة lj (Characteristic Roots) وقد تسمى Eigen Values للمصفوفة المستخدمة. یمکن إیجاد العلاقة (10) من خلال مصفوفة التباین المشترک أو مصفوفة الارتباط. وباستخدام أسلوب المصفوفات:
(11) ...
: تمثل مصفوفة المکونات الرئیسیة
: تمثل مصفوفة المتجهات الممیزة
X: تمثل مصفوفة المتغیرات التوضیحیة .( Aguilera, Escambia,2006)
تبدأ معادلة الانحدار بهذه الطریقة بدون أی متغیر توضیحی، ثم یتم اختیار المتغیرات التوضیحیة التی تدخل المعادلة واحداً تلو الأخرى ونتوقف عن الاختیار عندما تقل قیمة F المحسوبة الجزئیة عن قیمة معینة من F الجدولیة. ان المتغیر التوضیحی الذی یرشح للدخول فی الانحدار فی أی خطوة یتم تثبیته نهائیاً فی الانحدار إذا ما ثبت تأثیره المعنوی فی تلک الخطوة، فالمتغیر التوضیحی الأول الذی یدخل المعادلة هو المتغیر الذی له أعلى F محسوبة إما المتغیر الثانی الذی یضاف إلى المعادلة أعلاه هو المتغیر الذی له اعلى F جزئیة بوجود المتغیر الأول المنتخب بالخطوة الأولى وتزید عن (FIN) الجدولیة المعینة لتلک الخطوة. وهکذا نستمر بإضافة المتغیر الذی له أعلى F جزئیة عن FINإلى ان نصل إلى أعلى F جزئیة تقل عن FIN فعندئذ نتوقف عن الإضافة، وینتهی الحل بأخذ المتغیرات التوضیحیة فی الخطوة السابقة لتلک الخطوة (طیب، 2005).
یتم فی هذا الاختیار اختبار جمیع المتغیرات التوضیحیة فی معادلة الانحدار ثم نبدأ بحذف المتغیرات التوضیحیة ذات التأثیر غیر المعنوی واحداً بعد الأخر حتى نصل إلى الصیغة النهائیة التی تحتوی على المتغیرات ذات التأثیر المعنوی. أی ان المتغیر الأول الذی یحذف من بین جمیع المتغیرات التوضیحیة فی معادلة الانحدار هو المتغیر الذی له اقل قیمة F جزئیة والتی تکون اقل قیمة من قیمة Fout التی تنتخب قیمة لـ F جدولیه. إما اذا کانت اقل قیمة F جزئیة اکبر من F الجدولیةFout فنتوقف عن الحذف وتکون بذلک جمیع المتغیرات التی فی المعادلة هی متغیرات توضیحیة مهمة وذات تأثیر معنوی على متغیر الاستجابة Y. وبعد حذف المتغیر الاول نحسب قیم F الجزئیة لبقیة المتغیرات التوضیحیة ونحذف المتغیر الذی له F جزئیة التی تکون اقل من Foutالمعینة وهکذا لکل خطوة، ونتوقف عن الحذف فی المرحلة التی تکون قیم F الجزئیة اکبر من قیمة Foutالمعینة لتلک المرحلة (کاظم والدلیمی ،1988).
وهی طریقة تربط بین طریقتی الاختیار الأمامی والاختیار الخلفی، وهذه الطریقة تحتاج إلى قیمتین من قیم F الجدولیة هما FIN للاختیار الأمامی و Foutللحذف العکسی وخطواته:
الخطوة الأولى: نحسب قیمة F الجزئیة لکل متغیر توضیحی، ثم نختار أعلى F جزئیة ذات معنویة إحصائیة، وعند عدم وجود هکذا متغیر نوقف العملیات الإحصائیة ونتخذ قرار بعدم وجود أی متغیر مؤثر على الظاهرة.
الخطوة الثانیة: لاختیار المتغیر التوضیحی الثانی نعید الخطوة أعلاه وقبل أن نختار متغیراً توضیحیاً ثالثاً نجری الطریقة العکسیة لمعرفة أهمیة بقاء المتغیر الذی اختیر فی المرة الأولى وذلک لتحدید حذفه من المعادلة أو إبقاءه فیها، ویتم التوقف بإتباع خطوات هذه الطریقة عند عدم معنویة أی متغیر فی الاختیار الأمامی، وبهذا الأسلوب یمکن الاستمرار إلى أن نصل إلى النموذج النهائی (الراوی، 1979).
4.تصنیف البیانات classification of data
لنفرض ان لدینا عینة بحجم (n) وان عدد المشاهدات من النوع (0) هی n1 وان عدد المشاهدات من النوع (1) هی n2 وان لدینا بیانات من نوع ثنائی (binary) وکانت لدینا تصنیف البیانات کما مبین فی الجدول رقم (1) الآتی: (الهبیل,2013)
جدول رقم (1) یبین تصنیف البیانات
(1) |
(0) |
البیانات الثنائیة |
A12 |
A11 |
(0) |
A22 |
A21 |
(1) |
وتکون معاییر التصنیف بالشکل الآتی: دقة التصنیف تحسب بالشکل الآتی:
... (12)
وبالتالی یمکن حساب معیار خطأ التصنیف بالشکل الآتی:
... (13)
5.الجانب التطبیقی
تم اخذ البیانات من الموقع العالمی للبیانات ، حیث أن عدد المتغیرات التوضیحیة ( ) و بحجم عینة ( ) ، إما المتغیر المعتمد فمصنف إلى مجموعتین (المجموعة الأولى یرمز لها بالرمز 0) و(المجموعة الثانیة یرمز لها بالرمز1) ، تم تطبیق التحلیل التمییزی على هذه البیانات باستخدام برنامجی SPSS و R.
اختیار متغیرات الدالة التمییزیة: 1-5
قبل اختبار معنویة المتغیرات تم إجراء التحلیل الإحصائی للتعرف على عدد مشاهدات فی کل مجموعة:
المجامیع |
عدد المشاهدات |
المجموعة الأولى 0 |
56 |
المجموعة الثانیة 1 |
44 |
المجموع |
100 |
لغرض تشخیص المتغیرات المعنویة نلجأ إلى إیجاد حدود الثقة لـروی-بوس ولمعرفة معنویة أو عدم معنویة المتغیرات نطبق المعادلة (7) لإیجاد قیمة (T) ثم نجد حدود الثقة وذلک بتطبیق المعادلة (8) ، إذا احتوت حدود الثقة على الصفر معنى ذلک هو عدم وجود أهمیة لذلک المتغیر ،وهکذا یتم تطبیق هذه الطریقة على جمیع المتغیرات، والجدول رقم (2) یوضح معنویة أو عدم معنویة المتغیرات حیث أظهرت المتغیرات ( ) معنویتها بهذه الطریقة اذا کانت حدود الثقة لدیها لا تساوی الصفر .
الجدول (2) اختیار متغیرات الدالة التمییزیة باستخدام حدود الثقة لروی-بوس
المعنویة |
حدود الثقة لروی بوس |
المتغیرات |
غیر معنوی |
-0.07467<a1 <0.125111 |
|
غیر معنوی |
-6.41849<a2 <-1.202076 |
|
غیر معنوی |
-3.13536<a3<-1.059996 |
|
معنوی |
0.24619 <a4<1.06869 |
|
معنوی |
3.49555<a5 <2.044696 |
|
معنوی |
1.35870<a6 <2.5275201 |
|
معنوی |
2.975725<a7<3.546078 |
|
معنوی |
0.79253<a8<1.643743 |
|
معنوی |
0.55016 <a9 <1.360797 |
|
غیر معنوی |
2.982409<a10 <4.99863 |
|
غیر معنوی |
-0.129438<a11<0.083642 |
|
غیر معنوی |
-0.11501<a12<0.005873 |
تم استخدام اختبار t لاختبار معنویة المتغیرات ویتم ذلک عن طریق اختبار الفرضیة: وبالاعتماد على المعادلة (9) نستخرج قیمة t المحسوبة ونقارنها مع قیمة t الجدولیة تحت مستوى معنویة (0.05) ودرجات حریة (n1+n2-2) أی أن:
tab.t( ,n1+n2-2(= 1.96
ومن الجدول أدناه نلاحظ ان کل من المتغیرات , , ) ظهرت فیه القیمة المحسوبة اکبر من القیمة الجدولیة أی ترفض فرضیة العدم وتقبل الفرضیة البدیلة، إما باقی المتغیرات فقد تم إهمالها.
الجدول رقم (3) یبین نتائج اختبار t
-0.221 |
|
-0.469 |
|
-1.351 |
|
-3.410* |
|
-5.552* |
|
-1.431 |
|
-3.289* |
|
-10.874* |
|
-6.312* |
|
-5.597* |
|
-0.885 |
|
-1.468 |
نلاحظ فی الجدول رقم (4) أدناه أن تم تکوین 5 مرکبات رئیسیة، حیث کانت قیم الجذور الممیزة لهذه المرکبات اکبر من الواحد وکالاتی (3.094, 1.549, 1.317, 1.113, 1.010) على التوالی، إذ تم تمییز المتغیرات المؤثرة فی کل مکون رئیسی من خلال مصفوفة المتجهات الممیزة، ،حیث یتم اختیار هذه القیم عندما تکون اکبر او تساوی (0.5) حتى تکون ذات تأثیر معنوی، وبذلک تم اختیار المتغیرات ).
الجدول رقم (4): المرکبات الرئیسیة
تبدأ هذه الطریقة، کما أشرنا سابقا، بدون إی متغیر توضیحی، ویتم استبعاد القیم التی لیس لها تأثیر معنوی على النموذج. نلاحظ فی الجدول رقم 5 أدناه أنه تم ترشیح المتغیر ( ) فی الخطوة الأولى وفی الخطوة الثانیة تم اختیار المتغیر ( ) بالإضافة إلى المتغیر( فی الخطوة الثانیة. وفی الخطوة الثالثة والأخیرة تم إضافة المتغیر ( ). وبذلک تم اختیار المتغیرات ( ) المهمة فی بناء الدالة التمییزیة.
الجدول رقم (5):المتغیرات المعنویة بطریقة الاختیار الأمامی
ان طریقة الحذف العکسی هی عکس طریقة الاختیار الأمامی، تبدأ بکل المتغیرات التوضیحیة فی النموذج ویتم استبعاد المتغیر الذی لا یؤثر على النموذج. ویلاحظ من الجدول رقم 6 أدناه أنه فی الخطوة الأولى تم إدخال جمیع المتغیرات قید الدراسة وعددها 12 متغیراً وفی الخطوة الثانیة تم استبعاد المتغیر وفی الخطوة الثالثة تم استبعاد المتغیر وصولا إلى الخطوة الثامنة حیث تم اختیار المتغیرات ( ) التی أثبتت معنویتها وفقا لهذه الطریقة.
جدول رقم (6): المتغیرات المعنویة بطریقة الحذف العکسی
لتحدید أفضل المتغیرات المؤثرة على المتغیر المعتمد تبین ان هذه الطریقة مشابهة تماما لطریقة الاختیار الأمامی حیث تم اختیار المتغیرات ( ) المهمة فی بناء الدالة التمییزیة.
5-2 بناء الدالة التمییزیة :
بعد التعرف على المتغیرات المهمة والتی أظهرت معنویتها فی جمیع الطرائق سوف نقوم باستخدامها فی بناء الدالة التمییزیة:
1 . التحلیل التمییزی بالاعتماد على اختبار
یتم بناء الدالة التمییزیة فی روی- بوس بالاعتماد على المتغیرات التی اظهرت معنویتها ویتم ذلک حسب المعادلة:
سوف نقوم بإجراء التحلیل التمییزی على جمیع الطرائق المذکورة أعلاه:
2. التحلیل التمییزی بالاعتماد على اختبار t
تم حساب الدالة التمییزیة اعتمادا على المتغیرات(x4,x5,x7,x8,x9,x10) التی تم اختبارها باختبار t.
ومن خلال قیمة (α) یتم بناء الدالة التمییزیة بالاعتماد على متغیرات المعنویة لاختبار t
3.التحلیل التمییزی بالاعتماد على المرکبات الرئیسیة
تم حساب الدالة التمییزیة اعتمادا على المتغیرات(x4,x5,x6,x7,x8,x9,x10,x11)
وفی طریقة الاختیار الأمامی کانت الدالة التمییزیة لها:
α = 9 +0.0267 +0.4229
5. التحلیل التمییزی بالاعتماد على أسلوب الحذف العکسی
وفی طریقة الاختیار العکسی تم تکوین الدالة التمییزیة کالاتی:
+1.2714
6. التحلیل التمییزی بالاعتماد على الانحدار المتدرج
وفی طریقة الاختیار التدریجی تبین ان هذه الطریقة مشابهة تماما لطریقة الاختیار الأمامی کانت الدالة التمییزیة لها:
9 +0.0267 +0.4229
من الجدول أدناه نلاحظ فی الدالة التمییزیة لجمیع المتغیرات ان النسب المئویة لدقة التصنیف تعنی کم من البیانات صنفت ضمن المجموعة الأولى او المجموعة الثانیة او صنفت بشکل خاطئ لمشاهدات المتغیر المعتمد ومن خلال الجدول (7) فی طریقة الروی بوس نجد ان 47 مشاهدة صنفت بشکل صحیح من مجموع 56 مشاهدة صنفت ضمن المجموعة الاولى وان 41 مشاهدة من مجموع 44 صنفت على صنفت ضمن المجموعة الثانیة وان دقة التصنیف بلغت 88.0% وهذا یعنی ان احتمال خطأ التصنیف 12.0% ، وفی اختبار t نجد دقة التصنیف بلغت 85.0% وهذا یعنی ان احتمال خطأ التصنیف 15.0% , وفی المرکبات الرئیسیة بلغت دقة التصنیف الصحیحة 87.0% وهذا یعنی ان احتمال خطأ التصنیف 13.0%, وفی طریقة الاختیار الامامی وطریقة الانحدار المتدرج نجد دقة التصنیف بلغت 86.0% وهذا یعنی ان احتمال خطأ التصنیف 14.0% , وفی طریقة الحذف العکسی دقة التصنیف بلغت 85.0% وهذا یعنی ان احتمال خطأ التصنیف 15.0% , نلاحظ ان نسبة الخطأ لجمیع الطرائق متقاربة وقلیلة نسبیا وهذا دلیل على کفاءة الطرائق المستخدمة .
جدول (7): یبین نسب التصنیف
الاستنتاجات:
1. طریقة الاختیار الأمامی مشابهة تماما لطریقة الاختیار المتدرج فی تحلیل الانحدار والتحلیل التمییزی.
2. لا یوجد اختلاف کبیر بین طریقة حدود الثقة لروی-بوس وبین المکونات الرئیسیة حیث ان الطریقتین اثبتت معنویة المتغیرات( ) والاختلاف الوحید هو اضافة المتغیر بطریقة المرکبات الرئیسیة.
3. لوحظ ان المتغیرات (x4,x5,x8) أثبتت معنویتها فی جمیع الطرائق المستخدمة وهذا دلیل على ان هذه المتغیرات مهمة جداً وذات تأثیر کبیر. وان المتغیرات (x1,x2,x3) لم تظهر معنویتها فی کل الطرائق وهذا یعنی ان هذه المتغیرات غیر مهمة .
4.نلاحظ ان جمیع النتائج التصنیف متقاربة وقلیلة نسبیا یعنی ذلک کفاءة الطرائق المستخدمة.