• Register
  • Login
  • العربیة

IRAQI JOURNAL OF STATISTICAL SCIENCES

  1. Home
  2. Statistical Analysis of Ordinal Response Variable: A Comparative Study

Current Issue

By Issue

By Author

By Subject

Author Index

Keyword Index

About Journal

Aims and Scope

Editorial Board

Publication Ethics

Indexing and Abstracting

Related Links

FAQ

Peer Review Process

Journal Metrics

News

Statistical Analysis of Ordinal Response Variable: A Comparative Study

    Authors

    • Liqaa Yaseen Alhamdany 1
    • Zaid Salah 2

    1 Department of Statistics and Informatics, College of Computer Science and Mathematics, University of Mosul, Mosul, Iraq

    2 Lecturer / College of Computer Science and Mathematics / Department of Statistics and Informatics / University of Mosul.

,

Document Type : Research Paper

10.33899/iqjoss.2022.176204
  • Article Information
  • References
  • Download
  • Highlights
  • Full Text
  • Export Citation
  • Statistics
  • Share

Abstract

Response variables in biological phenomena vary between three types: numerical response variables, ordinal categorical response variables, and nominal categorical response variables. In statistical studies, handling ordinal variables varies in accordance with the perspective of the statistical approach to the response variable. Ordinal variables can be adopted as nominal categorical variables, which neglect the ordinal property of the categories. Ordinal variables can also be treated.
as an ordinal categorical variable (discrete variable), in which case the ranking information can be utilized in establishing the predicted models. In this study, the most important statistical methods that can be used to analyze data with an ordinal response variable have been investigated. Among these methods are the Multiple Regression Method, and The Ordinal Logistic Regression Method. The mechanism of building models and parameter estimations were theoretically exhibited, as well as reading the statistical significance of the regression coefficients in all the models in the study. The application was carried out on a real sample of patients with osteoporosis. Where multiple models were built to determine the most important factors affecting the likelihood of developing the disease. The best model was diagnosed according to the Akaike Information Criterion (AIC) and the Bayesian Information Criterion (BIC). The results of the statistical analysis demonstrated the superiority of the ordinal logistic regression model over the multiple linear regression model in its explanation of the relationship between the response variable and the covariates.

Keywords

  • Ordinal Response Variable
  • Multiple Regression
  • Ordinal Logistic Regression
  • Categorical Variables

Main Subjects

  • Mathematical Statistics
  • Probability Theory

Highlights

Ba
When the interest is in a specific range of data related to the response variable, converting the continuous variable into a categorical variable (ordinal or nominal) gives preference and accuracy for diagnosing and interpreting the relationship between the explanatory variables and the dependent variable compared to the case of adopting it as a continuous variable. This is clear by comparing the results of this study with international studies conducted on osteoporosis.
sed on the foregoing, we note the compatibility of the three models in diagnosing the direction of the relationship (positive-negative) between the explanatory variables and the dependent variable. It is also noted that it conforms to what is internationally recognized in the field of medical studies related to osteoporosis. Despite the compatibility of the three models in determining the direction of the relationship, preference tends in favor of the ordinal logistic model, because it does not require prior assumptions regarding the distribution of errors, and also because of its superiority in the aforementioned comparison criteria. This indicates the preference of converting continuous variables into ordinal categorical variables before analyzing them.
On the other hand, the method of ordinal logistic regression is superior to other known methods in modeling data that include an ordinal response variable. It was also noted that the accuracy of diagnosing the relationship between the categorical explanatory variables and the ordinal dependent variable is affected by the number of repetitions in the intersection tables between each explanatory variable with the dependent variable, and this explains the reason for the non-significance (or confusion) of the relationship of some explanatory variables, which previous studies have proven to actually affect osteoporosis.

Full Text

  1. المقدمة  Introduction

یعد تحلیل الانحدار رکناً أساسیاً من أرکان علم الإحصاء، وأسلوب مهم من أسالیب الإحصاء التطبیقی عند دراسة بعض الظواهر الاقتصادیة أو الاجتماعیة ویمکن استخدام الطرائق الإحصائیة أینما وجد البحث العلمی سواء کان فی مجال الاقتصاد أم فی الطب أم فی غیرها من المجالات (کاظم، 1988(. وأن الانحدار المتعدد یحقق اغلب اهداف البحث العلمی لتحلیل البیانات ووصف العلاقة الدالیة بین المتغیرات الا أنه یکون غیر دقیق فی تحدید وتفسیر العلاقة بین متغیر الاستجابة مما ادت الحاجة الى تطویر اسالیب احصائیة لها قوة الانحدار المتعدد فی التوصل الى افضل المعادلات توفیقا وکذلک تعالج تعذر مشکلة تطبیق الانحدار المتعدد الخطی وغیر الخطی فی حالة التی یکون متغیر الاستجابة من النوع الفئوی (اسمی)، وذلک لعدم توفر فروض تحلیل الانحدار المتعدد. أما فی الحالات التی یکون فیها المتغیر المعتمد من النوع الرتبی (فئوی کمی)، فبالامکان استخدام اسلوب الانحدار المتعدد الخطی أو اللاخطی، لکن مع ضرورة توفر شروط محددة فی هیکلیة والتوزیع التکراری للمتغیر المعتمد (Kutner, et. al.; 2004). ولقد ظهرت العدید من نماذج الانحدار غیر الخطی التی تتعامل مع البیانات رتبیة الاستجابة، ومنها أنموذج الانحدار اللوجستی الرتبی (Ordinal Logistic Regression)، والذی سیکون محور الرئیسی فی بحثنا هذا.

وتکمن مشکلة البحث فی إیجاد افضل أنموذج ریاضی یلائم البیانات اذا کان لدینا مجموعة من البیانات یکون فیها متغیر الاستجابة ( ) متغیر رتبی. ومع أن تحلیل الانحدار یحقق أغلب اهداف البحث العلمی فهناک أسباب عدیدة لعدم ملاءمة أنموذج الانحدار الخطی وأنموذج الانحدار اللوجستی الثنائی عندما یکون متغیر الاستجابة من النوع الرتبی.

  1. هدف البحث

لذلک یهدف هذا البحث الى تحدید الاسلوب الاحصائی الأمثل لتحلیل ونمذجة البیانات التی یکون فیها متغیر الاستجابة من النوع الرتبی وذلک بتحلیلها ومقارنة النتائج. ومن الأسالیب الاحصائیة التی من الممکن توظیفها لتحلیل هکذا نوع من البیانات هی اسلوب الانحدار الخطی  المتعدد، واسلوب الانحدار اللوجستی الرتبی. حیث یهدف البحث لمقارنة النمذجة الإحصائیة بالاعتماد على الطریقتین المذکورتین آنفاً.

  1. انواع المتغیرات

فی علم الإحصاء، هنالک نوعین من المتغیرات: النوع الاول هو المتغیرات الکمیة وهی المتغیرات التی یمکن عدها، وتکون إما متقطعة أو مستمرة. والنوع الثانی هو المتغیرات الفئویة. وعندما یکون هنالک فئتین فقط فی المتغیر الفئوی فعندئذٍ یعرف بأنه متغیر ثنائی. ویمکن التعبیر عن المتغیرات الفئویة الثنائیة ریاضیا باستخدام متغیر دلیلی indicator variable، حیث یتم ترمیز قیم المتغیر الثنائی بالعددین 0 و 1. ویمکن أن یحتوی المتغیر الفئوی على ثلاثة فئات مختلفة فأکثر، وعندها یرمز باستخدام تقنیة المتغیرات الوهمیة. وتکون المتغیرات الفئویة على نوعین: النوع الاول المتغیرات الاسمیة، وفیه تکون المشاهدات فئویة غیر رتبیة، مثلا دراسة تأثیر التداخل الجینی البشری على لون الشعر (اسود، اشقر، بنی، احمر، أبیض). والنوع الثانی المتغیرات الرتبیة، وفیه تکون فئات المتغیر الفئوی قابلة للترتیب، مثلا دراسة تأثیر بعض العوامل البیئیة والحیویة على مستوى ضغط الدم لدى الانسان (منخفض، طبیعی، مرتفع) (Agresti, 2003) .

  1. الأسالیب الإحصائیة لتحلیل متغیر الاستجابة الرتبی:

بالامکان توظیف الطرائق الاحصائیة الاخرى لتحلیل المتغیرات الرتبیة، وذلک بالرغم من وجود بعض المحددات التی تتعلق بفروض التحلیل. وعادة ما یلجأ الباحثون الى مقارنة الطرق المتاحة فیما بینها للوصول الى الطریقة المثلى لتحلیل العینة الخاصة بهم. وتختلف الطریقة الاحصائیة باختلاف منظورنا الى متغیر الاستجابة، بغض النظر عن حقیقة کونه مستمراً أم فئویاً. سنوضح فی الفقرات الآتیة الخیارات المتاحة للباحثین فی تعاملهم مع المتغیرات الرتبیة، فضلاً عن تحدید الایجابیات والسلبیات الممکنة لکل حالة (Lall, 2005).

3.1. المتغیر الرتبی کمتغیر فئوی اسمی متعدد الفئات:

أحد خیارات التعامل مع المتغیر الرتبی هی اعتباره متغیراً اسمیاً متعدداً للفئات. وینطوی على ذلک إهمال الطبیعة الرتبیة لفئات المتغیر قید الاهتمام. ویکون هذا الفرض منطقیا فی بعض الاحیان، فعلى سبیل المثال عندما یکون هناک عدد قلیل من الفئات ولا یکون ترتیب الفئات ذات أهمیة محوریة فی مشکلة البحث. أهم میزة لهذا النهج هو عدم إنتهاک فرضیات التحلیل، خصوصا فی حال کون حجم العینة مناسب لتطبیق الإجراءات الاحصائیة. هناک العدید من الخیارات لتحلیل المتغیرات الاسمیة، حیث یمکن استخدام اختبار مربع کای للاستقلالیة بین متغیر الاستجابة والمتغیرات التوضیحیة بعد تبویبها لتشخیص العلاقة بین الاستجابة والتنبوء. ویمکن ایضا توظیف اختبار Cochran–Mantel–Haenszel test (CMH)، وهو اسلوب لاختبار العلاقة بین متغیر الاستجابة الاسمی والمتغیرات التوضیحیة الفئویة. کلا الاختبارین المذکورین یعتمدان على تکوین جدولة تقاطعیة cross tabulation لبیانات متغیری الاستجابة والتوضیحی. کما یمکن استخدام الانحدار اللوجستی متعدد الفئات Polytomous Logistic Regression، والذی لا یتطلب وجود أی نوع من القیود على متغیر الاستجابة. ویتمیز الاجراء الأخیر عن سابقیه فی کون أن التحلیل ینمذج العلاقة بین متغیر الاستجابة وجمیع المتغیرات التوضیحیة فی آن واحد. ویترتب على معاملة متغیر الاستجابة الرتبی کمتغیر اسمی فقدان المعلومات الخاصة بالترتیب، مما قد یؤدی الى بناء استدلالات غیر دقیقة (Ananth & Kleinbaum, 1997; Scott, et. al., 1997).

3.2. المتغیر الرتبی کمتغیر ثنائی:

یمکن معاملة المتغیر الرتبی متعدد الفئات کمتغیر ثنائی وذلک بعد دمج عدد من الفئات وخفض عددها الى فئتین فقط. وفی هذه الحالة یمکن استخدام الانحدار اللوجستی الثنائی لنمذجة العلاقة بین متغیر الاستجابة والمتغیرات التوضیحیة. ویکون هذا الاجراء مقبولا غالباً عندما یکون ترتیب الفئة التی تصنف على أنها الحالة الطبیعیة (أو السیطرة) فی وسط الفئات الأخرى، وکان اهتمام الدراسة مرکزاً فی أحد الاتجاهین غیر الطبیعیین. ورغم مقبولیة هذا الاسلوب فی بعض الأحیان، إلا أنه یتسبب فی ضیاع معلومات الترتیب الفئوی، وکذلک صعوبة تحدید نقطة القطع cut-point لتحدید الفئات الجدیدة. وهذا بالتأکید سیؤدی إلى عدم دقة تمثیل العلاقة بین المتغیرات قید الدراسة (Strömberg 1996).

3.3. المتغیر الرتبی کمتغیر کمی:

الخیار الآخر المتاح فی التعامل مع المتغیر الرتبی هو اعتباره متغیراً کمیاً. وفی هذه الحالة یتم التعامل مع متغیر الاستجابة الفئوی إما کمتغیر کمی مستمر، أو کمتغیر کمی متقطع. وفی کلتا الحالتین یتم الاحتفاظ بالخاصیة الرتبیة لبیانات المتغیر قید الاهتمام. ففی الحالة الأولى، یصار إلى اعتبار أن المتغیر قادم من توزیع مستمر ومتناظر، وذلک لضمان توفر فرضیة التوزیع الطبیعی لبیانات متغیر الاستجابة. ویتطلب هذا الاجراء توفر عینة بحجم کبیر نسبیاً، وکذلک الحال بالنسبة لعدد الفئات. فکلما زادت الفئات، کلما اقترب سلوک المتغیر الرتبی من المتغیر المستمر. ویفضل أیضا أن تکون المسافات بین الفئات متساویة، وذلک لتلافی حدوث مشکلة الالتواء فی توزیع متغیر الاستجابة (Armstrong et al., 1989). وفی هذه الحالة یمکن توظیف اسلوب الانحدار المتعدد (الخطی وغیر الخطی) لنمذجة العلاقة بین المتغیرات. وأیضاً یمکن استخدام تحلیل الاتجاه Trend Analysis لاستقصاء العلاقة بین متغیر الاستجابة والمتغیرات التوضیحیة (Siegel, 1988). أما فی حال اعتبار المتغیر الکمی متقطعاً، فعندئذٍ یمکن استخدام الانحدار اللوجستی الرتبی Ordinal Logistic Regression لتوصیف العلاقة بین المتغیرات. ویعد أنموذج الانحدار اللوجستی الرتبی أحد نماذج الانحدار اللوجستی متعددة الفئات، مع الأخذ بنظر الاعتبار الطبیعیة الرتبیة لفئات متغیر الاستجابة، مما یعطی أفضلیة نظریة لهذا الاسلوب مقارنة بالاسالیب الأخرى. (Ananth & Kleinbaum, 1997; Agresti, 2003).

  1. الانحدار الخطی المتعدد:

یعرف أنموذج  الانحدار الخطی المتعدد بأنه عملیة تقدیر العلاقة الخطیة بین متغیر استجابة واحد مع عدد من المتغیرات  التوضیحیة )الراوی، 1987(. وهدف الانحدار الخطی المتعدد هو استخدام العلاقة بین متغیر الاستجابة والمتغیرات التوضیحیة للتنبؤ أو توضیح سلوک متغیر الاستجابة.

ومعادلة الانحدار الخطی المتعدد التی تحوی على  من المتغیرات التوضیحیة تکون بالشکل الآتی:

   

 

حیث أن  تمثل المشاهدة  للمتغیر المعتمد،  تمثل المشاهدة  للمتغیر التوضیحی ،  الحد الثابت،  معامل الانحدار الخاص بالمتغیر التوضیحی ، وأن  تمثل القیمة  للخطأ العشوائی، ویفترض أنه یتوزع توزیعا طبیعیا مستقلاً ومتماثلاً بمتوسط صفر وتباین ثابت. ویمکن کتابة المعادلة (1) بدلالة المصفوفات:

   

حیث أن  یمثل متجه الاستجابة،  تمثل مصفوفة البیانات،  یمثل متجه المعالم، و  یمثل متجه الاخطاء العشوائیة [الراوی، 1987].

4.1.          تقدیر متجه معالم الانحدار الخطی المتعدد

یمکن إیجاد مقدر متجه معالم الانحدار الخطی المتعدد وفقاً المربعات الصغرى الاعتیادیة  من خلال اشتقاق مجموع مربعات الاخطاء الموضح فی المعادلة (3) بالنسبة لکل معلمة من معالم أنموذج الانحدار الخطی المتعدد ومن ثم الحل بالنسبة لـ :

   
   

ومنها نحصل على مقدر متجه معالم الانحدار الخطی المتعدد، وکالآتی:

   

علما أن طریقة الامکان الأعظم فی التقدیر تعطی الصیغة الموضحة فی المعادلة (5) نفسها، وذلک بالاعتماد على فرضیة التوزیع الطبیعی المستقل والمتطابق للأخطاء العشوائیة.

  1. الانحدار اللوجستی:

یستخدم الانحدار اللوجستی لنمذجة العلاقة بین متغیر معتمد واحد کمی او نوعی وعدد من المتغیرات التوضیحیة. مع ذلک، فإن الانحدار اللوجستی غالبا ما یستخدم لنمذجة البیانات التی تحوی على متغیر استجابة نوعی، أو ما یسمى بمتغیر الاستجابة الفئوی، وتحدیدا متغیر الاستجابة الثنائی، وحینها یسمى بالانحدار اللوجستی الثنائی. علما أن الانحدار اللوجستی یمکن أن یستخدم لنمذجة البیانات التی تحوی على متغیر استجابة فئوی ذات فئات متعددة، وعندها یسمى بالانحدار اللوجستی المتعدد. ومن نماذج بالانحدار اللوجستی المتعدد هو أنموذج الانحدار اللوجستی الرتبی، والذی یفترض أن متغیر الاستجابة عبارة عن متغیر فئوی ذات فئات قابلة للترتیب.

5.1.          الانحدار اللوجستی الثنائی:

لنفرض أنه لدینا متغیر الاستجابة  من النوع الثنائی، أی أن قیم متغیر الاستجابة تکون (1,0). عندئذٍ تکون صیغة أنموذج الانحدار اللوجستی الثنائی کالآتی:

   

حیث أن  یمثل متغیر الاستجابة،  یمثل الصف  من مصفوفة البیانات ،  یمثل متجه معالم الانحدار، وأن  یمثل الخطأ العشوائی الخاص بالمشاهدة ، ویتوزع بمتوسط صفری وتباین ثابت.

ویعتبر  وفقا للانحدار اللوجستی الثنائی بأنه متغیر عشوائی یتوزع وفقا لتوزیع برنولی بمعلمة ، والتی تمثل توقع . وبذلک تکون دالة الاستجابة اللوجستیة الثنائیة کالآتی:

   

إذن نحن نقدر احتمالیة أن ، ولیس قیمة  نفسها (Kutner, et. al., 2004).

5.2.          الانحدار اللوجستی الرتبی:

لنفرض أنه لدینا متغیر الاستجابة  من النوع الفئوی یحتوی على  من الفئات القابلة للترتیب. یتم إعطاء رتب لفئات المتغیر  وفقا لطبیعة المتغیر والفئات الخاصة به. وبذلک تکون القیم الممکنة لمتغیر الاستجابة مرتبة بشکل تصاعدی ابتداءً من العدد 1 ولغایة العدد . وبما أن فئات متغیر الاستجابة قابلة للترتیب فعلیه سیتم حساب دالة الاستجابة اللوجستیة الرتبیة وفقاً للاحتمالیة التراکمیة کالآتی:

   

وذلک بفرض أن المتغیر  یعتمد على  من المتغیرات التوضیحیة. حیث أن . لاحظ أن ، وذلک لکون أن  تمثل العدد الأکبر فی الترمیز لفئات متغیر الاستجابة الرتبی. وتمثل  معلمة المقطع لکل فئة من فئات متغیر الاستجابة. وأن  یمثل متجها صفیا لقیم المتغیرات المستقلة عند المشاهدة ، وأن  یمثل متجه معاملات المتغیرات التوضیحیة.

وبذلک یکون لدینا  من دوال الاستجابة اللوجستیة الرتبیة، وتختلف هذه الدوال فیما بینها باختلاف معلمة المقطع فقط، فیما تکون باقی المعالم الخاصة بالمتغیرات التوضیحیة ثابتة فی جمیع دوال الاستجابة. وبتطبیق تحویل اللوجیت على المعادلة(8)  نحصل على (Agresti, 2003):

   

حیث یطلق على المعادلة (9) أعلاه بلوغارتیم أرجحیة odds کون أن .

5.2.1.                 تقدیر معالم أنموذج الانحدار اللوجستی الرتبی:

لاحظ أن کل فئة من فئات متغیر الاستجابة تعامل کمعاملة متغیر ثنائی عند احتساب الارجحیات. ولتوضیح ذلک نفرض أن:

 

عندئذ یمکن کتابة احتمالیة حدوث  من خلال الاحتمالات التراکمیة وکالآتی:

حیث أن . لاحظ أن  و .

ویمکن التعبیر عن الاحتمالیة أعلاه بدلالة الاحتملات الخاصة بالقیم الأخرى للمتغیر :

   

وبما أن الاحتمالات المذکورة أعلاه یمکن کتابتها بدلالة الانموذج اللوجستی الموضح فی المعادلة(8) وذلک بعد إعادة صیاغتها کالآتی

   

علیه، یکون لوغارتیم دالة الامکان کالآتی:

   

وبالتعویض بـ  و ، والتعابیر المشتقة لـ ، وکما موضح فی المعادلتین 10 و 11  نحصل على الصیغة النهائیة للوغارتیم دالة الامکان:

   

وبذلک یمکن الحصول على مقدرات الامکان الاعظم  بحل منظومة المعادلات اللاخطیة الآتیة عددیاً، علما أن عدد المعدلات اللاخطیة هو :

 

حیث أن ، مع ملاحظة أن:

 

 

 

حیث أن .

5.2.2.                 المدلول الإحصائی لمعاملات الانحدار اللوجستی الرتبی:

یکون تفسیر المدلول الاحصائی لمعاملات الانحدار اللوجستی الرتبی مختلفا عن مفهومه فی الانحدار الخطی والذی یتمثل بالمیل أو التغییر الحاصل فی الاستجابة عند زیادة المتغیر التوضیحی بوحدة واحدة. وهنا یکون التفسیر معقدا نسبیا ویتطلب فهما لموضوع الأرجحیات odds الخاصة بکل متغیر توضیحی. حیث أن الأرجحیات تحسب کالآتی:

   

وبالاعتماد على المعادلة (9)، وبفرض أن جمیع المتغیرات التوضیحیة ثابتة باستثناء المتغیر ، حیث أنه یزداد بوحدة واحدة فقط، عندئذٍ یمکن القول بأن:

   

أی أن معامل الانحدار اللوجستی الرتبی للمتغیر المعتمد  على المتغیر التوضیحی  یمثل لوغارتیم نسبة الأرجحیاتlog of odds ratio (OR). وبذلک تکون نسبة الأرجحیات المقدرة کالآتی:

   

فإذا کانت نسبة الأرجحیات المقدرة أکبر من 1، فذلک یعنی أن أرجحیة أن تکون  تزداد کلما زادت قیمة المتغیر التوضیحی، أی یکون التأثیر طردیا. من ناحیة أخرى، إذا کانت نسبة الأرجحیات المقدرة أقل من 1، فذلک یعنی أن أرجحیة أن تکون  تنخفض کلما زادت قیمة المتغیر التوضیحی، أی یکون التأثیر عکسیا. وأخیرا، فإن نسبة الارجحیات تساوی 1 فذلک یعنی عدم وجود تأثیر للمتغیر المستقل على الاستجابة.

  1. الجانب التطبیقی:

تم إجراء تطبیق عملی على بیانات تخص مرض هشاشة العظام Osteoporosis لدى عینة من النساء فی مدینة الموصل. حیث أن بیانات العینة، المکونة من 344 مشاهدة، مأخوذة من وحدة اختبار دکسا فی مستشفى ابن سینا التعلیمی، وکذلک من وحدة هشاشة العظام فی مستشفى السلام العام فی مدینة الموصل فی الفترة الواقعة ما بین 15 تشرین الأول 2009 ولغایة 30 أیلول 2010 )الجمیلی، 2010(. تم إجراء جمیع التحلیلات الإحصائیة باستخدام برنامجIBM SPSS Statistics v26 (IBM Corp. Released 2019)، وبرنامجR v4.1.3 (R Core Team, 2022).

6.1.    وصف واستکشاف البیانات احصائیاً:

ویمثل المتغیر المعتمد القیاسات الخاصة بالکثافة المعدنیة للعظام Bone Mineral Density (BMD) للأشخاص الخاضعین لاختبار دکسا فی المستشفیین المذکورین. علما أن اختبار دکسا یعنی اختبار امتصاص الأشعة السینیة ثنائیة الطاقة Dual Energy X-ray Absorptiometry (DEXA). ویقیس هذا الاختبار مستوى المعادن المهمة فی ترکیب العظام باستخدام الاشعة السینیة، ومنه یمکن الاستدلال على مستوى تطور المرض لدى الاشخاص الخاضعین للاختبار. ویوضح الجدول (1) المتغیرات الداخلة فی الدراسة.

جدول رقم (1): المتغیرات الداخلة فی الدراسة

ت

المتغیرات

الرمز

نوع المتغیر

الفئات

  1.  

الکثافة المعدنیة للعظام BMD

 

مستمر، أو فئوی (رتبی أو أسمی)

1 = طبیعی

2 = ترقق العظام

3 = هشاشة العظام

  1.  

العمر Age

 

فئوی

0 = أقل من 60 سنة

1 = 60 سنة فأکثر

  1.  

عنوان السکن Address

 

فئوی

0 = الریف

1 = الحضر

  1.  

المهنة Job

 

فئوی

0 = لا تعمل

1 = تعمل

  1.  

مقیاس کتلة الجسم BMI

 

مستمر

---

  1.  

التدخین Smoking

 

فئوی

0 = کلا

1 = نعم

  1.  

التعرض لأشعة الشمس Sun Exposure

 

فئوی

0 = کلا ،لا تعمل

1 =نعم ،تعمل

  1.  

عدد مرات الحمل Pregnancy

 

فئوی

0 = أقل من 5 مرات

1 = 5 مرات فأکثر

  1.  

سن الیأس Menopause

 

فئوی

1 = لم تبلغ سن الیأس

2 = بلغت قبل سن الخمسین

3 = بلغت بعد سن الخمسین

  1.  

موانع الحمل Contraceptive

 

فئوی

0 = کلا

1 = نعم

  1.  

الکسور Fractures

 

فئوی

0 = لا یوجد

1 = یوجد کسور

  1.  

تاریخ المرض Family History

 

فئوی

0 = کلا

1 = نعم

  1.  

الأدویة المنشطة Steroids

 

فئوی

0 = کلا

1 = نعم

  1.  

شرب الحلیب Milk

 

فئوی

1 = کلا

2 = قدح واحد فی الیوم

3 = أکثر من قدح واحد فی الیوم

  1.  

المشروبات الغازیة Beverages

 

فئوی

1 = کلا

2 = قدح واحد فی الیوم

3 = أکثر من قدح واحد فی الیوم

وتم إجراء احصاءات وصفیة بسیطة لمتغیر الاستجابة المستمر ومتغیر کتلة الجسم وکما موضح فی الجدول (2). وأیضا تم رسم التوزیع التکراری (histogram) لبیانات المتغیرین المذکورین.

جدول (2): الوصف الاحصائی للمتغیرات المستمرة فی بیانات الدراسة

Variables

Minimum

Maximum

Mean

SD

Variance

BMD (continuous)

-3.99

.90

-1.7684

1.10164

1.214

BMI

19

48

30.65

5.054

25.547

من الجدول (2) یبین الحد الادنى والحد الاعلى وقیمة الوسط والانحراف المعیاری والتباین للمتغیر BMD والمتغیر BMI، وکانت القیمة التباین لمتغیر BMD منخفضة هذا یدل على وجود تجانس أو تقارب بین قیم المتغیر BMD. واضح أنه من المدرجین فی الشکل (1) أن توزیع کلا المتغیرین متناظر نوعا ما. مما یعنی توفر خاصیة التوزیع الطبیعی لبیانات المتغیر المعتمد، خصوصا مع توفر عدد کبیر من المشاهدات.

   

الشکل (1): المدرجین التکراریین لمتغیر کتلة الجسم ومتغیر الاستجابة

ولغرض التأکد من عدم وجود مشکلة ترابط خطی بین أعمدة مصفوفة البیانات ، تمّ حساب رتبة المصفوفة. وکانت رتبة المصفوفة تساوی 14، لذلک یمکن القول بأن أعمدة المصفوفة  مستقلة خطیا. حیث أن رتبة المصفوفة تمثل عدد الأعمدة المستقلة خطیا فیها (Strang, 1993). تم أیضا حساب عامل تضخم التباین للمتغیرات التوضیحیة الداخلة فی الدراسة. ویحسب من خلال المعادلة ، حیث أن  تمثل معامل التحدید المتعدد للأنموذج الذی یعتبر أن المتغیر  معتمداً على باقی المتغیرات التوضیحیة (Kutner, et. al., 2004). وکانت قیم معاملات تضخم التباین کالآتی:

جدول (3): عوامل تضخم التباین للمتغیرات التوضیحیة الداخلة فی دراسة

Variable

             

VIF

1.394

1.073

1.196

1.112

1.079

1.061

1.119

Variable

             

VIF

1.300

1.055

1.156

1.030

1.044

1.063

1.111

وبما أن جمیع قیم عوامل تضخم التباین أقل من 5، فیمکن القول بأنه لا توجد مشکلة تعدد العلاقة الخطیة Multicollinearity problem بین المتغیرات التوضیحیة (Forthofer, et. al; 2006).

6.2.     بناء ومقارنة النماذج:

تمّ بناء انموذج الانحدار اللوجستی الرتبی على اعتبار أن متغیر الاستجابة متغیرا فئویا قابلا للترتیب. حیث تم تقدیر معالم الانموذج واختبارالفرضیة الآتیة للوقوف على معنویة کل متغیر توضیحی:

 

جدول  (4): انموذج الانحدار اللوجستی الرتبی

Variables

Coefficients

Estimates

Std. Error

t value

p value

1|2

 

-2.500

0.942

-2.654

0.008

2|3

 

-0.121

0.931

-0.130

0.896

Age (>60)

 

0.812

0.275

2.946

0.003

Address

 

0.057

0.417

0.136

0.892

Job

 

-0.293

0.404

-0.725

0.468

BMI

 

-0.083

0.024

-3.515

0.000

Smoking

 

1.821

0.708

2.572

0.010

Sun Exposure

 

-0.863

0.301

-2.864

0.004

Pregnancy (>5)

 

0.653

0.245

2.662

0.008

Menopause 2

 

1.891

0.333

5.683

0.000

Menopause 3

 

1.356

0.326

4.163

0.000

Contraceptive

 

-0.318

0.262

-1.215

0.225

Fracture

 

1.493

0.381

3.919

0.000

Family History

 

0.572

0.587

0.973

0.330

Steroids

 

0.685

0.530

1.292

0.196

Milk 2

 

-0.399

0.379

-1.054

0.292

Milk 3

 

-2.134

1.037

-2.058

0.040

Beverages 2

 

0.945

0.335

2.820

0.005

Beverages 3

 

1.295

0.660

1.962

0.050

یوضح الجدول (4) المعالم المقدرة للانموذج اللوجستی الرتبی مع اختبار t للوقوف على معنویة کل معلمة من معالم الانموذج. حیث أن المتغیرات (العمر، BMI، التدخین، التعرض للأشعة الشمس، الحمل، سن الیأس، الکسور، شرب اکثر من کوب واحد من الحلیب، المشروبات الغازیة) معنویة ولها تأثیر على الاصابة بمرض هشاشة العظام، وذلک لکون أن الـ p-value أقل من 0.05. من ناحیة أخرى، فإن المتغیرات (السکن، العمل، موانع الحمل، تاریخ الکسور، الادویة المنشطة، شرب کوب واحد من الحلیب) غیر معنویة ای لیس لها تأثیر على هشاشة العظام. علما أن المتغیرات التوضیحیة ذات الفئات أکثر من اثنتین تم معاملتها کمتغیرات وهمیة وحسب عدد الفئات فی المتغیر لتوضیحی.

جدول (5): نسبة الارجحیات (Odds Ratio) وحدود الثقة الخاصة بها للنموذج اللوجستی

Coefficients

Odds Ratios

Lower Limits

Upper Limits

Age (>60)

2.252

1.317

3.883

Address

1.059

0.466

2.404

Job

1.34

0.607

2.97

BMI

0.92

0.878

0.963

Smoking

6.177

1.697

29.679

Sun Exposure

0.422

0.231

0.757

Pregnancy (>5)

1.921

1.191

3.118

Menopause 2

6.626

3.484

12.859

Menopause 3

3.881

2.063

7.414

Contraceptive

0.728

0.435

1.215

Fracture

4.45

2.156

9.678

Family History

1.776

0.569

5.796

Steroids

1.983

0.716

5.797

Milk 2

0.671

0.317

1.406

Milk 3

0.118

0.012

0.807

Beverages 2

2.573

1.345

5.022

Beverages 3

3.644

1.081

15.047

من الجدول (5) ان احتمالیة الاصابة بمرض هشاشة العظام مرتبطة طردیا مع کل من المتغیرات (العمر، السکن، العمل، التدخین، الحمل، سن الیأس، الکسور، تاریخ المرض، والأدویة المنشطة، المشروبات الغازیة). بینما تکون احتمالیة الاصابة بمرض هشاشة العظام مرتبطة عکسیا مع کل من المتغیرات (BMI، التعرض للأشعة الشمس، موانع الحمل، شرب الحلیب). مع ذلک، فإن المتغیرات (السکن، العمل، موانع الحمل، تاریخ المرض، الأدویة المنشطة) تکون ذات تأثیر غیر مهم وذلک لکون أن حدود الثقة الخاصة بنسبة الارجحیات تضمنت العدد واحد ضمن مداها.

وتمّ فی هذا الجانب أیضا تقدیر انموذج الانحدار الخطی المتعدد وذلک من خلال تقدیر دالة انحدار المتغیرات التوضیحیة على المتغیر المعتمد قبل تحویله إلى فئات، أی ان متغیر الاستجابة یعتبر متغیرا مستمرا فی هذه الحالة. ثم بعد ذلک، تم بناء نموذج انحدار خطی متعدد لانحدار المتغیرات التوضیحیة على متغیر الاستجابة وذلک بعد تحویله إلى فئات واعتباره متغیراً کمیاً متقطعاً.

جدول (6): انموذج الانحدار الخطی المتعدد باعتبار أن متغیر الاستجابة هو متغیر مستمر

Variables

Coefficients

Estimates

Std. Error

t value

p value

Intercept

 

-1.782

0.420

-4.245

0.000

Age (>60)

 

-0.273

0.122

-2.242

0.026

Address

 

-0.180

0.182

-0.992

0.322

Job

 

0.047

0.179

0.263

0.793

BMI

 

0.028

0.010

2.744

0.006

Smoking

 

-0.617

0.238

-2.588

0.010

Sun Exposure

 

0.271

0.126

2.141

0.033

Pregnancy (>5)

 

-0.209

0.109

-1.917

0.056

Menopause 2

 

-0.779

0.142

-5.466

0.000

Menopause 3

 

-0.545

0.144

-3.784

0.000

Contraceptive

 

0.108

0.116

0.925

0.355

Fracture

 

-0.542

0.145

-3.737

0.000

Family History

 

-0.245

0.254

-0.965

0.335

Steroids

 

-0.211

0.211

-0.999

0.318

Milk 2

 

0.085

0.167

0.510

0.611

Milk 3

 

0.594

0.421

1.411

0.159

Beverages 2

 

-0.391

0.142

-2.75

0.006

Beverages 3

 

-0.608

0.234

-2.598

0.010

الجدول (6) أعلاه یوضح مقدرات معالم انموذج الانحدار الخطی المتعدد عند اعتبار أن  متغیرا مستمراً. وأیضا تم إدراج نتائج اختبار t للوقوف على معنویة معاملات الانحدار. حیث کانت المتغیرات ( BMI، التدخین، اشعة الشمس، سن الیأس، الکسور، المشروبات الغازیة) معنویة ای لها تأثیر على هشاشة العظام. بینما کانت المتغیرات (عنوان السکن، المهنة، الحمل، موانع الحمل، تاریخ المرض، الادویة المنشطة، شرب الحلیب) غیر معنویة ولیس لها تأثیر على هشاشة العظام، وذلک وفقا للانموذج الخطی المتعدد.

جدول (7): انموذج الانحدار الخطی المتعدد باعتبار أن متغیر الاستجابة هو متغیر کمی متقطع

Variables

Coefficients

Estimates

Std. Error

t value

p value

Intercept

 

2.301

0.282

8.145

0.000

Age (>60)

 

0.247

0.083

2.966

0.003

Address

 

0.013

0.125

0.101

0.920

Job

 

-0.094

0.123

-0.763

0.446

BMI

 

-0.023

0.007

-3.234

0.001

Smoking

 

0.422

0.163

2.586

0.010

Sun Exposure

 

-0.262

0.087

-3.034

0.003

Pregnancy (>5)

 

0.19

0.075

2.55

0.011

Menopause 2

 

0.592

0.098

6.068

0.000

Menopause 3

 

0.441

0.099

4.474

0.000

Contraceptive

 

-0.076

0.08

-0.95

0.343

Fracture

 

0.419

0.099

4.223

0.000

Family History

 

0.207

0.174

1.191

0.235

Steroids

 

0.146

0.144

1.014

0.311

Milk 2

 

-0.113

0.114

-0.991

0.322

Milk 3

 

-0.526

0.288

-1.824

0.069

Beverages 2

 

0.258

0.097

2.653

0.008

Beverages 3

 

0.317

0.16

1.982

0.048

الجدول (7) أعلاه یوضح مقدرات معالم انموذج الانحدار الخطی المتعدد عند اعتبار أن النسخة الفئویة من متغیر الاستجابة  متغیرا کمیا متقطعاً. وأیضا تم إدراج نتائج اختبار t للوقوف على معنویة معاملات الانحدار. حیث کانت المتغیرات (العمر، BMI، التدخین، التعرض لأشعة الشمس، الحمل، سن الیأس، الکسور، شرب اکثر من کوب واحد من الحلیب، المشروبات الغازیة) معنویة ولها تأثیر على هشاشة العظام، فی حین المتغیرات ( عنوان السکن، المهنة، موانع الحمل، تاریخ المرض، الأدویة المنشطة، شرب کوب واحد من الحلیب) غیر معنویة ولیس لها تأثیر على هشاشة العظام.

ولغرض المقارنة بین النماذج الثلاثة، تمّ اعتماد معیاری أکیاکی AIC والمعلومات البیزیBIC ، حیث یمکن ملاحظة النتائج فی الجدول (8). علماً أن الانموذج المفضل وفقا لهذین المعیارین هو الانموذج الذی یحقق أقل قیمة فی المعیارین. ونلاحظ من الجدول (8) أعلاه ان أنموذج الانحدار اللوجستی الرتبی یعطی أقل قیمة AIC و BIC، وهذا یدل على انه أفضل أنموذج لتمثیل هذه البیانات، یلیه أنموذج الانحدار الخطی المتعدد (المتقطع)، وأخیراً أنموذج الانحدار الخطی المتعدد (المستمر).

جدول (8): مقارنة النماذج أعلاه باستخدام معیار معلومات أکیاکی ومعیار المعلومات البیزی

النماذج

عدد المعالم المقدرة

AIC

BIC

الانحدار اللوجستی الرتبی

19

611.414

684.387

الانحدار الخطی المتعدد (مستمر)

18

935.524

1008.497

الانحدار الخطی المتعدد (فئوی)

18

674.605

747.577

من الناحیة الطبیة، فإن الدراسات الحیویة تشیر إلى أن المتغیرات الداخلة فی الدراسة تکون ذات تأثیر متفاوت على ارتفاع نسب الاصابة بمرض هشاشة العظام. فبعض المتغیرات المعتمدة فی الدراسات تصنف على أنها عوامل طردیة، أی أن زیادتها تزید من احتمالیة الاصابة بمرض هشاشة العظام، أو على الأقل تؤدی إلى ترقق العظام. والمتغیرات المصنفة عالمیاً على أنها ذات تأثیر طردی على فرض ظهور المرض هی (العمر خصوصا بعد الستین عاما، التدخین، الحمل لأکثر من خمسة أطفال، بلوغ سن الیأس، الکسور، المشروبات الغازیة، تاریخ المرض، الأدویة المنشطة). فیما یصنف عدد من المتغیرات التوضیحیة على أنها متغیرات ذات تأثیر سلبی على المرض، أی تنخفض فرص الاصابة بالمرض کلما ارتفعت قیمة أو فئة المتغیر التوضیحی المقصود. (مؤشر کتلة الجسم BMI، التعرض لأشعة الشمس). وأخیرا، فإن الدراسات السریریة تضاربت بشأن تأثیر بقیة المتغیرات التوضیحیة (العنوان، المهنة، موانع الحمل، شرب الحلیب) فیما إذا کان سلبیا أم ایجابیا على تطور المرض. وتحدیدا فیما یخص موانع الحمل وشرب الحلیب، حیث أشارت الدراسات أن استخدام أنواع محددة من موانع الحمل مرتبط بانخفاض کثافة العظم المعدنیة (وهو المتغیر المعتمد فی هذه الدراسة). بینما أدى استخدام أنواع أخرى من أدویة منع الحمل إلى تحسین کثافة العظام لدى النساء. وکذا الحال بالنسبة للحلیب، حیث تشیر الدراسات أن الحلیب الغنی بالبروتینات مرتبط بتدهور حالة المرض، فیما أشارت دراسات أخرى أن الحلیب الخالی من اللاکتوز مفید لصحة العظام (Kröger, et al; 1994).

  1. الاستنتاجات:

وبناءاً على ما تقدم، نلاحظ توافق النماذج الثلاثة فی تشخیص اتجاه العلاقة (إیجابی سلبی) بین المتغیرات التوضیحیة والمتغیر المعتمد. کما ویلاحظ أیضا تطابقها مع ما هو متعارف علیه دولیاً فی مجال الدراسات الطبیة الخاصة بمرض هشاشة العظام. وبالرغم من توافق النماذج الثلاثة فی تحدید اتجاه العلاقة، إلا أن الأفضلیة تمیل لصالح الانموذج اللوجستی الرتبی، وذلک لکونه لا یتطلب فروضا مسبقة بخصوص توزیع الاخطاء، وأیضا لتفوقه فی معاییر المقارنة المذکورة آنفاً. وهذا یدل على أفضلیة تحویل المتغیرات المستمرة الى متغیرات فئویة رتبیة قبل تحلیلها. فعندما یکون الاهتمام فی مدى محدد من البیانات الخاصة بمتغیر الاستجابة، فإن تحویل المتغیر المستمر إلى متغیر فئوی (رتبی أو اسمی) یعطی أفضلیة ودقة لتشخیص وتفسیر العلاقة بین المتغیرات التوضیحیة والمتغیر المعتمد مقارنة فی حالة اعتماده کمتغیر مستمر. وذلک واضح من خلال مقارنة نتائج هذه الدراسة مع الدراسات العالمیة المنجزة بخصوص مرض هشاشة العظام. من ناحیة أخرى، تتفوق طریقة الانحدار اللوجستی الرتبی على الطرق الأخرى المتعارف علیها فی نمذجة البیانات المتضمنة على متغیر استجابة رتبی. ولوحظ أیضا أن دقة تشخیص العلاقة بین المتغیرات التوضیحیة الفئویة والمتغیر المعتمد الرتبی تتأثر بعدد التکرارات فی الجداول التقاطعیة بین کل متغیر توضیحی مع المتغیر المعتمد، وهذا یفسر سبب عدم معنویة (او تخبط) علاقة بعض المتغیرات التوضیحیة والتی أثبتت الدراسات السابقة تأثیرها فعلیا على مرض هشاشة العظام.

  • XML
  • PDF 1.34 M
  • RIS
  • EndNote
  • Mendeley
  • BibTeX
  • APA
  • MLA
  • HARVARD
  • VANCOUVER
References
  1. 1.     AL-Jumayli ,Hana Husian,(2010)," Evaluation of osteoporosis among women in the city of Mosul",MSc. Thesis, College of Nursing ,University of Mosul, Mosul ,Iraq.
    2.     AL-Rawi, Kashe Mahmoud,(1987),"Introduction to Regression Analysis", Directorate of Book House for Printing and Publishing, University of Mosul .,Mosul, Iraq.
    3.     Kadem, Amori Hade, (1988) " Introduction to Linear Regression Analysis ",Baghdad University Iraq.
    1. Agresti, A. (2003). Categorical data analysis. John Wiley & Sons.
    2. Ananth, C. V., & Kleinbaum, D. G. (1997). Regression models for ordinal responses: a review of methods and applications. International journal of epidemiology, 26(6), 1323-1333.
    3. Armstrong, B. G., & Sloan, M. (1989). Ordinal regression models for epidemiologic data. American Journal of Epidemiology, 129(1), 191-204.
    4. Forthofer, R. N., Lee, E. S., & Hernandez, M. (2006). Biostatistics: a guide to design, analysis and discovery. Elsevier.
    5. IBM Corp. Released 2019. IBM SPSS Statistics for Windows, Version 26.0. Armonk, NY: IBM Corp.
    6. Kröger, H., Tuppurainen, M., Honkanen, R., Alhava, E., & Saarikoski, S. (1994). Bone mineral density and risk factors for osteoporosis—a population-based study of 1600 perimenopausal women. Calcified Tissue International, 55(1), 1-7.
    7. Kutner, M. H., Nachtsheim, C. J., Neter, J., & Wasserman, W. (2004). Applied linear regression models. New York: McGraw-Hill/Irwin.
    8. Lall, R. (2004). The application of ordinal regression models in quality of life scales used in gerontology (Doctoral dissertation, University of Sheffield).
    9. Siegel S, Castellan N. Non-parametric Statistics for the Behavioral Sciences. Second Edition. McGraw-Hill International Editions, 1988.
    10. Scott, S. C., Goldberg, M. S., & Mayo, N. E. (1997). Statistical assessment of ordinal outcomes in comparative studies. Journal of clinical epidemiology, 50(1), 45-55.
    11. Strang, G., (1993). Introduction to linear algebra (Vol. 3). Wellesley, MA: Wellesley-Cambridge Press.
    12. Strömberg, U. (1996). Collapsing ordered outcome categories: a note of concern. American journal of epidemiology, 144(4), 421-424.
    13. R Core Team (2022). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.

     

    • Article View: 155
    • PDF Download: 229
IRAQI JOURNAL OF STATISTICAL SCIENCES
Volume 19, Issue 2
December 2022
Page 56-67
Files
  • XML
  • PDF 1.34 M
Share
Export Citation
  • RIS
  • EndNote
  • Mendeley
  • BibTeX
  • APA
  • MLA
  • HARVARD
  • VANCOUVER
Statistics
  • Article View: 155
  • PDF Download: 229

APA

Alhamdany, L., & Salah, Z. (2022). Statistical Analysis of Ordinal Response Variable: A Comparative Study. IRAQI JOURNAL OF STATISTICAL SCIENCES, 19(2), 56-67. doi: 10.33899/iqjoss.2022.176204

MLA

Liqaa Yaseen Alhamdany; Zaid Salah. "Statistical Analysis of Ordinal Response Variable: A Comparative Study". IRAQI JOURNAL OF STATISTICAL SCIENCES, 19, 2, 2022, 56-67. doi: 10.33899/iqjoss.2022.176204

HARVARD

Alhamdany, L., Salah, Z. (2022). 'Statistical Analysis of Ordinal Response Variable: A Comparative Study', IRAQI JOURNAL OF STATISTICAL SCIENCES, 19(2), pp. 56-67. doi: 10.33899/iqjoss.2022.176204

VANCOUVER

Alhamdany, L., Salah, Z. Statistical Analysis of Ordinal Response Variable: A Comparative Study. IRAQI JOURNAL OF STATISTICAL SCIENCES, 2022; 19(2): 56-67. doi: 10.33899/iqjoss.2022.176204

  • Home
  • About Journal
  • Editorial Board
  • Submit Manuscript
  • Contact Us
  • Glossary
  • Sitemap

News

Newsletter Subscription

Subscribe to the journal newsletter and receive the latest news and updates

© Journal Management System. Powered by ejournalplus