Document Type : Research Paper
Abstract
Response variables in biological phenomena vary between three types: numerical response variables, ordinal categorical response variables, and nominal categorical response variables. In statistical studies, handling ordinal variables varies in accordance with the perspective of the statistical approach to the response variable. Ordinal variables can be adopted as nominal categorical variables, which neglect the ordinal property of the categories. Ordinal variables can also be treated.
as an ordinal categorical variable (discrete variable), in which case the ranking information can be utilized in establishing the predicted models. In this study, the most important statistical methods that can be used to analyze data with an ordinal response variable have been investigated. Among these methods are the Multiple Regression Method, and The Ordinal Logistic Regression Method. The mechanism of building models and parameter estimations were theoretically exhibited, as well as reading the statistical significance of the regression coefficients in all the models in the study. The application was carried out on a real sample of patients with osteoporosis. Where multiple models were built to determine the most important factors affecting the likelihood of developing the disease. The best model was diagnosed according to the Akaike Information Criterion (AIC) and the Bayesian Information Criterion (BIC). The results of the statistical analysis demonstrated the superiority of the ordinal logistic regression model over the multiple linear regression model in its explanation of the relationship between the response variable and the covariates.
Keywords
Main Subjects
Highlights
Ba
When the interest is in a specific range of data related to the response variable, converting the continuous variable into a categorical variable (ordinal or nominal) gives preference and accuracy for diagnosing and interpreting the relationship between the explanatory variables and the dependent variable compared to the case of adopting it as a continuous variable. This is clear by comparing the results of this study with international studies conducted on osteoporosis.
sed on the foregoing, we note the compatibility of the three models in diagnosing the direction of the relationship (positive-negative) between the explanatory variables and the dependent variable. It is also noted that it conforms to what is internationally recognized in the field of medical studies related to osteoporosis. Despite the compatibility of the three models in determining the direction of the relationship, preference tends in favor of the ordinal logistic model, because it does not require prior assumptions regarding the distribution of errors, and also because of its superiority in the aforementioned comparison criteria. This indicates the preference of converting continuous variables into ordinal categorical variables before analyzing them.
On the other hand, the method of ordinal logistic regression is superior to other known methods in modeling data that include an ordinal response variable. It was also noted that the accuracy of diagnosing the relationship between the categorical explanatory variables and the ordinal dependent variable is affected by the number of repetitions in the intersection tables between each explanatory variable with the dependent variable, and this explains the reason for the non-significance (or confusion) of the relationship of some explanatory variables, which previous studies have proven to actually affect osteoporosis.
Full Text
یعد تحلیل الانحدار رکناً أساسیاً من أرکان علم الإحصاء، وأسلوب مهم من أسالیب الإحصاء التطبیقی عند دراسة بعض الظواهر الاقتصادیة أو الاجتماعیة ویمکن استخدام الطرائق الإحصائیة أینما وجد البحث العلمی سواء کان فی مجال الاقتصاد أم فی الطب أم فی غیرها من المجالات (کاظم، 1988(. وأن الانحدار المتعدد یحقق اغلب اهداف البحث العلمی لتحلیل البیانات ووصف العلاقة الدالیة بین المتغیرات الا أنه یکون غیر دقیق فی تحدید وتفسیر العلاقة بین متغیر الاستجابة مما ادت الحاجة الى تطویر اسالیب احصائیة لها قوة الانحدار المتعدد فی التوصل الى افضل المعادلات توفیقا وکذلک تعالج تعذر مشکلة تطبیق الانحدار المتعدد الخطی وغیر الخطی فی حالة التی یکون متغیر الاستجابة من النوع الفئوی (اسمی)، وذلک لعدم توفر فروض تحلیل الانحدار المتعدد. أما فی الحالات التی یکون فیها المتغیر المعتمد من النوع الرتبی (فئوی کمی)، فبالامکان استخدام اسلوب الانحدار المتعدد الخطی أو اللاخطی، لکن مع ضرورة توفر شروط محددة فی هیکلیة والتوزیع التکراری للمتغیر المعتمد (Kutner, et. al.; 2004). ولقد ظهرت العدید من نماذج الانحدار غیر الخطی التی تتعامل مع البیانات رتبیة الاستجابة، ومنها أنموذج الانحدار اللوجستی الرتبی (Ordinal Logistic Regression)، والذی سیکون محور الرئیسی فی بحثنا هذا.
وتکمن مشکلة البحث فی إیجاد افضل أنموذج ریاضی یلائم البیانات اذا کان لدینا مجموعة من البیانات یکون فیها متغیر الاستجابة ( ) متغیر رتبی. ومع أن تحلیل الانحدار یحقق أغلب اهداف البحث العلمی فهناک أسباب عدیدة لعدم ملاءمة أنموذج الانحدار الخطی وأنموذج الانحدار اللوجستی الثنائی عندما یکون متغیر الاستجابة من النوع الرتبی.
لذلک یهدف هذا البحث الى تحدید الاسلوب الاحصائی الأمثل لتحلیل ونمذجة البیانات التی یکون فیها متغیر الاستجابة من النوع الرتبی وذلک بتحلیلها ومقارنة النتائج. ومن الأسالیب الاحصائیة التی من الممکن توظیفها لتحلیل هکذا نوع من البیانات هی اسلوب الانحدار الخطی المتعدد، واسلوب الانحدار اللوجستی الرتبی. حیث یهدف البحث لمقارنة النمذجة الإحصائیة بالاعتماد على الطریقتین المذکورتین آنفاً.
فی علم الإحصاء، هنالک نوعین من المتغیرات: النوع الاول هو المتغیرات الکمیة وهی المتغیرات التی یمکن عدها، وتکون إما متقطعة أو مستمرة. والنوع الثانی هو المتغیرات الفئویة. وعندما یکون هنالک فئتین فقط فی المتغیر الفئوی فعندئذٍ یعرف بأنه متغیر ثنائی. ویمکن التعبیر عن المتغیرات الفئویة الثنائیة ریاضیا باستخدام متغیر دلیلی indicator variable، حیث یتم ترمیز قیم المتغیر الثنائی بالعددین 0 و 1. ویمکن أن یحتوی المتغیر الفئوی على ثلاثة فئات مختلفة فأکثر، وعندها یرمز باستخدام تقنیة المتغیرات الوهمیة. وتکون المتغیرات الفئویة على نوعین: النوع الاول المتغیرات الاسمیة، وفیه تکون المشاهدات فئویة غیر رتبیة، مثلا دراسة تأثیر التداخل الجینی البشری على لون الشعر (اسود، اشقر، بنی، احمر، أبیض). والنوع الثانی المتغیرات الرتبیة، وفیه تکون فئات المتغیر الفئوی قابلة للترتیب، مثلا دراسة تأثیر بعض العوامل البیئیة والحیویة على مستوى ضغط الدم لدى الانسان (منخفض، طبیعی، مرتفع) (Agresti, 2003) .
بالامکان توظیف الطرائق الاحصائیة الاخرى لتحلیل المتغیرات الرتبیة، وذلک بالرغم من وجود بعض المحددات التی تتعلق بفروض التحلیل. وعادة ما یلجأ الباحثون الى مقارنة الطرق المتاحة فیما بینها للوصول الى الطریقة المثلى لتحلیل العینة الخاصة بهم. وتختلف الطریقة الاحصائیة باختلاف منظورنا الى متغیر الاستجابة، بغض النظر عن حقیقة کونه مستمراً أم فئویاً. سنوضح فی الفقرات الآتیة الخیارات المتاحة للباحثین فی تعاملهم مع المتغیرات الرتبیة، فضلاً عن تحدید الایجابیات والسلبیات الممکنة لکل حالة (Lall, 2005).
3.1. المتغیر الرتبی کمتغیر فئوی اسمی متعدد الفئات:
أحد خیارات التعامل مع المتغیر الرتبی هی اعتباره متغیراً اسمیاً متعدداً للفئات. وینطوی على ذلک إهمال الطبیعة الرتبیة لفئات المتغیر قید الاهتمام. ویکون هذا الفرض منطقیا فی بعض الاحیان، فعلى سبیل المثال عندما یکون هناک عدد قلیل من الفئات ولا یکون ترتیب الفئات ذات أهمیة محوریة فی مشکلة البحث. أهم میزة لهذا النهج هو عدم إنتهاک فرضیات التحلیل، خصوصا فی حال کون حجم العینة مناسب لتطبیق الإجراءات الاحصائیة. هناک العدید من الخیارات لتحلیل المتغیرات الاسمیة، حیث یمکن استخدام اختبار مربع کای للاستقلالیة بین متغیر الاستجابة والمتغیرات التوضیحیة بعد تبویبها لتشخیص العلاقة بین الاستجابة والتنبوء. ویمکن ایضا توظیف اختبار Cochran–Mantel–Haenszel test (CMH)، وهو اسلوب لاختبار العلاقة بین متغیر الاستجابة الاسمی والمتغیرات التوضیحیة الفئویة. کلا الاختبارین المذکورین یعتمدان على تکوین جدولة تقاطعیة cross tabulation لبیانات متغیری الاستجابة والتوضیحی. کما یمکن استخدام الانحدار اللوجستی متعدد الفئات Polytomous Logistic Regression، والذی لا یتطلب وجود أی نوع من القیود على متغیر الاستجابة. ویتمیز الاجراء الأخیر عن سابقیه فی کون أن التحلیل ینمذج العلاقة بین متغیر الاستجابة وجمیع المتغیرات التوضیحیة فی آن واحد. ویترتب على معاملة متغیر الاستجابة الرتبی کمتغیر اسمی فقدان المعلومات الخاصة بالترتیب، مما قد یؤدی الى بناء استدلالات غیر دقیقة (Ananth & Kleinbaum, 1997; Scott, et. al., 1997).
3.2. المتغیر الرتبی کمتغیر ثنائی:
یمکن معاملة المتغیر الرتبی متعدد الفئات کمتغیر ثنائی وذلک بعد دمج عدد من الفئات وخفض عددها الى فئتین فقط. وفی هذه الحالة یمکن استخدام الانحدار اللوجستی الثنائی لنمذجة العلاقة بین متغیر الاستجابة والمتغیرات التوضیحیة. ویکون هذا الاجراء مقبولا غالباً عندما یکون ترتیب الفئة التی تصنف على أنها الحالة الطبیعیة (أو السیطرة) فی وسط الفئات الأخرى، وکان اهتمام الدراسة مرکزاً فی أحد الاتجاهین غیر الطبیعیین. ورغم مقبولیة هذا الاسلوب فی بعض الأحیان، إلا أنه یتسبب فی ضیاع معلومات الترتیب الفئوی، وکذلک صعوبة تحدید نقطة القطع cut-point لتحدید الفئات الجدیدة. وهذا بالتأکید سیؤدی إلى عدم دقة تمثیل العلاقة بین المتغیرات قید الدراسة (Strömberg 1996).
3.3. المتغیر الرتبی کمتغیر کمی:
الخیار الآخر المتاح فی التعامل مع المتغیر الرتبی هو اعتباره متغیراً کمیاً. وفی هذه الحالة یتم التعامل مع متغیر الاستجابة الفئوی إما کمتغیر کمی مستمر، أو کمتغیر کمی متقطع. وفی کلتا الحالتین یتم الاحتفاظ بالخاصیة الرتبیة لبیانات المتغیر قید الاهتمام. ففی الحالة الأولى، یصار إلى اعتبار أن المتغیر قادم من توزیع مستمر ومتناظر، وذلک لضمان توفر فرضیة التوزیع الطبیعی لبیانات متغیر الاستجابة. ویتطلب هذا الاجراء توفر عینة بحجم کبیر نسبیاً، وکذلک الحال بالنسبة لعدد الفئات. فکلما زادت الفئات، کلما اقترب سلوک المتغیر الرتبی من المتغیر المستمر. ویفضل أیضا أن تکون المسافات بین الفئات متساویة، وذلک لتلافی حدوث مشکلة الالتواء فی توزیع متغیر الاستجابة (Armstrong et al., 1989). وفی هذه الحالة یمکن توظیف اسلوب الانحدار المتعدد (الخطی وغیر الخطی) لنمذجة العلاقة بین المتغیرات. وأیضاً یمکن استخدام تحلیل الاتجاه Trend Analysis لاستقصاء العلاقة بین متغیر الاستجابة والمتغیرات التوضیحیة (Siegel, 1988). أما فی حال اعتبار المتغیر الکمی متقطعاً، فعندئذٍ یمکن استخدام الانحدار اللوجستی الرتبی Ordinal Logistic Regression لتوصیف العلاقة بین المتغیرات. ویعد أنموذج الانحدار اللوجستی الرتبی أحد نماذج الانحدار اللوجستی متعددة الفئات، مع الأخذ بنظر الاعتبار الطبیعیة الرتبیة لفئات متغیر الاستجابة، مما یعطی أفضلیة نظریة لهذا الاسلوب مقارنة بالاسالیب الأخرى. (Ananth & Kleinbaum, 1997; Agresti, 2003).
یعرف أنموذج الانحدار الخطی المتعدد بأنه عملیة تقدیر العلاقة الخطیة بین متغیر استجابة واحد مع عدد من المتغیرات التوضیحیة )الراوی، 1987(. وهدف الانحدار الخطی المتعدد هو استخدام العلاقة بین متغیر الاستجابة والمتغیرات التوضیحیة للتنبؤ أو توضیح سلوک متغیر الاستجابة.
ومعادلة الانحدار الخطی المتعدد التی تحوی على من المتغیرات التوضیحیة تکون بالشکل الآتی:
حیث أن تمثل المشاهدة للمتغیر المعتمد، تمثل المشاهدة للمتغیر التوضیحی ، الحد الثابت، معامل الانحدار الخاص بالمتغیر التوضیحی ، وأن تمثل القیمة للخطأ العشوائی، ویفترض أنه یتوزع توزیعا طبیعیا مستقلاً ومتماثلاً بمتوسط صفر وتباین ثابت. ویمکن کتابة المعادلة (1) بدلالة المصفوفات:
حیث أن یمثل متجه الاستجابة، تمثل مصفوفة البیانات، یمثل متجه المعالم، و یمثل متجه الاخطاء العشوائیة [الراوی، 1987].
4.1. تقدیر متجه معالم الانحدار الخطی المتعدد
یمکن إیجاد مقدر متجه معالم الانحدار الخطی المتعدد وفقاً المربعات الصغرى الاعتیادیة من خلال اشتقاق مجموع مربعات الاخطاء الموضح فی المعادلة (3) بالنسبة لکل معلمة من معالم أنموذج الانحدار الخطی المتعدد ومن ثم الحل بالنسبة لـ :
ومنها نحصل على مقدر متجه معالم الانحدار الخطی المتعدد، وکالآتی:
علما أن طریقة الامکان الأعظم فی التقدیر تعطی الصیغة الموضحة فی المعادلة (5) نفسها، وذلک بالاعتماد على فرضیة التوزیع الطبیعی المستقل والمتطابق للأخطاء العشوائیة.
یستخدم الانحدار اللوجستی لنمذجة العلاقة بین متغیر معتمد واحد کمی او نوعی وعدد من المتغیرات التوضیحیة. مع ذلک، فإن الانحدار اللوجستی غالبا ما یستخدم لنمذجة البیانات التی تحوی على متغیر استجابة نوعی، أو ما یسمى بمتغیر الاستجابة الفئوی، وتحدیدا متغیر الاستجابة الثنائی، وحینها یسمى بالانحدار اللوجستی الثنائی. علما أن الانحدار اللوجستی یمکن أن یستخدم لنمذجة البیانات التی تحوی على متغیر استجابة فئوی ذات فئات متعددة، وعندها یسمى بالانحدار اللوجستی المتعدد. ومن نماذج بالانحدار اللوجستی المتعدد هو أنموذج الانحدار اللوجستی الرتبی، والذی یفترض أن متغیر الاستجابة عبارة عن متغیر فئوی ذات فئات قابلة للترتیب.
5.1. الانحدار اللوجستی الثنائی:
لنفرض أنه لدینا متغیر الاستجابة من النوع الثنائی، أی أن قیم متغیر الاستجابة تکون (1,0). عندئذٍ تکون صیغة أنموذج الانحدار اللوجستی الثنائی کالآتی:
حیث أن یمثل متغیر الاستجابة، یمثل الصف من مصفوفة البیانات ، یمثل متجه معالم الانحدار، وأن یمثل الخطأ العشوائی الخاص بالمشاهدة ، ویتوزع بمتوسط صفری وتباین ثابت.
ویعتبر وفقا للانحدار اللوجستی الثنائی بأنه متغیر عشوائی یتوزع وفقا لتوزیع برنولی بمعلمة ، والتی تمثل توقع . وبذلک تکون دالة الاستجابة اللوجستیة الثنائیة کالآتی:
إذن نحن نقدر احتمالیة أن ، ولیس قیمة نفسها (Kutner, et. al., 2004).
5.2. الانحدار اللوجستی الرتبی:
لنفرض أنه لدینا متغیر الاستجابة من النوع الفئوی یحتوی على من الفئات القابلة للترتیب. یتم إعطاء رتب لفئات المتغیر وفقا لطبیعة المتغیر والفئات الخاصة به. وبذلک تکون القیم الممکنة لمتغیر الاستجابة مرتبة بشکل تصاعدی ابتداءً من العدد 1 ولغایة العدد . وبما أن فئات متغیر الاستجابة قابلة للترتیب فعلیه سیتم حساب دالة الاستجابة اللوجستیة الرتبیة وفقاً للاحتمالیة التراکمیة کالآتی:
وذلک بفرض أن المتغیر یعتمد على من المتغیرات التوضیحیة. حیث أن . لاحظ أن ، وذلک لکون أن تمثل العدد الأکبر فی الترمیز لفئات متغیر الاستجابة الرتبی. وتمثل معلمة المقطع لکل فئة من فئات متغیر الاستجابة. وأن یمثل متجها صفیا لقیم المتغیرات المستقلة عند المشاهدة ، وأن یمثل متجه معاملات المتغیرات التوضیحیة.
وبذلک یکون لدینا من دوال الاستجابة اللوجستیة الرتبیة، وتختلف هذه الدوال فیما بینها باختلاف معلمة المقطع فقط، فیما تکون باقی المعالم الخاصة بالمتغیرات التوضیحیة ثابتة فی جمیع دوال الاستجابة. وبتطبیق تحویل اللوجیت على المعادلة(8) نحصل على (Agresti, 2003):
حیث یطلق على المعادلة (9) أعلاه بلوغارتیم أرجحیة odds کون أن .
5.2.1. تقدیر معالم أنموذج الانحدار اللوجستی الرتبی:
لاحظ أن کل فئة من فئات متغیر الاستجابة تعامل کمعاملة متغیر ثنائی عند احتساب الارجحیات. ولتوضیح ذلک نفرض أن:
عندئذ یمکن کتابة احتمالیة حدوث من خلال الاحتمالات التراکمیة وکالآتی:
حیث أن . لاحظ أن و .
ویمکن التعبیر عن الاحتمالیة أعلاه بدلالة الاحتملات الخاصة بالقیم الأخرى للمتغیر :
وبما أن الاحتمالات المذکورة أعلاه یمکن کتابتها بدلالة الانموذج اللوجستی الموضح فی المعادلة(8) وذلک بعد إعادة صیاغتها کالآتی
علیه، یکون لوغارتیم دالة الامکان کالآتی:
وبالتعویض بـ و ، والتعابیر المشتقة لـ ، وکما موضح فی المعادلتین 10 و 11 نحصل على الصیغة النهائیة للوغارتیم دالة الامکان:
وبذلک یمکن الحصول على مقدرات الامکان الاعظم بحل منظومة المعادلات اللاخطیة الآتیة عددیاً، علما أن عدد المعدلات اللاخطیة هو :
حیث أن ، مع ملاحظة أن:
حیث أن .
5.2.2. المدلول الإحصائی لمعاملات الانحدار اللوجستی الرتبی:
یکون تفسیر المدلول الاحصائی لمعاملات الانحدار اللوجستی الرتبی مختلفا عن مفهومه فی الانحدار الخطی والذی یتمثل بالمیل أو التغییر الحاصل فی الاستجابة عند زیادة المتغیر التوضیحی بوحدة واحدة. وهنا یکون التفسیر معقدا نسبیا ویتطلب فهما لموضوع الأرجحیات odds الخاصة بکل متغیر توضیحی. حیث أن الأرجحیات تحسب کالآتی:
وبالاعتماد على المعادلة (9)، وبفرض أن جمیع المتغیرات التوضیحیة ثابتة باستثناء المتغیر ، حیث أنه یزداد بوحدة واحدة فقط، عندئذٍ یمکن القول بأن:
أی أن معامل الانحدار اللوجستی الرتبی للمتغیر المعتمد على المتغیر التوضیحی یمثل لوغارتیم نسبة الأرجحیاتlog of odds ratio (OR). وبذلک تکون نسبة الأرجحیات المقدرة کالآتی:
فإذا کانت نسبة الأرجحیات المقدرة أکبر من 1، فذلک یعنی أن أرجحیة أن تکون تزداد کلما زادت قیمة المتغیر التوضیحی، أی یکون التأثیر طردیا. من ناحیة أخرى، إذا کانت نسبة الأرجحیات المقدرة أقل من 1، فذلک یعنی أن أرجحیة أن تکون تنخفض کلما زادت قیمة المتغیر التوضیحی، أی یکون التأثیر عکسیا. وأخیرا، فإن نسبة الارجحیات تساوی 1 فذلک یعنی عدم وجود تأثیر للمتغیر المستقل على الاستجابة.
تم إجراء تطبیق عملی على بیانات تخص مرض هشاشة العظام Osteoporosis لدى عینة من النساء فی مدینة الموصل. حیث أن بیانات العینة، المکونة من 344 مشاهدة، مأخوذة من وحدة اختبار دکسا فی مستشفى ابن سینا التعلیمی، وکذلک من وحدة هشاشة العظام فی مستشفى السلام العام فی مدینة الموصل فی الفترة الواقعة ما بین 15 تشرین الأول 2009 ولغایة 30 أیلول 2010 )الجمیلی، 2010(. تم إجراء جمیع التحلیلات الإحصائیة باستخدام برنامجIBM SPSS Statistics v26 (IBM Corp. Released 2019)، وبرنامجR v4.1.3 (R Core Team, 2022).
6.1. وصف واستکشاف البیانات احصائیاً:
ویمثل المتغیر المعتمد القیاسات الخاصة بالکثافة المعدنیة للعظام Bone Mineral Density (BMD) للأشخاص الخاضعین لاختبار دکسا فی المستشفیین المذکورین. علما أن اختبار دکسا یعنی اختبار امتصاص الأشعة السینیة ثنائیة الطاقة Dual Energy X-ray Absorptiometry (DEXA). ویقیس هذا الاختبار مستوى المعادن المهمة فی ترکیب العظام باستخدام الاشعة السینیة، ومنه یمکن الاستدلال على مستوى تطور المرض لدى الاشخاص الخاضعین للاختبار. ویوضح الجدول (1) المتغیرات الداخلة فی الدراسة.
جدول رقم (1): المتغیرات الداخلة فی الدراسة |
||||
ت |
المتغیرات |
الرمز |
نوع المتغیر |
الفئات |
الکثافة المعدنیة للعظام BMD |
مستمر، أو فئوی (رتبی أو أسمی) |
1 = طبیعی 2 = ترقق العظام 3 = هشاشة العظام |
||
العمر Age |
فئوی |
0 = أقل من 60 سنة 1 = 60 سنة فأکثر |
||
عنوان السکن Address |
فئوی |
0 = الریف 1 = الحضر |
||
المهنة Job |
فئوی |
0 = لا تعمل 1 = تعمل |
||
مقیاس کتلة الجسم BMI |
مستمر |
--- |
||
التدخین Smoking |
فئوی |
0 = کلا 1 = نعم |
||
التعرض لأشعة الشمس Sun Exposure |
فئوی |
0 = کلا ،لا تعمل 1 =نعم ،تعمل |
||
عدد مرات الحمل Pregnancy |
فئوی |
0 = أقل من 5 مرات 1 = 5 مرات فأکثر |
||
سن الیأس Menopause |
فئوی |
1 = لم تبلغ سن الیأس 2 = بلغت قبل سن الخمسین 3 = بلغت بعد سن الخمسین |
||
موانع الحمل Contraceptive |
فئوی |
0 = کلا 1 = نعم |
||
الکسور Fractures |
فئوی |
0 = لا یوجد 1 = یوجد کسور |
||
تاریخ المرض Family History |
فئوی |
0 = کلا 1 = نعم |
||
الأدویة المنشطة Steroids |
فئوی |
0 = کلا 1 = نعم |
||
شرب الحلیب Milk |
فئوی |
1 = کلا 2 = قدح واحد فی الیوم 3 = أکثر من قدح واحد فی الیوم |
||
المشروبات الغازیة Beverages |
فئوی |
1 = کلا 2 = قدح واحد فی الیوم 3 = أکثر من قدح واحد فی الیوم |
وتم إجراء احصاءات وصفیة بسیطة لمتغیر الاستجابة المستمر ومتغیر کتلة الجسم وکما موضح فی الجدول (2). وأیضا تم رسم التوزیع التکراری (histogram) لبیانات المتغیرین المذکورین.
جدول (2): الوصف الاحصائی للمتغیرات المستمرة فی بیانات الدراسة |
|||||
Variables |
Minimum |
Maximum |
Mean |
SD |
Variance |
BMD (continuous) |
-3.99 |
.90 |
-1.7684 |
1.10164 |
1.214 |
BMI |
19 |
48 |
30.65 |
5.054 |
25.547 |
من الجدول (2) یبین الحد الادنى والحد الاعلى وقیمة الوسط والانحراف المعیاری والتباین للمتغیر BMD والمتغیر BMI، وکانت القیمة التباین لمتغیر BMD منخفضة هذا یدل على وجود تجانس أو تقارب بین قیم المتغیر BMD. واضح أنه من المدرجین فی الشکل (1) أن توزیع کلا المتغیرین متناظر نوعا ما. مما یعنی توفر خاصیة التوزیع الطبیعی لبیانات المتغیر المعتمد، خصوصا مع توفر عدد کبیر من المشاهدات.
الشکل (1): المدرجین التکراریین لمتغیر کتلة الجسم ومتغیر الاستجابة |
ولغرض التأکد من عدم وجود مشکلة ترابط خطی بین أعمدة مصفوفة البیانات ، تمّ حساب رتبة المصفوفة. وکانت رتبة المصفوفة تساوی 14، لذلک یمکن القول بأن أعمدة المصفوفة مستقلة خطیا. حیث أن رتبة المصفوفة تمثل عدد الأعمدة المستقلة خطیا فیها (Strang, 1993). تم أیضا حساب عامل تضخم التباین للمتغیرات التوضیحیة الداخلة فی الدراسة. ویحسب من خلال المعادلة ، حیث أن تمثل معامل التحدید المتعدد للأنموذج الذی یعتبر أن المتغیر معتمداً على باقی المتغیرات التوضیحیة (Kutner, et. al., 2004). وکانت قیم معاملات تضخم التباین کالآتی:
جدول (3): عوامل تضخم التباین للمتغیرات التوضیحیة الداخلة فی دراسة |
|||||||
Variable |
|||||||
VIF |
1.394 |
1.073 |
1.196 |
1.112 |
1.079 |
1.061 |
1.119 |
Variable |
|||||||
VIF |
1.300 |
1.055 |
1.156 |
1.030 |
1.044 |
1.063 |
1.111 |
وبما أن جمیع قیم عوامل تضخم التباین أقل من 5، فیمکن القول بأنه لا توجد مشکلة تعدد العلاقة الخطیة Multicollinearity problem بین المتغیرات التوضیحیة (Forthofer, et. al; 2006).
6.2. بناء ومقارنة النماذج:
تمّ بناء انموذج الانحدار اللوجستی الرتبی على اعتبار أن متغیر الاستجابة متغیرا فئویا قابلا للترتیب. حیث تم تقدیر معالم الانموذج واختبارالفرضیة الآتیة للوقوف على معنویة کل متغیر توضیحی:
جدول (4): انموذج الانحدار اللوجستی الرتبی |
|||||
Variables |
Coefficients |
Estimates |
Std. Error |
t value |
p value |
1|2 |
-2.500 |
0.942 |
-2.654 |
0.008 |
|
2|3 |
-0.121 |
0.931 |
-0.130 |
0.896 |
|
Age (>60) |
0.812 |
0.275 |
2.946 |
0.003 |
|
Address |
0.057 |
0.417 |
0.136 |
0.892 |
|
Job |
-0.293 |
0.404 |
-0.725 |
0.468 |
|
BMI |
-0.083 |
0.024 |
-3.515 |
0.000 |
|
Smoking |
1.821 |
0.708 |
2.572 |
0.010 |
|
Sun Exposure |
-0.863 |
0.301 |
-2.864 |
0.004 |
|
Pregnancy (>5) |
0.653 |
0.245 |
2.662 |
0.008 |
|
Menopause 2 |
1.891 |
0.333 |
5.683 |
0.000 |
|
Menopause 3 |
1.356 |
0.326 |
4.163 |
0.000 |
|
Contraceptive |
-0.318 |
0.262 |
-1.215 |
0.225 |
|
Fracture |
1.493 |
0.381 |
3.919 |
0.000 |
|
Family History |
0.572 |
0.587 |
0.973 |
0.330 |
|
Steroids |
0.685 |
0.530 |
1.292 |
0.196 |
|
Milk 2 |
-0.399 |
0.379 |
-1.054 |
0.292 |
|
Milk 3 |
-2.134 |
1.037 |
-2.058 |
0.040 |
|
Beverages 2 |
0.945 |
0.335 |
2.820 |
0.005 |
|
Beverages 3 |
1.295 |
0.660 |
1.962 |
0.050 |
یوضح الجدول (4) المعالم المقدرة للانموذج اللوجستی الرتبی مع اختبار t للوقوف على معنویة کل معلمة من معالم الانموذج. حیث أن المتغیرات (العمر، BMI، التدخین، التعرض للأشعة الشمس، الحمل، سن الیأس، الکسور، شرب اکثر من کوب واحد من الحلیب، المشروبات الغازیة) معنویة ولها تأثیر على الاصابة بمرض هشاشة العظام، وذلک لکون أن الـ p-value أقل من 0.05. من ناحیة أخرى، فإن المتغیرات (السکن، العمل، موانع الحمل، تاریخ الکسور، الادویة المنشطة، شرب کوب واحد من الحلیب) غیر معنویة ای لیس لها تأثیر على هشاشة العظام. علما أن المتغیرات التوضیحیة ذات الفئات أکثر من اثنتین تم معاملتها کمتغیرات وهمیة وحسب عدد الفئات فی المتغیر لتوضیحی.
جدول (5): نسبة الارجحیات (Odds Ratio) وحدود الثقة الخاصة بها للنموذج اللوجستی |
|||
Coefficients |
Odds Ratios |
Lower Limits |
Upper Limits |
Age (>60) |
2.252 |
1.317 |
3.883 |
Address |
1.059 |
0.466 |
2.404 |
Job |
1.34 |
0.607 |
2.97 |
BMI |
0.92 |
0.878 |
0.963 |
Smoking |
6.177 |
1.697 |
29.679 |
Sun Exposure |
0.422 |
0.231 |
0.757 |
Pregnancy (>5) |
1.921 |
1.191 |
3.118 |
Menopause 2 |
6.626 |
3.484 |
12.859 |
Menopause 3 |
3.881 |
2.063 |
7.414 |
Contraceptive |
0.728 |
0.435 |
1.215 |
Fracture |
4.45 |
2.156 |
9.678 |
Family History |
1.776 |
0.569 |
5.796 |
Steroids |
1.983 |
0.716 |
5.797 |
Milk 2 |
0.671 |
0.317 |
1.406 |
Milk 3 |
0.118 |
0.012 |
0.807 |
Beverages 2 |
2.573 |
1.345 |
5.022 |
Beverages 3 |
3.644 |
1.081 |
15.047 |
من الجدول (5) ان احتمالیة الاصابة بمرض هشاشة العظام مرتبطة طردیا مع کل من المتغیرات (العمر، السکن، العمل، التدخین، الحمل، سن الیأس، الکسور، تاریخ المرض، والأدویة المنشطة، المشروبات الغازیة). بینما تکون احتمالیة الاصابة بمرض هشاشة العظام مرتبطة عکسیا مع کل من المتغیرات (BMI، التعرض للأشعة الشمس، موانع الحمل، شرب الحلیب). مع ذلک، فإن المتغیرات (السکن، العمل، موانع الحمل، تاریخ المرض، الأدویة المنشطة) تکون ذات تأثیر غیر مهم وذلک لکون أن حدود الثقة الخاصة بنسبة الارجحیات تضمنت العدد واحد ضمن مداها.
وتمّ فی هذا الجانب أیضا تقدیر انموذج الانحدار الخطی المتعدد وذلک من خلال تقدیر دالة انحدار المتغیرات التوضیحیة على المتغیر المعتمد قبل تحویله إلى فئات، أی ان متغیر الاستجابة یعتبر متغیرا مستمرا فی هذه الحالة. ثم بعد ذلک، تم بناء نموذج انحدار خطی متعدد لانحدار المتغیرات التوضیحیة على متغیر الاستجابة وذلک بعد تحویله إلى فئات واعتباره متغیراً کمیاً متقطعاً.
جدول (6): انموذج الانحدار الخطی المتعدد باعتبار أن متغیر الاستجابة هو متغیر مستمر |
|||||
Variables |
Coefficients |
Estimates |
Std. Error |
t value |
p value |
Intercept |
-1.782 |
0.420 |
-4.245 |
0.000 |
|
Age (>60) |
-0.273 |
0.122 |
-2.242 |
0.026 |
|
Address |
-0.180 |
0.182 |
-0.992 |
0.322 |
|
Job |
0.047 |
0.179 |
0.263 |
0.793 |
|
BMI |
0.028 |
0.010 |
2.744 |
0.006 |
|
Smoking |
-0.617 |
0.238 |
-2.588 |
0.010 |
|
Sun Exposure |
0.271 |
0.126 |
2.141 |
0.033 |
|
Pregnancy (>5) |
-0.209 |
0.109 |
-1.917 |
0.056 |
|
Menopause 2 |
-0.779 |
0.142 |
-5.466 |
0.000 |
|
Menopause 3 |
-0.545 |
0.144 |
-3.784 |
0.000 |
|
Contraceptive |
0.108 |
0.116 |
0.925 |
0.355 |
|
Fracture |
-0.542 |
0.145 |
-3.737 |
0.000 |
|
Family History |
-0.245 |
0.254 |
-0.965 |
0.335 |
|
Steroids |
-0.211 |
0.211 |
-0.999 |
0.318 |
|
Milk 2 |
0.085 |
0.167 |
0.510 |
0.611 |
|
Milk 3 |
0.594 |
0.421 |
1.411 |
0.159 |
|
Beverages 2 |
-0.391 |
0.142 |
-2.75 |
0.006 |
|
Beverages 3 |
-0.608 |
0.234 |
-2.598 |
0.010 |
الجدول (6) أعلاه یوضح مقدرات معالم انموذج الانحدار الخطی المتعدد عند اعتبار أن متغیرا مستمراً. وأیضا تم إدراج نتائج اختبار t للوقوف على معنویة معاملات الانحدار. حیث کانت المتغیرات ( BMI، التدخین، اشعة الشمس، سن الیأس، الکسور، المشروبات الغازیة) معنویة ای لها تأثیر على هشاشة العظام. بینما کانت المتغیرات (عنوان السکن، المهنة، الحمل، موانع الحمل، تاریخ المرض، الادویة المنشطة، شرب الحلیب) غیر معنویة ولیس لها تأثیر على هشاشة العظام، وذلک وفقا للانموذج الخطی المتعدد.
جدول (7): انموذج الانحدار الخطی المتعدد باعتبار أن متغیر الاستجابة هو متغیر کمی متقطع |
|||||
Variables |
Coefficients |
Estimates |
Std. Error |
t value |
p value |
Intercept |
2.301 |
0.282 |
8.145 |
0.000 |
|
Age (>60) |
0.247 |
0.083 |
2.966 |
0.003 |
|
Address |
0.013 |
0.125 |
0.101 |
0.920 |
|
Job |
-0.094 |
0.123 |
-0.763 |
0.446 |
|
BMI |
-0.023 |
0.007 |
-3.234 |
0.001 |
|
Smoking |
0.422 |
0.163 |
2.586 |
0.010 |
|
Sun Exposure |
-0.262 |
0.087 |
-3.034 |
0.003 |
|
Pregnancy (>5) |
0.19 |
0.075 |
2.55 |
0.011 |
|
Menopause 2 |
0.592 |
0.098 |
6.068 |
0.000 |
|
Menopause 3 |
0.441 |
0.099 |
4.474 |
0.000 |
|
Contraceptive |
-0.076 |
0.08 |
-0.95 |
0.343 |
|
Fracture |
0.419 |
0.099 |
4.223 |
0.000 |
|
Family History |
0.207 |
0.174 |
1.191 |
0.235 |
|
Steroids |
0.146 |
0.144 |
1.014 |
0.311 |
|
Milk 2 |
-0.113 |
0.114 |
-0.991 |
0.322 |
|
Milk 3 |
-0.526 |
0.288 |
-1.824 |
0.069 |
|
Beverages 2 |
0.258 |
0.097 |
2.653 |
0.008 |
|
Beverages 3 |
0.317 |
0.16 |
1.982 |
0.048 |
الجدول (7) أعلاه یوضح مقدرات معالم انموذج الانحدار الخطی المتعدد عند اعتبار أن النسخة الفئویة من متغیر الاستجابة متغیرا کمیا متقطعاً. وأیضا تم إدراج نتائج اختبار t للوقوف على معنویة معاملات الانحدار. حیث کانت المتغیرات (العمر، BMI، التدخین، التعرض لأشعة الشمس، الحمل، سن الیأس، الکسور، شرب اکثر من کوب واحد من الحلیب، المشروبات الغازیة) معنویة ولها تأثیر على هشاشة العظام، فی حین المتغیرات ( عنوان السکن، المهنة، موانع الحمل، تاریخ المرض، الأدویة المنشطة، شرب کوب واحد من الحلیب) غیر معنویة ولیس لها تأثیر على هشاشة العظام.
ولغرض المقارنة بین النماذج الثلاثة، تمّ اعتماد معیاری أکیاکی AIC والمعلومات البیزیBIC ، حیث یمکن ملاحظة النتائج فی الجدول (8). علماً أن الانموذج المفضل وفقا لهذین المعیارین هو الانموذج الذی یحقق أقل قیمة فی المعیارین. ونلاحظ من الجدول (8) أعلاه ان أنموذج الانحدار اللوجستی الرتبی یعطی أقل قیمة AIC و BIC، وهذا یدل على انه أفضل أنموذج لتمثیل هذه البیانات، یلیه أنموذج الانحدار الخطی المتعدد (المتقطع)، وأخیراً أنموذج الانحدار الخطی المتعدد (المستمر).
جدول (8): مقارنة النماذج أعلاه باستخدام معیار معلومات أکیاکی ومعیار المعلومات البیزی |
|||
النماذج |
عدد المعالم المقدرة |
AIC |
BIC |
الانحدار اللوجستی الرتبی |
19 |
611.414 |
684.387 |
الانحدار الخطی المتعدد (مستمر) |
18 |
935.524 |
1008.497 |
الانحدار الخطی المتعدد (فئوی) |
18 |
674.605 |
747.577 |
من الناحیة الطبیة، فإن الدراسات الحیویة تشیر إلى أن المتغیرات الداخلة فی الدراسة تکون ذات تأثیر متفاوت على ارتفاع نسب الاصابة بمرض هشاشة العظام. فبعض المتغیرات المعتمدة فی الدراسات تصنف على أنها عوامل طردیة، أی أن زیادتها تزید من احتمالیة الاصابة بمرض هشاشة العظام، أو على الأقل تؤدی إلى ترقق العظام. والمتغیرات المصنفة عالمیاً على أنها ذات تأثیر طردی على فرض ظهور المرض هی (العمر خصوصا بعد الستین عاما، التدخین، الحمل لأکثر من خمسة أطفال، بلوغ سن الیأس، الکسور، المشروبات الغازیة، تاریخ المرض، الأدویة المنشطة). فیما یصنف عدد من المتغیرات التوضیحیة على أنها متغیرات ذات تأثیر سلبی على المرض، أی تنخفض فرص الاصابة بالمرض کلما ارتفعت قیمة أو فئة المتغیر التوضیحی المقصود. (مؤشر کتلة الجسم BMI، التعرض لأشعة الشمس). وأخیرا، فإن الدراسات السریریة تضاربت بشأن تأثیر بقیة المتغیرات التوضیحیة (العنوان، المهنة، موانع الحمل، شرب الحلیب) فیما إذا کان سلبیا أم ایجابیا على تطور المرض. وتحدیدا فیما یخص موانع الحمل وشرب الحلیب، حیث أشارت الدراسات أن استخدام أنواع محددة من موانع الحمل مرتبط بانخفاض کثافة العظم المعدنیة (وهو المتغیر المعتمد فی هذه الدراسة). بینما أدى استخدام أنواع أخرى من أدویة منع الحمل إلى تحسین کثافة العظام لدى النساء. وکذا الحال بالنسبة للحلیب، حیث تشیر الدراسات أن الحلیب الغنی بالبروتینات مرتبط بتدهور حالة المرض، فیما أشارت دراسات أخرى أن الحلیب الخالی من اللاکتوز مفید لصحة العظام (Kröger, et al; 1994).
وبناءاً على ما تقدم، نلاحظ توافق النماذج الثلاثة فی تشخیص اتجاه العلاقة (إیجابی سلبی) بین المتغیرات التوضیحیة والمتغیر المعتمد. کما ویلاحظ أیضا تطابقها مع ما هو متعارف علیه دولیاً فی مجال الدراسات الطبیة الخاصة بمرض هشاشة العظام. وبالرغم من توافق النماذج الثلاثة فی تحدید اتجاه العلاقة، إلا أن الأفضلیة تمیل لصالح الانموذج اللوجستی الرتبی، وذلک لکونه لا یتطلب فروضا مسبقة بخصوص توزیع الاخطاء، وأیضا لتفوقه فی معاییر المقارنة المذکورة آنفاً. وهذا یدل على أفضلیة تحویل المتغیرات المستمرة الى متغیرات فئویة رتبیة قبل تحلیلها. فعندما یکون الاهتمام فی مدى محدد من البیانات الخاصة بمتغیر الاستجابة، فإن تحویل المتغیر المستمر إلى متغیر فئوی (رتبی أو اسمی) یعطی أفضلیة ودقة لتشخیص وتفسیر العلاقة بین المتغیرات التوضیحیة والمتغیر المعتمد مقارنة فی حالة اعتماده کمتغیر مستمر. وذلک واضح من خلال مقارنة نتائج هذه الدراسة مع الدراسات العالمیة المنجزة بخصوص مرض هشاشة العظام. من ناحیة أخرى، تتفوق طریقة الانحدار اللوجستی الرتبی على الطرق الأخرى المتعارف علیها فی نمذجة البیانات المتضمنة على متغیر استجابة رتبی. ولوحظ أیضا أن دقة تشخیص العلاقة بین المتغیرات التوضیحیة الفئویة والمتغیر المعتمد الرتبی تتأثر بعدد التکرارات فی الجداول التقاطعیة بین کل متغیر توضیحی مع المتغیر المعتمد، وهذا یفسر سبب عدم معنویة (او تخبط) علاقة بعض المتغیرات التوضیحیة والتی أثبتت الدراسات السابقة تأثیرها فعلیا على مرض هشاشة العظام.
1. AL-Jumayli ,Hana Husian,(2010)," Evaluation of osteoporosis among women in the city of Mosul",MSc. Thesis, College of Nursing ,University of Mosul, Mosul ,Iraq.
2. AL-Rawi, Kashe Mahmoud,(1987),"Introduction to Regression Analysis", Directorate of Book House for Printing and Publishing, University of Mosul .,Mosul, Iraq.
3. Kadem, Amori Hade, (1988) " Introduction to Linear Regression Analysis ",Baghdad University Iraq.