در این بخش نیز بررسی آماری مدل برازش شده در دو سطح معناداری برازش مدل و ضرایب به دست آمده انجام می شود.

معناداری برازش مدل لجستیک

یکی از روش های ارزیابی میزان برازش مدل در تحلیل رگرسیون لجستیک استفاده از نسبت درستنمایی (Likelihood Ratio) است که توزیع آماره آن   می باشد و معادل آماره F در تحلیل واریانس رگرسیون خطی است.

ایده اصلی این روش مقایسه میزان درستنمایی برای مدل بزارش داده شده با مدل کامل یا اشباع شده  (Saturated Model) است و شاخص انحراف Deviance گفته می شود که بایستی مینیمم شود.

روش دیگری که مناسب بودن برازش مدل را مورد بررسی قرار میدهد، آزمون آماری Hosmer-Lemeshow یکی از پرکاربردترین آزمونهای نکویی برازش مدل لجستیک می باشد که با مقایسه نرخ مقادیر پیش بینی شده و واقعی در زیر گروه های مختلف از داده ها، مناسب بودن مدل را اندازه گیری می کند.

توزیع آماره این آزمون نیز از  پیروی می کند و فرض اولیه مورد آزمون، برابری نرخ مقادیر پیش بینی شده و واقعی است. بنابراین در صورتی که دلیل آماری بر رد فرض اولیه وجود نداشته باشد (مقدار P-Value بزرگتر از سطح معناداری باشد) نشان دهنده مناسب بودن مدل برازش داده شده می باشد.

معناداری ضرایب مدل لجستیک

آزمون معناداری ضرایب مدل رگرسیون لجستیک، با استفاده از آماره والد (Wald) انجام می شود. این آزمون معادل آزمون t در رگرسیون خطی می باشد و فرض اولیه برابری مقدار ضرایب مدل با صفر را مورد آزمون قرار می دهد.

در صورتیکه دلیلی بر رد فرض صفر بودن وجود نداشته باشد، می توان نتیجه گرفت ویژگی مربوط به آن ضریب دارای ارتباط معناداری در مدل نمی باشد و با حذف آن مجددا مدلسازی شود.

●      نسبت بخت (Odds Ratio)

در صورتی که ضریب یک ویژگی بر اساس آزمون والد معنادار شناخته شود، تفسیر میزان اثرگذاری آن بر اساس شاخص نسبت بخت انجام می شود این شاخص به معنای نسبت بخت وقوع یک پیامد با فرض تعلق به گروه اول به بخت وقوع آن در صورت تعلق به گروه دوم است.

به طور مثال:

در صورتی که احتمال بازپرداخت به موقع تسهیلات در مردان، 0.75 و در زنان 0.8 باشد، بنابراین شاخص بخت مردان در بازپرداخت به موقع، برابر با 3 و در زنان 4 می شود.  بر این اساس نسبت بخت مردان به زنان در بازپرداخت به موقع معادل 0.75 است. یعنی مردان نسبت به زنان 0.25 بخت کمتر در بازپرداخت به موقع تسهیلات خواهند داشت.

●      رابطه ضرایب مدل و نسبت بخت

تفسیر ضرایب مدل رگرسیون لجستیک بر اساس مفهوم نسبت بخت صورت می گیرد. ضرایب ویژگی های ورودی کمی به نسبت یک واحد افزایش در مقادیر آن و همچنین ضرایب ورودی های کیفی به نسبت تغییر رده (گروه) به رده مبنا (Base Category) تفسیر می گردد.

Published by

ساره واحدی
svahedi72

ساره واحدی هستم؛ دانشجوی پانزدهمین دوره "علم داده" در آکادمی دایکه، دانشجوی کارشناسی ارشد فیزیک و علاقمند به کار کردن با دیتاها