توضیحات
آنچه که در این پروژه یاد میگیرید:
-
-
- درک صورتمسئله قیمتگذاری بیمه
- تحلیل اکتشافی دادهها (EDA) برای متغیرهای دستهای و پیوسته
- تحلیل تکمتغیره (Univariate Analysis)
- تحلیل دومتغیره (Bivariate Analysis)
- درک تحلیل همبستگی (Correlation Analysis)
- بررسی همبستگی متغیرهای دستهای با استفاده از آزمون کای-اسکوئر (Chi-squared Test)
- بررسی همبستگی بین متغیرهای دستهای و متغیر هدف با استفاده از آزمون ANOVA
- برچسبگذاری متغیرهای دستهای با Label Encoding
- بررسی پیشفرضهای رگرسیون خطی (Linear Regression Assumptions)
- پیادهسازی مدل رگرسیون خطی (Linear Regression)
- اعتبارسنجی پیشفرضهای رگرسیون خطی
- آشنایی با مدل رگرسیون XGBoost
- پیادهسازی مدل XGBoost Regressor
- ایجاد پایپلاین (Pipeline) با استفاده از ماژول Pipeline در Sklearn
- بهینهسازی هایپرپارامترهای XGBoost با استفاده از BayesSearchCV
- ارزیابی مدلها با استفاده از معیارهای رگرسیون مانند RMSE
- ارائه گزارشهای غیرتخصصی (Non-Technical Metrics) به ذینفعان
-