توضیحات
آنچه که در این پروژه یاد میگیرید:
-
-
- توضیحات دقیق در مورد کسبوکار و مشکلی که از طریق تجزیه و تحلیل دادهها حل میشود
- بارگذاری دادهها با استفاده از پکیج معروف pandas در پایتون
- بررسی اجمالی مجموعه دادهها و نحوه تحلیل نمونهای از دادهها
- تحلیل اکتشافی دادهها برای درک مجموعه دادههای ادعای بیمه Allstate
- بررسی خلاصه پنج نقطهای و مطالعه توزیع دادهها برای متغیرهای دستهای
- پرداختن به مقادیر گمشده برای متغیرهای دستهای و پیوسته
- مواجهه با ناهنجاریها با استفاده از تکنیکهای بصری (Box-Plots)
- تفاوت بین Label/One-Hot-Encoder و انتخاب تکنیک مناسب
- استفاده از فرمت فایل Pickle برای ذخیره و بارگذاری مدلها
- انتخاب و حذف ویژگیها با استفاده از همبستگی، واریانس ثابت و آزمونهای آماری Chi-Square
- آشنایی با الگوریتمهای یادگیری ماشین تجمیعی
- تنظیم هایپرپارامترهای مدل با استفاده از توابع Sklearn
- انتخاب مدل با استفاده از RMSE به عنوان معیاری برای ارزیابی مدل
- استقرار مدل با ایجاد FlaskAPI
-