پروژه: مدل یادگیری ماشین تجمیعی – پیش‌بینی شدت ادعاهای بیمه‌ای All State

تومان

در این پروژه یادگیری ماشین تجمیعی، پیش‌بینی خواهیم کرد که چه نوع درخواست‌هایی از سوی یک شرکت بیمه دریافت خواهد شد. این پروژه با استفاده از الگوریتم‌های یادگیری ماشین تجمیعی در پایتون پیاده‌سازی شده است.

  •  درجه سختی: Moderate
  •  نوع بیزینس: Banking & Finance
  •  ابزار مورد استفاده: Python
  •  کلاس الگوریتم: Regression

قابل سفارش نیست

شناسه محصول: p-009 دسته: برچسب: , , , ,

توضیحات

آنچه که در این پروژه یاد می‌گیرید:

      • توضیحات دقیق در مورد کسب‌وکار و مشکلی که از طریق تجزیه و تحلیل داده‌ها حل می‌شود
      • بارگذاری داده‌ها با استفاده از پکیج معروف pandas در پایتون
      • بررسی اجمالی مجموعه داده‌ها و نحوه تحلیل نمونه‌ای از داده‌ها
      • تحلیل اکتشافی داده‌ها برای درک مجموعه داده‌های ادعای بیمه Allstate
      • بررسی خلاصه پنج نقطه‌ای و مطالعه توزیع داده‌ها برای متغیرهای دسته‌ای
      • پرداختن به مقادیر گمشده برای متغیرهای دسته‌ای و پیوسته
      • مواجهه با ناهنجاری‌ها با استفاده از تکنیک‌های بصری (Box-Plots)
      • تفاوت بین Label/One-Hot-Encoder و انتخاب تکنیک مناسب
      • استفاده از فرمت فایل Pickle برای ذخیره و بارگذاری مدل‌ها
      • انتخاب و حذف ویژگی‌ها با استفاده از همبستگی، واریانس ثابت و آزمون‌های آماری Chi-Square
      • آشنایی با الگوریتم‌های یادگیری ماشین تجمیعی
      • تنظیم‌ هایپرپارامترهای مدل با استفاده از توابع Sklearn
      • انتخاب مدل با استفاده از RMSE به عنوان معیاری برای ارزیابی مدل
      • استقرار مدل با ایجاد FlaskAPI

توضیحات پروژه

شرکت All State، یک شرکت بیمه شخصی در ایالات متحده، به دنبال استفاده از علم داده برای پیش‌بینی شدت و هزینه ادعاهای بیمه‌ای پس از یک حادثه غیرمنتظره است.

این پروژه یادگیری ماشین تجمیعی به شما کمک می‌کند تا بهترین شیوه‌های مورد استفاده در رویکرد یک مشکل تجزیه و تحلیل داده‌ها را از طریق زبان پایتون و تمرکز بر استفاده از بسته‌های علم داده بیاموزید. ما پیش‌بینی خواهیم کرد که ادعاهای بیمه‌ای برای All State چقدر شدت خواهد داشت. این کار را با استفاده از الگوریتم‌های یادگیری ماشین تجمیعی انجام خواهیم داد.

فناوری‌های استفاده‌شده

      • زبان: پایتون
      • کتابخانه‌ها: pandas, NumPy, seaborn, matplotlib, sklearn, shap