پروژه: ساخت مدل‌های رگرسیونی Piecewise و Spline در پایتون

تومان

در این پروژه رگرسیون، شما یاد خواهید گرفت که چگونه یک مدل رگرسیون Piecewise و Spline را از ابتدا در پایتون ایجاد کنید تا امتیازات کسب‌شده توسط یک تیم ورزشی را پیش‌بینی کنید.

  •  درجه سختی: Moderate
  •  نوع بیزینس: Entertainment
  •  ابزار مورد استفاده: Python
  •  کلاس الگوریتم: Regression

قابل سفارش نیست

شناسه محصول: p-004 دسته: برچسب: , , ,

توضیحات

آنچه که در این پروژه یاد می‌گیرید:

      • Step Function چیست؟
      • Heaviside Function چیست؟
      • محدودیت‌های رگرسیون چندجمله‌ای چیست؟
      • رگرسیون Piecewise چیست؟
      • رگرسیون Piecewise چگونه در پایتون پیاده‌سازی می‌شود؟
      • Log-Likelihood چیست؟
      • Adaptive Subdivision و Sequential Search چیست؟
      • درک آزمون Davies (Davies Test)
      • Basis Functions چیست؟
      • چرا Basis Functions مهم هستند؟
      • Basis Functions چگونه در پایتون پیاده‌سازی می‌شوند؟
      • Splines چیست؟
      • چگونه می‌توان محدودیت‌های رگرسیون Piecewise را با Splines برطرف کرد؟
      • درجه آزادی (Degrees of Freedom) چیست؟
      • B-splines چیست؟
      • Cubic Splines چیست؟
      • درک چندجمله‌ای‌های Bernstein و تبدیل‌های Weierstrass (Bernstein Polynomials and Weierstrass Transforms)
      • رگرسیون Spline چگونه در پایتون پیاده‌سازی می‌شود؟
      • Multivariate Adaptive Regression Splines (MARS) چیست؟
      • پیاده‌سازی MARS در پایتون
      • چگونه می‌توان با استفاده از ML Foundry آزمایش‌های مدل را پیگیری کرد؟

توضیحات پروژه

این مسئله شامل پیش‌بینی امتیازاتی است که یک تیم ورزشی بر اساس عملکرد تمرینی خود کسب می‌کند. این عملکرد شامل ویژگی‌هایی مانند تعداد جلسات یوگا، تعداد دورهای انجام‌شده، میزان مصرف آب، جلسات وزنه‌برداری و موارد دیگر است. راه‌حل یادگیری ماشین برای این مسئله به ذینفعان اصلی کمک می‌کند تا عملکرد تمرینی تیم را نظارت کرده و بهبود بخشند.

این پروژه ادامه پروژه قبلی، یادگیری ساخت مدل رگرسیون چندجمله‌ای از ابتدا است که در آن یک مدل رگرسیون چندجمله‌ای برای پیش‌بینی امتیازات تیم ورزشی ساخته شد. این پروژه شامل پیاده‌سازی رگرسیون Piecewise و تکنیک‌های مختلف رگرسیون Spline برای بهبود نتایج قبلی است.

رگرسیون Piecewise، که به آن رگرسیون قطعه‌ای یا بخش‌بندی‌شده نیز گفته می‌شود، نوعی تحلیل رگرسیون است که در آن متغیر مستقل به بازه‌هایی تقسیم شده و برای هر بازه توابع خطی مختلف برازش می‌شود. دلیل استفاده از رگرسیون خطی قطعه‌ای این است که اگر داده‌ها در بخش‌های مختلف خود رفتارهای خطی متفاوتی داشته باشند، می‌توان تابع رگرسیون کلی را در چندین “قطعه” مدل‌سازی کرد. و رگرسیون Spline یا درونیابی Spline یک تابع پیوسته قطعه‌ای تولید می‌کند که از چندین تابع رگرسیون چندجمله‌ای تشکیل شده است.

در این پروژه توضیحات کاملی درباره ریاضیات این مفاهیم ارائه می‌شود. همچنین، ردیابی آزمایش‌ها با ML Foundry به تفصیل توضیح داده شده است تا به یادگیرندگان کمک کند مدل‌های مختلف ساخته‌شده را پیگیری کنند.

مجموعه داده پروژه

مجموعه داده شامل اطلاعاتی درباره امتیازات کسب‌شده توسط تیم‌های ورزشی بر اساس ویژگی‌های مختلف است.

فناوری‌های استفاده‌شده

      • زبان: پایتون
      • کتابخانه‌ها: pandas, numpy, scipy, matplotlib, seaborn, sklearn, statsmodels, piecewise_regression, csaps, py-earth, mlfoundry

مراحل حل پروژه

        • خواندن داده‌ها (Data Reading)
        • پیش‌پردازش داده‌ها (Data Preprocessing)
          • حذف داده‌های پرت (Outlier Removal)
          • کدگذاری تک‌داغ (One-Hot Encoding)
          • جایگزینی مقادیر گمشده (Imputing Missing Values)
        • ساخت مدل‌ها (Model Building)
          • رگرسیون خطی (Linear Regression)
          • رگرسیون چندجمله‌ای (Polynomial Regression)
          • توابع پله‌ای (Step Functions)
          • رگرسیون Piecewise (Piecewise Regression)
          • توابع پایه (Basis Functions)
          • رگرسیون Spline (Spline Regression)
        • مدل‌های تک‌متغیره، دو‌متغیره و چند‌متغیره (Univariate, Bivariate, and Multivariate Models)
          • مدل‌های تک‌متغیره (Univariate Model)
          • مدل‌های دو‌متغیره (Bivariate Model)
          • مدل رگرسیون چندگانه تطبیقی (Multivariate Adaptive Regression Splines – MARS Model)
        • ارزیابی و مقایسه مدل‌ها (Model Evaluation and Comparison)
        • ردیابی آزمایش‌ها با ML Foundry (Experiment Tracking with ML Foundry)