پروژه: ساخت مدل‌های رگرسیونی Piecewise و Spline در پایتون

دسته بندی پروژه ها

آخرین بروزرسانی ۳ آذر ۱۴۰۴

۰ دیدگاه

- - Step Function چیست؟
  - Heaviside Function چیست؟
  - محدودیت‌های رگرسیون چندجمله‌ای چیست؟
  - رگرسیون Piecewise چیست؟
  - رگرسیون Piecewise چگونه در پایتون پیاده‌سازی می‌شود؟
  - Log-Likelihood چیست؟
  - Adaptive Subdivision و Sequential Search چیست؟
  - درک آزمون Davies (Davies Test)
  - Basis Functions چیست؟
  - چرا Basis Functions مهم هستند؟
  - Basis Functions چگونه در پایتون پیاده‌سازی می‌شوند؟
  - Splines چیست؟
  - چگونه می‌توان محدودیت‌های رگرسیون Piecewise را با Splines برطرف کرد؟
  - درجه آزادی (Degrees of Freedom) چیست؟
  - B-splines چیست؟
  - Cubic Splines چیست؟
  - درک چندجمله‌ای‌های Bernstein و تبدیل‌های Weierstrass (Bernstein Polynomials and Weierstrass Transforms)
  - رگرسیون Spline چگونه در پایتون پیاده‌سازی می‌شود؟
  - Multivariate Adaptive Regression Splines (MARS) چیست؟
  - پیاده‌سازی MARS در پایتون
  - چگونه می‌توان با استفاده از ML Foundry آزمایش‌های مدل را پیگیری کرد؟

توضیحات پروژه

این مسئله شامل پیش‌بینی امتیازاتی است که یک تیم ورزشی بر اساس عملکرد تمرینی خود کسب می‌کند. این عملکرد شامل ویژگی‌هایی مانند تعداد جلسات یوگا، تعداد دورهای انجام‌شده، میزان مصرف آب، جلسات وزنه‌برداری و موارد دیگر است. راه‌حل یادگیری ماشین برای این مسئله به ذینفعان اصلی کمک می‌کند تا عملکرد تمرینی تیم را نظارت کرده و بهبود بخشند.

این پروژه ادامه پروژه قبلی، یادگیری ساخت مدل رگرسیون چندجمله‌ای از ابتدا است که در آن یک مدل رگرسیون چندجمله‌ای برای پیش‌بینی امتیازات تیم ورزشی ساخته شد. این پروژه شامل پیاده‌سازی رگرسیون Piecewise و تکنیک‌های مختلف رگرسیون Spline برای بهبود نتایج قبلی است.

رگرسیون Piecewise، که به آن رگرسیون قطعه‌ای یا بخش‌بندی‌شده نیز گفته می‌شود، نوعی تحلیل رگرسیون است که در آن متغیر مستقل به بازه‌هایی تقسیم شده و برای هر بازه توابع خطی مختلف برازش می‌شود. دلیل استفاده از رگرسیون خطی قطعه‌ای این است که اگر داده‌ها در بخش‌های مختلف خود رفتارهای خطی متفاوتی داشته باشند، می‌توان تابع رگرسیون کلی را در چندین “قطعه” مدل‌سازی کرد. و رگرسیون Spline یا درونیابی Spline یک تابع پیوسته قطعه‌ای تولید می‌کند که از چندین تابع رگرسیون چندجمله‌ای تشکیل شده است.

در این پروژه توضیحات کاملی درباره ریاضیات این مفاهیم ارائه می‌شود. همچنین، ردیابی آزمایش‌ها با ML Foundry به تفصیل توضیح داده شده است تا به یادگیرندگان کمک کند مدل‌های مختلف ساخته‌شده را پیگیری کنند.

مجموعه داده پروژه

مجموعه داده شامل اطلاعاتی درباره امتیازات کسب‌شده توسط تیم‌های ورزشی بر اساس ویژگی‌های مختلف است.

فناوری‌های استفاده‌شده

- - زبان: پایتون
  - کتابخانه‌ها: pandas, numpy, scipy, matplotlib, seaborn, sklearn, statsmodels, piecewise_regression, csaps, py-earth, mlfoundry

مراحل حل پروژه

- - خواندن داده‌ها (Data Reading)
    
    پیش‌پردازش داده‌ها (Data Preprocessing)
    
    حذف داده‌های پرت (Outlier Removal)
    
    کدگذاری تک‌داغ (One-Hot Encoding)
    
    جایگزینی مقادیر گمشده (Imputing Missing Values)
    
    ساخت مدل‌ها (Model Building)
    
    رگرسیون خطی (Linear Regression)
    
    رگرسیون چندجمله‌ای (Polynomial Regression)
    
    توابع پله‌ای (Step Functions)
    
    رگرسیون Piecewise (Piecewise Regression)
    
    توابع پایه (Basis Functions)
    
    رگرسیون Spline (Spline Regression)
    
    مدل‌های تک‌متغیره، دو‌متغیره و چند‌متغیره (Univariate, Bivariate, and Multivariate Models)
    
    مدل‌های تک‌متغیره (Univariate Model)
    
    مدل‌های دو‌متغیره (Bivariate Model)
    
    مدل رگرسیون چندگانه تطبیقی (Multivariate Adaptive Regression Splines – MARS Model)
    
    ارزیابی و مقایسه مدل‌ها (Model Evaluation and Comparison)
    
    ردیابی آزمایش‌ها با ML Foundry (Experiment Tracking with ML Foundry)

اطلاعیه مهم: کلیه کلاس های گروه دایکه از 22 فروردین ادامه خواهد یافت و کانال هماهنگی موقت در پلتفرم "بله" با آیدی dayche@ در دسترس می باشد.

پروژه: ساخت مدل‌های رگرسیونی Piecewise و Spline در پایتون

آنچه که در این پروژه یاد می‌گیرید:

توضیحات پروژه

مراحل حل پروژه

نقد و بررسی‌ها

پروژه: ساخت مدل‌های رگرسیونی Piecewise و Spline در پایتون

پروژه: ساخت مدل‌های رگرسیونی Piecewise و Spline در پایتون

شرکت ندای کهن پرداز . گروه دایکه

تاسیس: ۱۳۹۱ . شماره ثبت: ۴۳۱۵۸۴
تهران، بزرگراه حکیم، بزرگراه ستاری، پیامبر مرکزی، جواهریان، شماره ۱۶
(مراجعه حضوری با هماهنگی قبلی)
تلفن: ۹۶۱۲۲-۹۱۰-۰۲۱

اطلاعیه مهم: کلیه کلاس های گروه دایکه از 22 فروردین ادامه خواهد یافت و کانال هماهنگی موقت در پلتفرم "بله" با آیدی dayche@ در دسترس می باشد.

آنچه که در این پروژه یاد می‌گیرید:

توضیحات پروژه

مراحل حل پروژه

نقد و بررسی‌ها

گزینه‌های ثبت‌نام

پروژه: ساخت مدل‌های رگرسیونی Piecewise و Spline در پایتون

گزینه‌های ثبت‌نام

پروژه: ساخت مدل‌های رگرسیونی Piecewise و Spline در پایتون

شرکت ندای کهن پرداز . گروه دایکه

تاسیس: ۱۳۹۱ . شماره ثبت: ۴۳۱۵۸۴ تهران، بزرگراه حکیم، بزرگراه ستاری، پیامبر مرکزی، جواهریان، شماره ۱۶ (مراجعه حضوری با هماهنگی قبلی) تلفن: ۹۶۱۲۲-۹۱۰-۰۲۱

ورود به حساب کاربری

ساخت حساب کاربری

تاسیس: ۱۳۹۱ . شماره ثبت: ۴۳۱۵۸۴
تهران، بزرگراه حکیم، بزرگراه ستاری، پیامبر مرکزی، جواهریان، شماره ۱۶
(مراجعه حضوری با هماهنگی قبلی)
تلفن: ۹۶۱۲۲-۹۱۰-۰۲۱