توضیحات
آنچه که در این پروژه یاد میگیرید:
-
-
- Step Function چیست؟
- Heaviside Function چیست؟
- محدودیتهای رگرسیون چندجملهای چیست؟
- رگرسیون Piecewise چیست؟
- رگرسیون Piecewise چگونه در پایتون پیادهسازی میشود؟
- Log-Likelihood چیست؟
- Adaptive Subdivision و Sequential Search چیست؟
- درک آزمون Davies (Davies Test)
- Basis Functions چیست؟
- چرا Basis Functions مهم هستند؟
- Basis Functions چگونه در پایتون پیادهسازی میشوند؟
- Splines چیست؟
- چگونه میتوان محدودیتهای رگرسیون Piecewise را با Splines برطرف کرد؟
- درجه آزادی (Degrees of Freedom) چیست؟
- B-splines چیست؟
- Cubic Splines چیست؟
- درک چندجملهایهای Bernstein و تبدیلهای Weierstrass (Bernstein Polynomials and Weierstrass Transforms)
- رگرسیون Spline چگونه در پایتون پیادهسازی میشود؟
- Multivariate Adaptive Regression Splines (MARS) چیست؟
- پیادهسازی MARS در پایتون
- چگونه میتوان با استفاده از ML Foundry آزمایشهای مدل را پیگیری کرد؟
-
توضیحات پروژه
این مسئله شامل پیشبینی امتیازاتی است که یک تیم ورزشی بر اساس عملکرد تمرینی خود کسب میکند. این عملکرد شامل ویژگیهایی مانند تعداد جلسات یوگا، تعداد دورهای انجامشده، میزان مصرف آب، جلسات وزنهبرداری و موارد دیگر است. راهحل یادگیری ماشین برای این مسئله به ذینفعان اصلی کمک میکند تا عملکرد تمرینی تیم را نظارت کرده و بهبود بخشند.
این پروژه ادامه پروژه قبلی، یادگیری ساخت مدل رگرسیون چندجملهای از ابتدا است که در آن یک مدل رگرسیون چندجملهای برای پیشبینی امتیازات تیم ورزشی ساخته شد. این پروژه شامل پیادهسازی رگرسیون Piecewise و تکنیکهای مختلف رگرسیون Spline برای بهبود نتایج قبلی است.
رگرسیون Piecewise، که به آن رگرسیون قطعهای یا بخشبندیشده نیز گفته میشود، نوعی تحلیل رگرسیون است که در آن متغیر مستقل به بازههایی تقسیم شده و برای هر بازه توابع خطی مختلف برازش میشود. دلیل استفاده از رگرسیون خطی قطعهای این است که اگر دادهها در بخشهای مختلف خود رفتارهای خطی متفاوتی داشته باشند، میتوان تابع رگرسیون کلی را در چندین “قطعه” مدلسازی کرد. و رگرسیون Spline یا درونیابی Spline یک تابع پیوسته قطعهای تولید میکند که از چندین تابع رگرسیون چندجملهای تشکیل شده است.
در این پروژه توضیحات کاملی درباره ریاضیات این مفاهیم ارائه میشود. همچنین، ردیابی آزمایشها با ML Foundry به تفصیل توضیح داده شده است تا به یادگیرندگان کمک کند مدلهای مختلف ساختهشده را پیگیری کنند.
مجموعه داده پروژه
مجموعه داده شامل اطلاعاتی درباره امتیازات کسبشده توسط تیمهای ورزشی بر اساس ویژگیهای مختلف است.
فناوریهای استفادهشده
-
-
- زبان: پایتون
- کتابخانهها: pandas, numpy, scipy, matplotlib, seaborn, sklearn, statsmodels, piecewise_regression, csaps, py-earth, mlfoundry
-
مراحل حل پروژه
-
-
-
- خواندن دادهها (Data Reading)
- پیشپردازش دادهها (Data Preprocessing)
- حذف دادههای پرت (Outlier Removal)
- کدگذاری تکداغ (One-Hot Encoding)
- جایگزینی مقادیر گمشده (Imputing Missing Values)
- ساخت مدلها (Model Building)
- رگرسیون خطی (Linear Regression)
- رگرسیون چندجملهای (Polynomial Regression)
- توابع پلهای (Step Functions)
- رگرسیون Piecewise (Piecewise Regression)
- توابع پایه (Basis Functions)
- رگرسیون Spline (Spline Regression)
- مدلهای تکمتغیره، دومتغیره و چندمتغیره (Univariate, Bivariate, and Multivariate Models)
- مدلهای تکمتغیره (Univariate Model)
- مدلهای دومتغیره (Bivariate Model)
- مدل رگرسیون چندگانه تطبیقی (Multivariate Adaptive Regression Splines – MARS Model)
- ارزیابی و مقایسه مدلها (Model Evaluation and Comparison)
- ردیابی آزمایشها با ML Foundry (Experiment Tracking with ML Foundry)
-
-