توضیحات
آنچه که در این پروژه یاد میگیرید:
-
-
- استنباط علّی چیست؟
- درمان و کنترل در استنباط علّی
- علّت و همبستگی
- چارچوب استنباط علّی
- مسئله بنیادین استنباط علّی
- فرضیات پایهای
- پارادوکس سیمپسون
- احتمال شرطی
- تکنیکهای استنباط علّی
- درک مسئله کسبوکار
- چارچوب تطابق
- چارچوب DoWhy
- گرافهای علّی بدون دور (DAG)
- چارچوب پیرل
- اجرای تطابق و DoWhy در پایتون
-
توضیحات پروژه
استنباط علّی به رشتهای اطلاق میشود که فرضیات و طراحی مطالعه را مورد بررسی قرار میدهد تا به محققان کمک کند تا بر اساس دادهها به نتایج علّی برسند. نتیجه علّی به تأثیر یک متغیر (که به آن درمان گفته میشود) بر یک نتیجه خاص اشاره دارد.
به عبارت سادهتر، استنباط علّی فرآیندی است که در آن علت از دادهها استنباط میشود. این فرآیند شامل مجموعهای از روشهای آماری است که به پاسخ به سؤال “چرا” چیزی اتفاق میافتد کمک میکند. در تحلیل رگرسیون استاندارد، تمرکز بر اندازهگیری میزان تغییر در X است که با تغییر در Y همراه است. اما استنباط علّی، در تضاد با آن، به بررسی این میپردازد که آیا تغییر در X موجب تغییر در Y میشود یا خیر. بنابراین، استنباط علّی میتواند به پاسخ دادن به این سؤال کمک کند که چرا Y تغییر میکند اگر X بهطور علّی به Y مرتبط باشد و تغییر Y را بتوان در قالب تغییرات X توضیح داد.
در این پروژه، ما از تکنیکهای استنباط علّی برای تعیین اثربخشی سیستم آبیاری در مرطوب کردن چمن در پایتون استفاده خواهیم کرد. این پروژه همچنین زمینهای درباره تکنیکهای مختلف استنباط علّی و فرضیات آنها به شما ارائه میدهد.
مجموعه داده پروژه
دادهها مربوط به سیستمهای آبیاری هستند که اطلاعاتی در مورد اینکه آیا چمن مرطوب میشود یا خیر بر اساس ویژگیهای خاص ارائه میدهند.
فناوریهای استفادهشده
-
-
- زبان: پایتون
- کتابخانهها: pandas, numpy, bnlearn. matplotlib
-
مراحل حل پروژه
-
-
-
- خواندن دادهها (Data Reading)
- پیشپردازش دادهها (Data Preprocessing)
- حذف دادههای پرت (Outlier Removal)
- کدگذاری تکداغ (One-Hot Encoding)
- جایگزینی مقادیر گمشده (Imputing Missing Values)
- ساخت مدلها (Model Building)
- رگرسیون خطی (Linear Regression)
- رگرسیون چندجملهای (Polynomial Regression)
- توابع پلهای (Step Functions)
- رگرسیون Piecewise (Piecewise Regression)
- توابع پایه (Basis Functions)
- رگرسیون Spline (Spline Regression)
- مدلهای تکمتغیره، دومتغیره و چندمتغیره (Univariate, Bivariate, and Multivariate Models)
- مدلهای تکمتغیره (Univariate Model)
- مدلهای دومتغیره (Bivariate Model)
- مدل رگرسیون چندگانه تطبیقی (Multivariate Adaptive Regression Splines – MARS Model)
- ارزیابی و مقایسه مدلها (Model Evaluation and Comparison)
- ردیابی آزمایشها با ML Foundry (Experiment Tracking with ML Foundry)
-
-