پروژه: رویکرد عملی به استنباط علّی در یادگیری ماشین

تومان

در این پروژه یادگیری ماشین، شما یاد خواهید گرفت که چگونه تکنیک‌های مختلف استنباط علّی را در پایتون پیاده‌سازی کنید تا تعیین کنید که چقدر سیستم آبیاری در مرطوب کردن چمن مؤثر است.

  •  درجه سختی: Easy
  •  نوع بیزینس: Other
  •  ابزار مورد استفاده: Python
  •  کلاس الگوریتم: Regression

قابل سفارش نیست

شناسه محصول: p-005 دسته: برچسب: , , ,

توضیحات

آنچه که در این پروژه یاد می‌گیرید:

      • استنباط علّی چیست؟
      • درمان و کنترل در استنباط علّی
      • علّت و همبستگی
      • چارچوب استنباط علّی
      • مسئله بنیادین استنباط علّی
      • فرضیات پایه‌ای
      • پارادوکس سیمپسون
      • احتمال شرطی
      • تکنیک‌های استنباط علّی
      • درک مسئله کسب‌وکار
      • چارچوب تطابق
      • چارچوب DoWhy
      • گراف‌های علّی بدون دور (DAG)
      • چارچوب پیرل
      • اجرای تطابق و DoWhy در پایتون

توضیحات پروژه

استنباط علّی به رشته‌ای اطلاق می‌شود که فرضیات و طراحی مطالعه را مورد بررسی قرار می‌دهد تا به محققان کمک کند تا بر اساس داده‌ها به نتایج علّی برسند. نتیجه علّی به تأثیر یک متغیر (که به آن درمان گفته می‌شود) بر یک نتیجه خاص اشاره دارد.

به عبارت ساده‌تر، استنباط علّی فرآیندی است که در آن علت از داده‌ها استنباط می‌شود. این فرآیند شامل مجموعه‌ای از روش‌های آماری است که به پاسخ به سؤال “چرا” چیزی اتفاق می‌افتد کمک می‌کند. در تحلیل رگرسیون استاندارد، تمرکز بر اندازه‌گیری میزان تغییر در X است که با تغییر در Y همراه است. اما استنباط علّی، در تضاد با آن، به بررسی این می‌پردازد که آیا تغییر در X موجب تغییر در Y می‌شود یا خیر. بنابراین، استنباط علّی می‌تواند به پاسخ دادن به این سؤال کمک کند که چرا Y تغییر می‌کند اگر X به‌طور علّی به Y مرتبط باشد و تغییر Y را بتوان در قالب تغییرات X توضیح داد.

در این پروژه، ما از تکنیک‌های استنباط علّی برای تعیین اثربخشی سیستم آبیاری در مرطوب کردن چمن در پایتون استفاده خواهیم کرد. این پروژه همچنین زمینه‌ای درباره تکنیک‌های مختلف استنباط علّی و فرضیات آن‌ها به شما ارائه می‌دهد.

مجموعه داده پروژه

داده‌ها مربوط به سیستم‌های آبیاری هستند که اطلاعاتی در مورد اینکه آیا چمن مرطوب می‌شود یا خیر بر اساس ویژگی‌های خاص ارائه می‌دهند.

فناوری‌های استفاده‌شده

      • زبان: پایتون
      • کتابخانه‌ها: pandas, numpy, bnlearn. matplotlib

مراحل حل پروژه

        • خواندن داده‌ها (Data Reading)
        • پیش‌پردازش داده‌ها (Data Preprocessing)
          • حذف داده‌های پرت (Outlier Removal)
          • کدگذاری تک‌داغ (One-Hot Encoding)
          • جایگزینی مقادیر گمشده (Imputing Missing Values)
        • ساخت مدل‌ها (Model Building)
          • رگرسیون خطی (Linear Regression)
          • رگرسیون چندجمله‌ای (Polynomial Regression)
          • توابع پله‌ای (Step Functions)
          • رگرسیون Piecewise (Piecewise Regression)
          • توابع پایه (Basis Functions)
          • رگرسیون Spline (Spline Regression)
        • مدل‌های تک‌متغیره، دو‌متغیره و چند‌متغیره (Univariate, Bivariate, and Multivariate Models)
          • مدل‌های تک‌متغیره (Univariate Model)
          • مدل‌های دو‌متغیره (Bivariate Model)
          • مدل رگرسیون چندگانه تطبیقی (Multivariate Adaptive Regression Splines – MARS Model)
        • ارزیابی و مقایسه مدل‌ها (Model Evaluation and Comparison)
        • ردیابی آزمایش‌ها با ML Foundry (Experiment Tracking with ML Foundry)