پروژه: ساخت مدل پیش‌بینی قیمت املاک با استفاده از FastAPI

تومان

در این پروژه پیش‌بینی قیمت املاک، یاد خواهید گرفت که چگونه یک مدل یادگیری ماشین برای پیش‌بینی قیمت املاک ایجاد کنید و آن را با استفاده از فریم‌ورک FastAPI روی پلتفرم Heroku پیاده‌سازی کنید.

  •  درجه سختی: Moderate
  •  نوع بیزینس: Real Estate
  •  ابزار مورد استفاده: Python
  •  کلاس الگوریتم: Regression

قابل سفارش نیست

شناسه محصول: p-013 دسته: برچسب: , , ,

توضیحات

آنچه که در این پروژه یاد می‌گیرید:

          • رگرسیون چیست؟
          • مدل‌های تنظیم‌سازی و اهمیت آن‌ها
          • نحوه پیش‌پردازش داده‌ها و استفاده از Regex برای ایجاد الگوها
          • شناسایی مقادیر پرت و اصلاح آن‌ها
          • پاک‌سازی و پیش‌پردازش داده‌های متنی
          • برچسب‌گذاری اجزای کلام
          • بردارسازی شمارشی
          • N-grams چیست و نحوه استفاده از آن‌ها برای شناسایی زمینه
          • فواصل اطمینان چیست؟
          • نحوه استفاده از فواصل اطمینان برای تعیین بازه پیش‌بینی
          • ساخت مدل‌های رگرسیون: خطی، ریدج و لاسو
          • یادگیری جمعی چیست؟
          • نحوه ساخت یک Voting Regressor
          • ساخت اپلیکیشن وب با استفاده از FastAPI
          • استقرار اپلیکیشن روی Heroku

توضیحات پروژه

مشتری ما یک شرکت تجمیع‌کننده املاک است که املاک مختلف را در سراسر کشور در پلتفرم خود فهرست می‌کند. مالکان املاک می‌توانند املاک خود را در این پلتفرم ثبت کنند و مشتریان می‌توانند مستقیماً با مالکان تماس بگیرند اگر بخواهند در مورد یک ملک اطلاعات بیشتری کسب کنند.

مشتریان متوجه شدند که قیمت املاک مشابه در همان منطقه به طور قابل توجهی متفاوت است. آنها با تیم پشتیبانی تماس گرفتند و این مشکل را چندین بار مطرح کردند. این ناهماهنگی در قیمت‌گذاری باعث ایجاد عدم اعتماد در پلتفرم شده است، بنابراین شرکت از ما خواسته تا مدلی برای کشف و تنظیم قیمت بسازیم که بتواند بازه قیمت یک ملک را بر اساس ویژگی‌هایی مانند مساحت، نوع آپارتمان، امکانات و غیره تخمین بزند.

این پروژه شامل ساخت یک مدل رگرسیون برای پیش‌بینی قیمت، توسعه یک برنامه وب برای همان منظور با استفاده از فریمورک FAST API و استقرار آن در هروکو است.

مجموعه داده پروژه

دیتاست حاوی اطلاعات مربوط به ۲۰۰ ملک در پونه، ماهاراشترا، هند است که شامل ویژگی‌هایی مانند مساحت، امکانات، توضیحات، نوع آپارتمان و غیره می‌باشد.

فناوری‌های استفاده‌شده

      • زبان: پایتون
      • کتابخانه‌ها: pandas, numpy, scipy, matplotlib, seaborn, sklearn, nltk, statsmodel

مراحل حل پروژه

      • خواندن داده‌ها

      • پیش‌پردازش داده‌ها
        • تمیزکاری داده‌های دسته‌بندی‌شده
        • تمیزکاری داده‌های پیوسته
        • استفاده از کتابخانه Regex
        • تحلیل داده‌های یک‌متغیره
        • تحلیل داده‌های چندمتغیره
        • درمان نقاط پرت
        • استخراج ویژگی‌ها
        • پردازش داده‌های متنی
        • برچسب‌گذاری اجزای جمله
        • برداری‌شدن شمارش و n-grams
      • ساخت مدل‌های یادگیری ماشین
        • رگرسیون خطی
        • فاصله اطمینان
        • منظم‌سازی
        • رگرسیون ریج
        • رگرسیون لاسو
        • رگرسور رأی‌گیری
      • استقرار مدل
        • APIها
        • توسعه وب اپلیکیشن با استفاده از FastAPI
        • استقرار در Heroku
        • پایپ لاین استنباط مدل