توضیحات
آنچه که در این پروژه یاد میگیرید:
-
-
-
-
- رگرسیون چیست؟
- مدلهای تنظیمسازی و اهمیت آنها
- نحوه پیشپردازش دادهها و استفاده از Regex برای ایجاد الگوها
- شناسایی مقادیر پرت و اصلاح آنها
- پاکسازی و پیشپردازش دادههای متنی
- برچسبگذاری اجزای کلام
- بردارسازی شمارشی
- N-grams چیست و نحوه استفاده از آنها برای شناسایی زمینه
- فواصل اطمینان چیست؟
- نحوه استفاده از فواصل اطمینان برای تعیین بازه پیشبینی
- ساخت مدلهای رگرسیون: خطی، ریدج و لاسو
- یادگیری جمعی چیست؟
- نحوه ساخت یک Voting Regressor
- ساخت اپلیکیشن وب با استفاده از FastAPI
- استقرار اپلیکیشن روی Heroku
-
-
-
توضیحات پروژه
مشتری ما یک شرکت تجمیعکننده املاک است که املاک مختلف را در سراسر کشور در پلتفرم خود فهرست میکند. مالکان املاک میتوانند املاک خود را در این پلتفرم ثبت کنند و مشتریان میتوانند مستقیماً با مالکان تماس بگیرند اگر بخواهند در مورد یک ملک اطلاعات بیشتری کسب کنند.
مشتریان متوجه شدند که قیمت املاک مشابه در همان منطقه به طور قابل توجهی متفاوت است. آنها با تیم پشتیبانی تماس گرفتند و این مشکل را چندین بار مطرح کردند. این ناهماهنگی در قیمتگذاری باعث ایجاد عدم اعتماد در پلتفرم شده است، بنابراین شرکت از ما خواسته تا مدلی برای کشف و تنظیم قیمت بسازیم که بتواند بازه قیمت یک ملک را بر اساس ویژگیهایی مانند مساحت، نوع آپارتمان، امکانات و غیره تخمین بزند.
این پروژه شامل ساخت یک مدل رگرسیون برای پیشبینی قیمت، توسعه یک برنامه وب برای همان منظور با استفاده از فریمورک FAST API و استقرار آن در هروکو است.
مجموعه داده پروژه
دیتاست حاوی اطلاعات مربوط به ۲۰۰ ملک در پونه، ماهاراشترا، هند است که شامل ویژگیهایی مانند مساحت، امکانات، توضیحات، نوع آپارتمان و غیره میباشد.
فناوریهای استفادهشده
-
-
- زبان: پایتون
- کتابخانهها: pandas, numpy, scipy, matplotlib, seaborn, sklearn, nltk, statsmodel
-
مراحل حل پروژه
-
-
- خواندن دادهها
- پیشپردازش دادهها
- تمیزکاری دادههای دستهبندیشده
- تمیزکاری دادههای پیوسته
- استفاده از کتابخانه Regex
- تحلیل دادههای یکمتغیره
- تحلیل دادههای چندمتغیره
- درمان نقاط پرت
- استخراج ویژگیها
- پردازش دادههای متنی
- برچسبگذاری اجزای جمله
- برداریشدن شمارش و n-grams
- ساخت مدلهای یادگیری ماشین
- رگرسیون خطی
- فاصله اطمینان
- منظمسازی
- رگرسیون ریج
- رگرسیون لاسو
- رگرسور رأیگیری
- استقرار مدل
- APIها
- توسعه وب اپلیکیشن با استفاده از FastAPI
- استقرار در Heroku
- پایپ لاین استنباط مدل
-