این دوره با هدف آشنایی دانشجویان و محققان با چگونگی پیاده سازی فرآیند داده کاوی از قبیل آماده سازی داده ها و ساخت مدل های پیشبینانه در نرم افزارهای تخصصی داده کاوی طراحی شده است.
کد دوره: ISM-1801
آموزش جامع داده کاوی در spss modeler
- مدت دوره: 40 ساعت
- مخاطب دوره: دانشجویان، پژوهشگران و متخصصان علاقهمند به حوزه داده
- دوره های پیش نیاز: آشنایی مقدماتی با مفاهیم علوم داده
- مدرسین دوره: زهرا ذوالقدر . محمد روزبه
دستاورد دوره
شرکت کنندگان پس از پایان دوره، توانایی شناخت درست و تعریف مسائل در چهارچوب ادبیات داده کاوی را خواهند داشت. همچنین می توانند مطابق با استاندارد اجرایی DM-CRISP پروژه های داده کاوی را بصورت گام به گام پیش برده و از قابلیت های نرم افزار پیشرفته SPSS Modeler در انجام فعالیت های خود استفاده نمایند.
محتوای دوره
بخش اول: آشنایی با داده کاوی و ضرورت آن به عنوان یک روش حل مساله
- ضرورت، پیشینه، تعاریف
- چرا داده کاوی؟
- جایگاه داده کاوی نسبت به سایر متدها
- ویژگی های داده کاوی و عوامل موفقیت آن
- کاربردهای بالقوه داده کاوی
- مروری بر ادبیات داده کاوی و وظایف آن
- روش های یادگیری با راهنما و بدون راهنما
- وظایف شش گانه داده کاوی
- آشنایی با نرم افزار های داده کاوی؛ تفاوت ها و نقاط قوت و ضعف هر کدام
- معرفی استانداردهای موجود در داده کاوی
- داده کاوی چگونه کار می کند؟ آشنایی با فرآیند استاندارد داده کاوی CRISP-DM
- ارائه نمونه های موردی از پروژه های داده کاوی
بخش دوم: شناسایی و آماده سازی مقدماتی داده ها
- جمع آوری داده ها در محیط نرم افزار
- فراخوانی داده ها در محیط SPSS Modeler14.2
- یکپارچه سازی داده ها
- بررسی کیفیت داده ها و پاکسازی
- بررسی شاخص های کیفی داده ها و نحوه برخورد با آنها
- تشخیص رکوردهای پرت با استفاده از آنالیز چندمتغیره Anomaly Detection
- کاهش ابعاد داده ها و ساخت شاخص ها
- کاهش ابعاد سطری داده ها
- انتخاب ویژگی های موثر (Feature Selection)
- تعریف شاخص های مرتبط و ایجاد آنها
بخش سوم: مدل های پیش بینی کننده
- مدل های مبتنی بر قانون
- طبقه بندی: انواع درخت های تصمیم
- استفاده از درخت های رگرسیونی به منظور پیش بینی
- مدل های جعبه سیاه
- ساخت مدل های پیش بینی کننده با شبکه های عصبی مصنوعی
- استنتاج مبتنی بر مورد
- بررسی مدل K- نزدیکترین همسایگی (KNN)
- مدل های تجمیعی (Bagging, Boosting, Ensemble)
- استفاده از ابزار مدلسازی پیش بینانه اتوماتیک و رتبه بندی مدل ها
- ارزیابی پیشرفته مدل های پیش بینی کننده (بررسی شاخص های ماتریس پریشانی و نمودارها)
بخش چهارم: مدل های بدون راهنما
- انواع تکنیک های خوشه بندی ( بررسی الگوریتم های K-Means و Two-Step)
- ارزیابی مدل های خوشه بندی
- استفاده از ابزار مدلسازی خوشه بندی اتوماتیک و رتبه بندی مدل ها
- قوانین پیوند (بررسی الگوریتم Apriori و استفاده از گراف Web)
برای مشاهده برنامه زمانی این دوره در تقویم آموزشی دایکه کلیک کنید.