فرآیند داده کاوی در R

کد دوره: R-1301
مطابق آخرین بررسی ها، در حال حاضر R در میان نرم افزارهای Source Open داده کاوی دارای بیشترین استفاده در سطح جهان می باشد. وجود کتابخانه ای غنی از انواع مدل ها و تکنیک ها و همچنین زبان برنامه نویسی ویژه آن،R را تبدیل به ابزاری قدرتمند برای پیاده سازی انواع ایده ها در اجرای فرآیند داده کاوی نموده است.

همین موضوع باعث شده تا اغلب دانشگاه های طراز اول دنیا R را به عنوان یکی از ابزارهای اصلی خود در پروژه های تحقیقاتی داده کاوی بکار ببرند. طی این دوره دانشجویان با اصول برنامه نویسی در R آشنا شده و قادر خواهند بود مراحل پاکسازی و آماده سازی داده ها به همراه ساخت مدل های پیش بینانه و اکتشافی را در این محیط اجرا نمایند.

محتوای دوره بخش اول: برنامه نویسی در R (به مدت 16 ساعت)

  • مدت دوره: 32 ساعت
  • مخاطب دوره:
    دانشجويان و محققان واحدهاي تحقيقاتي
  • پیش نیاز دوره:
    آشنايي مقدماتي با مفاهيم آمار کاربردي، فرآيند داده کاوي و الگوريتم هاي داده کاوي
  • مدرس:
    شبنم فیروز
    دکترای بیوالکتریک
  • داوود دوروَش
    تحلیلگر ارشد داده کاوی
  • سفارش اختصاصی این دوره
    021-66915961 ✆

​​

این بخش از دوره برای آشنایی و کسب مهارت برنامه نویسی در محیط R و همینطور الزامات و پیش نیازهای لازم جهت ورود به بخش دوم (فرآیند داده کاوی در R) می باشد.  

آشنایی با داده کاوی

  • مروری بر وظایف داده کاوی
  • فرآیند داده کاوی DM-CRISP

آشنایی با R و چگونگی برنامه نویسی با آن

  • مقدمه ای بر R
  • انواع داده ها در R
  • خواندن و نوشتن داده ها در R
  • نوشتن توابع
  • عیب یابی برنامه

شناسایی و آماده سازی داده ها

  • تغییر، ساخت و تبدیل داده ها
  • انواع آزمون فرض
  • خلاصه سازی
  • Boot-Strapping
  • رسم انواع نمودار در R
  • کاهش ابعاد: انتخاب متغیرهای موثر، PCA

محتوای دوره بخش دوم: داده کاوی در R (به مدت 16 ساعت)

این بخش از دوره کاملا بصورت عملی و پرکتیکال بوده و توانایی نسبی در برنامه نویسی R و همچنین آشنایی با مفاهیم و الگوریتم های داده کاوی برای شرکت در آن ضروری می باشد. 

علاقه مندانی که با زبان R آشنایی دارند و میخواهند تنها از محتوای پارت دوم استفاده کنند، می توانند گزینه مربوط به این بخش را در فرم ثبت نام انتخاب نمایند. 

                                هزینه شرکت در این بخش: 487,000 تومان می باشد. 

مدل سازی پیش بینانه و ارزیابی آنها

  • ​مدل های پیش بینانه
    • ​​درخت های تصمیم و رگرسیونی
    • شبکه های عصبی مصنوعی
    • الگوریتم K-NN
  • مدل پیش بینی سری زمانی ARIMA در R
  • ​مدل های تجمیعی
    • ​​روش های Bagging و Boosting و..
    • الگوریتم XGBoost
  • ارزیابی مدل ها (Cross Validation, Hold Out) 

مدل های بدون راهنما

  • ​خوشه بندی یا Clustering 
    • ​خوشه بندی سلسله مراتبی
    • ​الگوریتم K-Means
    • ​روش های Anomaly Detection
  • قوانین پیوند
    • الگوریتم Appriori

کاربردهای خاص داده کاوی در R

  • جمع آوری داده از وب (Data Crawling) 
  • متن کاوی در R 
  • آشنایی با نظرکاوی یا تحلیل احساس (Sentiment Analysis)

  • ثبت نام عمومی این دوره
    874 هزار تومان

    ثبت نام عمومی - با تخفیف
    743 هزار تومان
    افرادی که طی یک سال قبل حداقل در 2 دوره آموزشی دایکه حضور داشته اند یا دارای کارت معتبر دانشجویی می باشند

مشتریان و همکاران دایکه


    • شهرک علمی و تحقیقاتی اصفهان

    • دانشگاه صنعتی اصفهان

    • دانشگاه صنعتی شریف

    • دانشگاه صنعتی شریف مرکز کیش

    • دانشگاه تهران

    • دانشگاه علم و صنعت ایران

    • دانشگاه علوم پزشکی جندی شاپور اهواز

    • دانشگاه صنعتی شاهرود

    • دانشگاه آزاد اسلامی

    • بانک سامان

    • بانک تجارت

    • بانک توسعه صادرات

    • بانک سپه

    • بانک اقتصاد نوین

    • بانک مسکن

    • بیمه سامان

    • بیمه مرکزی ایران

    • شرکت خودروسازی سایپا

    • شرکت خودروسازی پارس خودرو

    • پرشیا خودرو، نمایندگی رسمی بی ام دبلیو

    • سازمان مدیریت صنعتی

    • نیروی انتظامی ایران

    • سازمان تامین اجتماعی

    • شرکت ملی نفت ایران

    • شرکت ذوب آهن اصفهان

    • شرکت کیش ویر

    • ایرانسل

    • همراه اول

    • شرکت خدمات اینفورماتیک ایران

    • گروه سایت های پرشین بلاگ