رفتن به محتوا
تحلیل کلان داده
تقویم آموزشی
مستندات دوره
هفته اول
مقدمه ای بر کلان داده ها: ضرورتها ، مزیت‌ها و محدودیتهای آن درس نمونه
ضرورتها ، مزیت‌ها و محدودیتهای کلان داده
اکوسیستم Hadoop: مفاهیم و ابزارها
مقدمه و معرفی اکوسیستم Hadoop
اجزای اکوسیستم Hadoop
پیش نیازهای نصب Hadoop – بخش اول
پیش نیازهای نصب Hadoop – بخش دوم
نصب کلاستر Hadoop
کار کردن با HDFS
معرفی Hadoop YARN
معرفی Hadoop MapReduce
آشنایی با مدل پردازشی MapReduce
رفع اشکال آنلاین 1 درس نمونه آنلاین زنده (اختیاری)
هفته دوم
انبار داده توزیع شده Apache Hive
مقدمه و معرفی Apache Hive
روش نصب و کانفیگ Apache Hive
ایجاد جداول Hive MetaStore و شروع کار با Hive
استفاده از Zeppelin جهت اتصال به Hive و انجام کوئری و مصورسازی
روش کار با فرمت-فایل های Column-Base در Hive
دیتابیس های No-SQL
معرفی دیتابیس های NoSQL و نصب MongoDB
اتصال به MongoDB و شروع کار و عملیات داده ای در آن
معرفی Replicaset در MongoDB و ایجاد و اتصال به آن
معرفی Elastic و ELK Stack
رفع اشکال آنلاین 2 آنلاین زنده (اختیاری)
هفته سوم
Apache Spark: مقدمه، تعریف و آماده سازی
مروری بر مباحث گذشته
معرفی اسپارک و اجزای آن
کاربرد اسپارک در پروژه های واقعی
نصب اسپارک روی YARN
معرفی Data Structure ها و پردازش آنها در اسپارک
ساختار داده های تعریف شده در اسپارک
شروع کار با Spark SQL و استفاده از read/write-API
انجام EDA و کوئری روی داده‌ی HDFS
توابع موجود در Spark SQL – بخش اول
توابع موجود در Spark SQL – بخش دوم
توابع آماری موجود در Spark SQL
توابع رشته ای موجود در Spark SQL
اتصال Spark SQL به دیتابیس های رابطه ای (MySQL)
اتصال Spark SQL به دیتابیس MongoDB
اجرای یک مثال از فرایند ETL
روش کار با RDD در اسپارک
مانیتور کردن job ها در اسپارک
مانیتور کردن job ها در اسپارک
جمع بندی مباحث و مقدمه ای بر Spark Streaming و Spark ML
جمع بندی مباحث و مقدمه ای بر Spark Streaming و Spark ML
رفع اشکال آنلاین 3 آنلاین زنده (اختیاری)
هفته چهارم
معرفی و مقدمه ای بر PySpark
معرفی و مقدمه ای بر PySpark
تحلیل اکتشافی داده در PySpark
تحلیل اکتشافی داده ها – بخش 1
تحلیل اکتشافی داده ها – بخش 2
تحلیل اکتشافی داده ها – بخش 3
نحوه هندل کردن Missing Value ها
پیاده سازی مساله رگرسیون در PySpark
پیاده سازی مدل رگرسیون خطی – بخش 1
پیاده سازی مدل رگرسیون خطی – بخش 2
پیاده سازی مدل رگرسیون خطی – بخش 3
پیاده سازی مدل رگرسیون خطی – بخش 4
پیاده سازی مساله طبقه بندی در PySpark
پیاده سازی مدل رگرسیون لجستیک – بخش 1
پیاده سازی مدل رگرسیون لجستیک – بخش 2
پیاده سازی مدل رگرسیون لجستیک – بخش 3
پیاده سازی مدل رگرسیون لجستیک – بخش 4
پیاده سازی مساله خوشه بندی در PySpark
خوشه بندی به کمک K-Means – بخش 1
خوشه بندی به کمک K-Means – بخش 2
آشنایی با پلتفرم Apache Kafka
آشنایی با پلتفرم Apache Kafka
رفع اشکال آنلاین 4 آنلاین زنده (اختیاری)
فرم نظرسنجی و درخواست گواهینامه (تحلیل کلان داده)
درس قبلی
موضوع بعدی

مقدمه ای بر کلان داده ها: ضرورتها ، مزیت‌ها و محدودیتهای آن

  1. تحلیل کلان داده
  2. مقدمه ای بر کلان داده ها: ضرورتها ، مزیت‌ها و محدودیتهای آن
محتوای درس
0% تکمیل‌شده 0/1 مرحله
ضرورتها ، مزیت‌ها و محدودیتهای کلان داده
درس قبلی
بازگشت به دوره
موضوع بعدی
درخواست مشاوره رایگان ×

برای دریافت مشاوره رایگان، فرم زیر را پر کنید تا کارشناسان ما با شما تماس بگیرند.

    Call Center