درباره دوره
طی این دوره 3 هفته ای با مفاهیم کلان داده ها، ابزارها، پلتفرم های رایج و همچنین محیط های تحلیلی از جمله Pyspark در کلان داده آشنا می شوید. آشنایی با مفاهیم پایه هادوپ و اکوسیستم بیگ دیتا و نحوه کارکردن با برخی ابزارهای مهم و پرکاربرد مانند انبار داده توزیع شده Apache Hive و پایگاه داده های No-SQL مانند Mongo DB شانس بالاتری در جذب تیم های حرفه ای دیتاساینس فراهم می سازد. همچنین آشنایی با اجزای اسپارک Spark و استفاده از توانمندیهای مهم آن مانند Spark SQL و Pyspark مهارت های مهم و قابل انتظار از دانشمندان داده در شرکت های بزرگ و اینترپرایز می باشد.
محتوای این کورس در کنار کورس کاربری لینوکس و داکر به عنوان گام چهارم مسیر دانشمند داده هستند و آمادگی لازم برای موقعیت شغلی جونیور دیتا ساینتیست را در تیم های حرفه ای و شرکت های اینترپرایز فراهم می کند.