مقالات آموزشی علم داده

مقالات آموزشی بخش نشریه

نمودارها و ارتباط‌سنجی داده‌ها در تحلیل اکتشافی (EDA)

در این پست ابتدا خلاصه جلسه و سپس متن کامل جلسه آموزشی را مطالعه خواهید کرد: خلاصه‌ی جلسه: ۱. هدف جلسه بررسی کیفیت داده‌ها با تمرکز بر نقاط پرت (Outliers). تحلیل بصری و آماری برای شناسایی روابط بین ویژگی‌ها و متغیر هدف. گسترش تحلیل به ارتباط بین خود ویژگی‌ها جهت جلوگیری از هم‌خطی در مدل‌ها. […]

نمودارها و ارتباط‌سنجی داده‌ها در تحلیل اکتشافی (EDA) Read More »

خطای ModuleNotFoundError هنگام نصب کتابخانه جدید پایتون

❓ سوال: در اجرای پروژه دوم مسیر یادگیری دیتا ساینس (بخش شیرجه در علم داده)، هنگام استفاده از oversampling برای کلاس اقلیت با RandomOverSampler از کتابخانه imbalanced-learn، با خطای ModuleNotFoundError مواجه شدم. به همین دلیل، با توجه به پیشنهاد ChatGPT، تلاش کردم دو کتابخانه scikit-learn و imbalanced-learn را با نسخه‌های خاص زیر نصب کنم: pip

خطای ModuleNotFoundError هنگام نصب کتابخانه جدید پایتون Read More »

آموزش یا هوش مصنوعی: کدام مسیر در پروژه‌های تمرینی بهتر است؟

❓ سوال: در نخستین پروژه‌های تمرینی در مسیر یادگیری دیتاساینس که با کمک ChatGPT  انجام می‌دهیم، بهتر است دقیقاً مطابق مراحل آموزش ویدئو پیش برویم یا از پیشنهادات تکمیلی ChatGPT هم استفاده کنیم؟در نهایت، آیا این تفاوت‌ها در نتیجه نهایی تأثیر قابل توجهی دارند؟ ✅ پاسخ: در استفاده از مدل‌های زبانی هوش مصنوعی مانند ChatGPT،

آموزش یا هوش مصنوعی: کدام مسیر در پروژه‌های تمرینی بهتر است؟ Read More »

آشنایی با سرویس ChatGPT

در این بخش، به بررسی ابزار ChatGPT می‌پردازیم؛ ابزاری مبتنی بر هوش مصنوعی که بسیاری از شما با آن آشنا هستید و احتمالاً برخی از شما تجربه استفاده از آن را دارید. ChatGPT یک مدل زبانی است که می‌تواند متن تولید کند، مکالمه انجام دهد و در بسیاری از حوزه‌ها به‌عنوان یک دستیار هوشمند عمل

آشنایی با سرویس ChatGPT Read More »

اولین پروژه دیتاساینس

ما تا اینجا درباره کلیات دیتا ساینس صحبت کردیم و با متدولوژی CRISP-DM آشنا شدیم؛ چارچوبی که به ما نشان می‌دهد چگونه از نقطه صفر شروع کنیم، مسئله را تعریف کنیم و قدم‌به‌قدم پیش برویم تا آن مسئله را حل کنیم. اکنون وارد یکی از مهم‌ترین بخش‌های یادگیری علم داده می‌شویم: اجرای عملی اولین پروژه.

اولین پروژه دیتاساینس Read More »

انواع وظایف در علم داده

زمانی که ما در علم داده با دیتاها کار می‌کنیم، در واقع با انواع متفاوتی از یادگیری مواجه هستیم: یادگیری با نظارت (Supervised Learning) یادگیری بدون نظارت (UnSupervised Learning) یادگیری نیمه نظارتی (Semi-Supervised Learning) یادگیری تقویتی (Reinforcement learning) در اینجا قصد داریم برای هر یک از این روش‌ها توضیح مختصری بیان کنیم. یادگیری با نظارت

انواع وظایف در علم داده Read More »

چگونه مطالعه کنیم؟

مسیر یادگیری دیتاساینس که در دایکه طراحی شده است شامل یادگیری آیتم‌ها و مواردی است که هم به شکل تئوری و هم تمرینی ارائه می‌شود. یک سؤال رایج این است که چگونه این حجم از محتوا را مدیریت کنیم؟ این محتوا شامل: چندین ساعت ویدیوی آموزشی در هفته کلاس‌های آنلاین پروژه‌ها و تمرین‌های عملی ماهیت

چگونه مطالعه کنیم؟ Read More »

آمار و احتمال در علم داده

در حوزه داده‌کاوی، دو بال اصلی برای تحلیل داده وجود دارد: رویکردهای مبتنی بر آمار و احتمال رویکردهای مبتنی بر یادگیری ماشین هرکدام از این رویکردها نقشی اساسی در حل مسائل داده‌محور دارند. در این بخش، به بررسی ساختار، تعاریف و تاریخچه‌ای مختصر از این رویکردها پرداخته و جمع‌بندی کلی ارائه می‌دهیم. مبانی آمار و

آمار و احتمال در علم داده Read More »

شناخت انواع داده

هنگامی که از “علم داده” صحبت می‌کنیم، باید مشخص کنیم که منظور از “داده” چیست. علاوه بر این، بخش “علم” که قبلاً به آن اشاره شد، شامل چه رویکردهایی است؟ این دو مفهوم، پایه‌های اصلی علوم داده هستند و عمدتاً در رویکردهای تحلیلی شامل آمار، احتمال و یادگیری ماشین تعریف می‌شوند. در ابتدا، به بررسی

شناخت انواع داده Read More »

پوزیشن های شغلی علم داده – بخش2

در پست قبل (جلسه قبل) درباره موقعیت‌های شغلی مختلف در حوزه دیتا ساینس صحبت کردیم. چهار نقش کلیدی که به آن‌ها اشاره شد عبارت بودند از: دیتا آنالیست: مشابه بیزینس آنالیست که با داده‌ها سر و کار دارد. دیتا ساینتیست: مسیری که عموماً هدف اصلی این حوزه محسوب می‌شود. مهندس ماشین لرنینگ (ML Engineer): فردی

پوزیشن های شغلی علم داده – بخش2 Read More »

درخواست مشاوره رایگان ×

    Call Center
    سبد خرید شما
    هیچ محصولی در سبد خرید نیست.

    ورود به حساب کاربری

    ایجاد حساب کاربری