آموزش

خلاصه سازی آماری؛ کلیدِ فهم داده‌ها

ما در بخش «کاربرد آمار و احتمال در حوزه‌ی علم داده» یک دسته‌بندی داشتیم؛ گفتیم یک زیربنای تئوریک از احتمال وجود دارد که به کار می‌آید و روی آن، سه سطح ابزارهای آماری قرار می‌گیرند که به‌شدت پرکاربرد می‌شوند: یک‌سری ابزارها در حوزه‌ی خلاصه‌سازی داده‌ها، یک‌سری ابزارها در حوزه‌ی ارتباطی، و یک‌سری هم در حوزه‌ی […]

خلاصه سازی آماری؛ کلیدِ فهم داده‌ها Read More »

توزیع احتمال؛ چرایی و چگونگی

موضوع دیگری که در ادامه مباحث مربوط به تئوری احتمال می‌خواهیم در مورد آن صحبت کنیم، مربوط به توزیع احتمال و بحث مربوط به متغیر تصادفی است. متغیر تصادفی متغیر تصادفی چیز عجیب و غریبی نیست. تک‌تک آن ویژگی‌ها (Features) که شما در یک دیتاست دارید، یک متغیر تصادفی هستند. به عنوان مثال: در داده‌های

توزیع احتمال؛ چرایی و چگونگی Read More »

خطای ModuleNotFoundError هنگام نصب کتابخانه جدید پایتون

❓ سوال: در اجرای پروژه دوم مسیر یادگیری دیتا ساینس (بخش شیرجه در علم داده)، هنگام استفاده از oversampling برای کلاس اقلیت با RandomOverSampler از کتابخانه imbalanced-learn، با خطای ModuleNotFoundError مواجه شدم. به همین دلیل، با توجه به پیشنهاد ChatGPT، تلاش کردم دو کتابخانه scikit-learn و imbalanced-learn را با نسخه‌های خاص زیر نصب کنم: pip

خطای ModuleNotFoundError هنگام نصب کتابخانه جدید پایتون Read More »

آموزش یا هوش مصنوعی: کدام مسیر در پروژه‌های تمرینی بهتر است؟

❓ سوال: در نخستین پروژه‌های تمرینی در مسیر یادگیری دیتاساینس که با کمک ChatGPT  انجام می‌دهیم، بهتر است دقیقاً مطابق مراحل آموزش ویدئو پیش برویم یا از پیشنهادات تکمیلی ChatGPT هم استفاده کنیم؟در نهایت، آیا این تفاوت‌ها در نتیجه نهایی تأثیر قابل توجهی دارند؟ ✅ پاسخ: در استفاده از مدل‌های زبانی هوش مصنوعی مانند ChatGPT،

آموزش یا هوش مصنوعی: کدام مسیر در پروژه‌های تمرینی بهتر است؟ Read More »

معرفی سرویس Kaggle

در این پست ابتدا خلاصه جلسه و سپس متن کامل جلسه آموزشی را مطالعه خواهید کرد: امکانات و خدمات Kaggle Kaggle خدمات متنوعی را برای متخصصان و علاقه‌مندان به حوزه داده فراهم می‌کند که مهم‌ترین آن‌ها عبارت‌اند از: مسابقات (Competitions): شرکت‌ها و سازمان‌ها، مجموعه داده‌های خود را در قالب مسابقات منتشر می‌کنند. افراد از سراسر

معرفی سرویس Kaggle Read More »

آشنایی با سرویس ChatGPT

در این بخش، به بررسی ابزار ChatGPT می‌پردازیم؛ ابزاری مبتنی بر هوش مصنوعی که بسیاری از شما با آن آشنا هستید و احتمالاً برخی از شما تجربه استفاده از آن را دارید. ChatGPT یک مدل زبانی است که می‌تواند متن تولید کند، مکالمه انجام دهد و در بسیاری از حوزه‌ها به‌عنوان یک دستیار هوشمند عمل

آشنایی با سرویس ChatGPT Read More »

اولین پروژه دیتاساینس

ما تا اینجا درباره کلیات دیتا ساینس صحبت کردیم و با متدولوژی CRISP-DM آشنا شدیم؛ چارچوبی که به ما نشان می‌دهد چگونه از نقطه صفر شروع کنیم، مسئله را تعریف کنیم و قدم‌به‌قدم پیش برویم تا آن مسئله را حل کنیم. اکنون وارد یکی از مهم‌ترین بخش‌های یادگیری علم داده می‌شویم: اجرای عملی اولین پروژه.

اولین پروژه دیتاساینس Read More »

انواع وظایف در علم داده

زمانی که ما در علم داده با دیتاها کار می‌کنیم، در واقع با انواع متفاوتی از یادگیری مواجه هستیم: یادگیری با نظارت (Supervised Learning) یادگیری بدون نظارت (UnSupervised Learning) یادگیری نیمه نظارتی (Semi-Supervised Learning) یادگیری تقویتی (Reinforcement learning) در اینجا قصد داریم برای هر یک از این روش‌ها توضیح مختصری بیان کنیم. یادگیری با نظارت

انواع وظایف در علم داده Read More »

چگونه مطالعه کنیم؟

مسیر یادگیری دیتاساینس که در دایکه طراحی شده است شامل یادگیری آیتم‌ها و مواردی است که هم به شکل تئوری و هم تمرینی ارائه می‌شود. یک سؤال رایج این است که چگونه این حجم از محتوا را مدیریت کنیم؟ این محتوا شامل: چندین ساعت ویدیوی آموزشی در هفته کلاس‌های آنلاین پروژه‌ها و تمرین‌های عملی ماهیت

چگونه مطالعه کنیم؟ Read More »

پوزیشن های شغلی علم داده – بخش1

دانشمند داده: شخصی که آمار را بهتر از هر مهندس کامپیوتری می‌داند و مهندسی کامپیوتر را بهتر از هر متخصص آماری می‌فهمد. لازم به ذکر است که در این تعریف، مهارت‌های موردنیاز به دو بخش تقسیم شده‌اند: مهارت‌های مرتبط با مهندسی نرم‌افزار و علوم کامپیوتر. مهارت‌های مرتبط با ریاضیات، آمار و الگوریتم‌ها. این تعریف نشان

پوزیشن های شغلی علم داده – بخش1 Read More »

سبد خرید
درخواست مشاوره رایگان ×

    Call Center