ساره واحدی

ساره واحدی هستم؛ دانشجوی پانزدهمین دوره "علم داده" در آکادمی دایکه، دانشجوی کارشناسی ارشد فیزیک و علاقمند به کار کردن با دیتاها

خلاصه سازی آماری؛ کلیدِ فهم داده‌ها

ما در بخش «کاربرد آمار و احتمال در حوزه‌ی علم داده» یک دسته‌بندی داشتیم؛ گفتیم یک زیربنای تئوریک از احتمال وجود دارد که به کار می‌آید و روی آن، سه سطح ابزارهای آماری قرار می‌گیرند که به‌شدت پرکاربرد می‌شوند: یک‌سری ابزارها در حوزه‌ی خلاصه‌سازی داده‌ها، یک‌سری ابزارها در حوزه‌ی ارتباطی، و یک‌سری هم در حوزه‌ی […]

خلاصه سازی آماری؛ کلیدِ فهم داده‌ها Read More »

توزیع احتمال؛ چرایی و چگونگی

موضوع دیگری که در ادامه مباحث مربوط به تئوری احتمال می‌خواهیم در مورد آن صحبت کنیم، مربوط به توزیع احتمال و بحث مربوط به متغیر تصادفی است. متغیر تصادفی متغیر تصادفی چیز عجیب و غریبی نیست. تک‌تک آن ویژگی‌ها (Features) که شما در یک دیتاست دارید، یک متغیر تصادفی هستند. به عنوان مثال: در داده‌های

توزیع احتمال؛ چرایی و چگونگی Read More »

قضیه بیز؛ راه‌حلی هوشمندانه

در این ویدیو موضوع «قاعده یا قضیه بیز» مورد بحث قرار می‌گیرد. این مبحث، یکی از مفاهیم بسیار مهم و کلیدی در حوزه‌ی احتمال و مبانی آمار است. قضیه‌ی بیز کاربرد گسترده‌ای در بخش‌های مختلفی مانند یادگیری ماشین، مدل‌سازی آماری و به‌طور کلی مباحث مربوط به «عدم قطعیت» دارد. هدف این جلسه، آشنایی با ایده‌ی

قضیه بیز؛ راه‌حلی هوشمندانه Read More »

احتمال شرطی: زیربنای الگوریتم‌های یادگیری ماشین

تا اینجا درباره‌ی مفهوم احتمال ساده و احتمال توأم صحبت کردیم و درک اولیه‌ای از احتمال توأم به دست آوردیم. یاد گرفتیم که احتمال توأم به معنای محاسبه‌ی احتمال وقوع همزمان چند پدیده است. برای مثال در داده‌های مربوط به کلینیک: احتمال آنکه یک بیمار مرد باشد، همزمان داروی خاصی برای او تجویز شود، و

احتمال شرطی: زیربنای الگوریتم‌های یادگیری ماشین Read More »

مفاهیم پایه‌ای آمار؛ از احتمال ساده تا احتمال توأم

در این جلسه به مباحث پایه‌ای و بنیادی تئوری احتمال می‌پردازیم. پیش‌تر درباره‌ی تفاوت میان آمار و احتمال صحبت شد و اکنون قصد داریم به‌صورت عمیق‌تر وارد مفاهیم تئوری احتمال شویم. این بخش در واقع همان بخش انتزاعی و نظری است که زیرساخت تمام ابزارهای آماری و مدل‌های مورد استفاده در علم داده محسوب می‌شود.

مفاهیم پایه‌ای آمار؛ از احتمال ساده تا احتمال توأم Read More »

EDA و چالش‌های آن

در این جلسه، به مرور آنچه در پروژه‌ی عملی نخست انجام دادیم می‌پردازیم و بر اساس همان تجربه، درباره‌ی فرایند EDA (تحلیل اکتشافی داده‌ها) و چالش‌های رایج در آن بحث می‌کنیم. در پروژه‌ی قبلی، گام‌به‌گام با کمک ابزارهای اجرایی و کدنویسی پیش رفتیم. کدها را اجرا کردیم، خروجی‌ها را مشاهده نمودیم و در نهایت پروژه‌ی

EDA و چالش‌های آن Read More »

پیاده‌سازی EDA

مقدمه در ادامه مباحث، وارد بخش عملی پروژه‌ی EDA بر روی داده‌های مربوط به بیماران کلینیک شدیم. تا اینجا در ویدیوی قبلی به مرحله‌ی ارتباط‌سنجی میان برخی ویژگی‌ها با متغیر هدف رسیدیم. به‌ویژه به بررسی فیلدهای سدیم و پتاسیم پرداختیم. این دو متغیر عددی ماهیتی نزدیک به هم داشتند. بنابراین مطرح کردیم که آیا بین

پیاده‌سازی EDA Read More »

نمودارها و ارتباط‌سنجی داده‌ها در تحلیل اکتشافی (EDA)

در این پست ابتدا خلاصه جلسه و سپس متن کامل جلسه آموزشی را مطالعه خواهید کرد: خلاصه‌ی جلسه: ۱. هدف جلسه بررسی کیفیت داده‌ها با تمرکز بر نقاط پرت (Outliers). تحلیل بصری و آماری برای شناسایی روابط بین ویژگی‌ها و متغیر هدف. گسترش تحلیل به ارتباط بین خود ویژگی‌ها جهت جلوگیری از هم‌خطی در مدل‌ها.

نمودارها و ارتباط‌سنجی داده‌ها در تحلیل اکتشافی (EDA) Read More »

گزارش آماری اولیه از داده‌ها

در این پست ابتدا خلاصه جلسه و سپس متن کامل جلسه آموزشی را مطالعه خواهید کرد: خلاصه جلسه: ۱. هدف جلسه آغاز مرحله‌ی تحلیل آماری اولیه داده‌ها در پروژه‌ی دارویی Kaggle. بررسی کیفیت و توزیع داده‌ها برای درک بهتر از ساختار آن‌ها. ۲. استفاده از ChatGPT در تحلیل پروژه درخواست از ChatGPT برای ارائه‌ی نقشه‌ی

گزارش آماری اولیه از داده‌ها Read More »

خواندن داده‌ها در Kaggle

در این پست ابتدا خلاصه جلسه و سپس متن کامل جلسه آموزشی را مطالعه خواهید کرد: خلاصه جلسه ۱. معرفی پروژه پروژه: پیش‌بینی داروی تجویزشده بر اساس اطلاعات پزشکی بیماران. نوع مسئله: Classification (طبقه‌بندی). نوع یادگیری: Supervised Learning (یادگیری با ناظر). ۲. بررسی فایل داده فایل با فرمت متنی (Flat File) و جداشده با کاما

خواندن داده‌ها در Kaggle Read More »

سبد خرید
درخواست مشاوره رایگان ×

    Call Center

    هیچ محصولی در سبد خرید نیست.

    هیچ محصولی در سبد خرید نیست.