نشریه

مقالات تخصصی علوم داده

آزمون های فرض مدل

آزمون های فرض مدل و بیان 2 نوع معناداری

پس از برآورد ضرایب و ساخت مدل رگرسیونی، آزمون های فرض آماری جهت بررسی معناداری برازش مدل خطی و جزئیات بدست آمده بکار می رود. این آزمون ها در دو سطح معناداری مدل را مورد بررسی قرار می دهد: معناداری برازش مدل خطی بر اساس جدول تحلیل واریانس ANOVA معناداری ضرایب مدل خطی بر اساس […]

آزمون های فرض مدل و بیان 2 نوع معناداری Read More »

برآورد ضرایب مدل

برآورد ضرایب مدل و معرفی 3 روش

روش حداقل مربعات معمولی (Ordinary Least Square Method – OLS) این روش به عنوان رایج ترین و پرکاربردترین رویکرد در برآورد پارامترهای مدل رگرسیون مورد استفاده قرار می گیرد. برای محاسبه ضرایب مدل، با استفاده از محاسبات ماتریسی در جبر خطی بهترین مقادیر برای پارامترهای مجهول مدل به شکلی یافت می شود که مجموع مربعات

برآورد ضرایب مدل و معرفی 3 روش Read More »

رگرسیون خطی

مقدمه ای بر رگرسیون خطی

رگرسیون خطی یکی از پرکاربردترین الگوریتم های یادگیری آماری با هدف بررسی و مدلسازی ارتباط خطی بین یک یا چند ویژگی ورودی مستقل از هم با متغیر وابسته (پاسخ) می باشد. رگرسیون خطی از نوع یادگیری با نظارت با هدف پیش بینی مقادیر کمی است. اگر رابطه خطی بین یک متغیر پاسخ و یک متغیر

مقدمه ای بر رگرسیون خطی Read More »

الگوریتم بیز ساده

الگوریتم بیز ساده

قضیه ی بیز احتمال رخ دادن یک پیشامد را هنگامی که پیشامد دیگر اتفاق افتاده باشد، بدست می‌آورد. همانطور که در معادله ی زیر مشاهده می کنید، با استفاده از تئوری بیز ،خواهیم توانست احتمال رخ دادن A را هنگامی که B اتفاق افتاده باشد، بدست آوریم. در اینجا، B شواهد و A فرضیه است.

الگوریتم بیز ساده Read More »

SPSS Modeler پیاده سازی رگرسیون خطی

درخت های رگرسیونی و ارزیابی در نرم افزار

در این ویدیو پیاده سازی درخت های رگرسیون را می آموزیم؛ همانطور که در گذشته گفته شد درخت های تصمیم گیری می توانند در در حالت Classification  و Regression  عمل نمایند. در این آموزش از دیتاست Car Insurance Claims استفاده می نماییم و در نرم افزار IBM SPSS Modeler  اجرا می کنیم: Pallet Bar 🡺

درخت های رگرسیونی و ارزیابی در نرم افزار Read More »

ماتریس درهم ریختگی و داده های نامتوازن

ماتریس در هم ریختگی و داده های نامتوازن

در مبحث داده های نامتوازن اگر بخواهیم بررسی دقیق تری از مدل های ترسیم شده داشته باشیم باید به سراغ شاخص های ارزیابی برویم؛ از جمله همان شاخص هایی که در ویدیوهای قبل به صورت تئوری توضیح داده شد. این شاخص ها، وضعیت رده بندی را در هر یک از کلاس ها بررسی می کنند.

ماتریس در هم ریختگی و داده های نامتوازن Read More »

پیاده سازی درخت تصمیم در نرم افزار

پیاده سازی درخت تصمیم در نرم افزار

در این آموزش بر روی دیتاست BankLoan مدل سازی داده ها و پیاده سازی درخت تصمیم را در IBM SPSS Modeler انجام خواهیم داد. برای شروع مدلسازی ابتدا فیلد هدف و فیلد های موثر را تعریف می نماییم و سپس دیتاست را به دو قسمت تست و آموزش تقسیم می نماییم. Pallet Bar 🡺 Field

پیاده سازی درخت تصمیم در نرم افزار Read More »

چالش ها و روش برخورد با داده های نامتوازن

داده های نامتوازن؛ چالش ها و روش برخورد با آنها

یکی از مسائل رایج در رده بندی، توزیع داده های نامتوازن در کلاس های فیلد هدف می باشد. این مساله زمانی رخ می‌دهد که تعداد مشاهدات مربوط به یک کلاس به طور چشمگیری کم‌تر از مشاهداتی باشد که به کلاس دیگر تعلق دارند. این مشکل بیشتر در سناریوهایی که کشف ناهنجاری ها در آن‌ها حیاتی

داده های نامتوازن؛ چالش ها و روش برخورد با آنها Read More »

ارزیابی مدل های رگرسیون

ارزیابی مدل های رگرسیون

اغلب شاخص های ارزیابی مدل های رگرسیونی، بر مبنای محاسبه اندازه خطای پیش بینی می باشد. زیرا بر خلاف مدل های رده بندی، در مسائل پیش بینی داده های کمی، شاخص هایی مانند صحت مدل (با مفهومی که در مسائل رده بندی آشنا شدیم) وجود ندارد. بلکه به دنبال معیارهایی برای اندازه گیری میزان نزدیکی

ارزیابی مدل های رگرسیون Read More »

ارزیابی مدل های دسته بندی - بخش 2

ارزیابی مدل های دسته بندی – بخش 2

نمودار بهره و ارتقا (Gain & Lift Chart) ابزار دیگری که برای ارزیابی مدل های دسته بندی استفاده می شود استفاده از روشهای بصری GainChart  و LiftChart می باشد. بر خلاف ماتریس در هم ریختگی که شاخص های ارزیابی روی کل مجموعه داده ها محاسبه می شدند، این ابزارها روی نسبت های مختلفی از داده

ارزیابی مدل های دسته بندی – بخش 2 Read More »

درخواست مشاوره رایگان ×

    Call Center
    سبد خرید شما
    هیچ محصولی در سبد خرید نیست.

    ورود به حساب کاربری

    ایجاد حساب کاربری