داده کاوی چیست؟ چه کاربردهایی دارد و روش اجرای آن چگونه است؟! فلسفه ی داده کاوی این است که آینده بسیار به گذشته شبیه است. داده کاوی به شما کمک می کند تا رفتار کسب و کار خود در گذشته را دقیق بشناسید و بر اساس آن آینده را با تقریب بالایی پیش بینی کنید. داده کاوی فضای حاکم بر کسب و کار شما را شفاف می کند و شما را مجبور می کند واقع بینانه تصمیم بگیرید.
داده کاوی چیست؟
داده کاوی چیست؟ چه کاربردهایی دارد و روش اجرای آن چگونه است؟! «داده کاوی» ترجمه ی عبارت «Data Mining» و به معنای «کاویدن معادن داده» است. داده کاوی یعنی استخراج اطلاعات گرانبها از حجم عظیم معادن داده! کلمه ی Mining در معنای تحت الفظی خود یعنی «استخراج از معدن» بکار می رود و در واقع عبارت Data Mining نشان می دهد که حجم انبوه اطلاعات مانند یک معدن عمل می کند و از ظاهر آن مشخص نیست چه عناصر گرانبهایی در عمق این معدن وجود دارد. تنها با کند و کاو و استخراج این معدن است که می توان به آن عناصر گرانبها دست پیدا کرد.
تفاوت اصلی داده کاوی و علم آمار، در حجم داده های مورد تحلیل، روش مدلسازی داده ها و استفاده از هوش مصنوعی است. داده کاوی شاخه ی توسعه یافته و پیچیده ی علم آمار است. علم آمار به تنهایی برای صاحبان صنایع و شرکت ها بسیار اهمیت دارد. اما اهمیت داده کاوی فراتر از علم آمار می رود و امکاناتی در اختیار شما قرار می دهد که ساز و کارهایی آماری از انجام آنها ناتوان هستند.
تفاوت اصلی علم آمار با شاخه ی توسعه یافته ی خود یعنی داده کاوی، در حجم داده های مورد تحلیل و روش مدلسازی داده هاست. در بیشتر موارد حجم داده های اولیه ی مورد استفاده در داده کاوی آنقدر زیاد است که به یک چالش زمان بر و هزینه بر تبدیل می شود. اما مدلسازی داده های ورودی و دستیابی به اطلاعات پنهان و ارزشمند موجود در این حجم عظیم داده، با کمک هوش مصنوعی و شیوه های خودکار یادگیری انجام می شود که در بررسی های پایه ای آماری خبری از آن نیست.
وظیفه ی داده کاوی، کاویدن و استخراج دانش از منابع عظیم داده است تا اطلاعات گرانبهایی که در حجم انبوهی از اطلاعات سطحی پنهان شده است را آشکار سازد.
چرا داده کاوی سودآور است؟!
داده کاوی به دو دلیل سودآور است:
- منجر به تصمیمات واقع بینانه می شود.
- سبب تکرار تصمیمات سودآور رخ داده در گذشته می گردد.
با داده کاوی شما مجبور می شوید تصمیمات احساسی را فراموش کنید و بر اساس واقعیت ها تصمیم بگیرید. بنابراین ضرر های ناشی از نا آگاهی مدیران حذف می شود.
داده کاوی همچنین فضای سال های گذشته ی شرکت شما را بازبینی می کند و در نهایت نشان می دهد کدام تصمیمات منجر به سود شده است در حالی که شما از آن ها بی خبر هستید. شرکت ها و سازمان ها هر لحظه در حال اتخاذ تصمیمات جدیدی هستند که منجر به سود یا زیان آن مجموعه می شود. بسیاری از تصمیمات بر اساس واقعیات موجود گرفته نمی شود و عواملی چون «فراموشی»، «تخلفات و تقلبات»، «اشکالات خط تولید»، «منافع شخصی» و «سیاست های اعمال نفوذ شده از جاهای دیگر» منجر به اتخاذ تصمیمات غیر شفاف و در نتیجه زیانبار می شوند.
داده کاوی فضای حاکم بر کسب و کار شما را شفاف میکند و شما را مجبور میکند که واقعبینانه تصمیم بگیرید.
تصمیم گیری واقع بینانه کلید از بین بردن تصمیمات احساسی و در نتیجه از بین بردن بهره وری پایین و ضرر های ناشی از نا آگاهی است. بطور کلی فضای تصمیم گیری در یک کسب و کار شباهت بسیار زیادی به فضاهای تصمیم گیری اتفاق افتاده در 10 سال گذشته ی آن مجموعه دارد. این شباهت در یاد تصمیم گیرندگان آن کسب و کار باقی نمی ماند و اغلب آشکار نیز نمی شود. داده کاوی فضای سال های گذشته ی کسب و کار شما را بازخوانی می کند و به شما می گوید کدام تصمیمات منجر به سود شده است و کدام تصمیمات منجر به زیان کسب و کار شده است.
بنابراین داده کاوی باعث می شود تصمیمات زیانده کسب و کارتان در گذشته را تکرار نکنید ولی تصمیمات سودآور اتفاق افتاده در گذشته را دوباره تکرار کنید.
داده کاوی چگونه کار می کند؟
داده کاوی یک روش حل مسئله مبتنی بر داده های موجود است. تیم داده کاوی دایکه بر اساس استاندارد جهانی کریسپ دی ام (CRISP-DM) این فرایند حل مسئله را به اجرا می گذارد.
پس از یافتن مشکلات در ابتدای فرایند داده کاوی، اطلاعات ریز ثبت شده در شرکت یا خط تولید شما دریافت می شود.
بر اساس این اطلاعات، مکانیزم های مرتبط در کسب و کار شما مدلسازی می شود و سپس با کمک متدهای «یادگیری ماشین» راه حل هایی برای از بین بردن مشکلات شرکت شما در چارچوب گزارشات مستند و نرم افزار رایانه ای در اختیار شما قرار می گیرد.
بر اساس این استاندارد، فرایند حل مسئله با کمک داده کاوی در شش مرحله و در تعامل با کارفرما صورت می گیرد.
گام اول: درک کسب و کار
کارفرما مشکلی در کسب و کار خود دارد. مشکل خود را با متخصص داده کاوی مطرح می کند. این گام اول است. در حالت دیگر، کارفرما نمی تواند مشکلات کسب و کار خود را تشخیص دهد اما می داند سیستم کسب و کار وی دارای نقصان است. در این حالت طرح مسئله را نیز بر عهده ی متخصص داده کاوی می گذارد.
گام دوم: بررسی و درک داده ها
متخصص داده کاوی، داده های ثبت شده در کسب و کار کارفرما را از وی درخواست می کند و به بررسی داده ها می پردازد. متخصص داده کاوی با توجه به حجم و کیفیت داده ها مسئله ی طرح شده در مرحله ی قبل را تعدیل می کند تا نتیجه ی پروسه ی داده کاوی واقع بینانه تر بشود.
گام سوم: آماده سازی داده ها
در مرحله ی سوم عملیات آماده سازی داده ها توسط متخصص داده کاوی صورت می گیرد. آماده سازی داده ها شامل این موارد می شود:
- یکی کردن انبارهای متفاوت داده در کسب و کار کارفرما
- شناسایی و حذف داده های پرت و اشتباه
- تغییر فرمت داده ها متناسب با مسئله ی تعدیل شده در مرحله ی دوم
گام چهارم: مدل سازی
قدم چهارم مدلسازی داده های آماده سازی شده است. با توجه به متدهای متفاوت، مدل های متفاوتی ساخته می شود و بهترین مدل ها از نظر متخصص داده کاوی انتخاب می شود.
گام پنجم: تست و ارزیابی مدل
مدل های ساخته شده تست و ارزیابی می شوند و بهترین مدل از نظر مسئله ی طرح شده در مرحله ی یک، انتخاب می شود. سپس در تبادل نظر با کارفرما، موثر بودن مدل انتخاب شده بررسی می شود. در صورتی که مدل انتخاب شده کمکی در حل مسئله نمی کند کل فرایند از مرحله ی یک دوباره انجام می شود.
گام ششم: توسعه مدل نهایی
در صورتی که ارزیابی ها رضایت بخش باشند راه حل هایی در قالب توسعه ی مدل نهایی ارائه می شوند که مشکلات مطرح شده در مرحله ی یک را برطرف می کنند. مدل نهایی به متخصص داده کاوی نشان می دهد که رفتار مجموعه ی کسب و کار کارفرما در مورد مشکلات مطرح شده در مرحله ی یک چگونه است.
این درک از رفتار کسب و کار، در قالب راه حل های عددی و چند فرمول یا راهکار عملی در اختیار کارفرما قرار می گیرد تا مشکلات مطرح شده در مرحله ی یک رفع گردد. همچنین متخصص داده کاوی می تواند در قالب گزارشات مستند مکانیزم رفتاری کسب و کار کارفرما را برای وی تشریح کند.
نویسنده مقاله: گروه داده کاوی دایکه
Comments are closed.