3 گام گردش کار (workflow) تیم‌های یادگیری ماشین و داده‌کاوی

جمع‌آوری داده نقطه شروع اغلب پروژه‌های هوش مصنوعی است. سپس با فرایندهای تکراری و بررسی‌های چندباره یک ایده مواجهیم. در آخر به چند فرضیه و اقدامات موثر در راستای آن فرضیه‌ها می‌رسیم.
این مقاله بازنشری است از وبسایت

در تهیه این مقاله از دوره هوش مصنوعی برای همه اندرو ان جی استفاده شده است که قطعا شماهایی که با هوش مصنوعی آشنا هستید نام اندرو ان جی را شنیده اید.

گردش کار
گردش کار

گردش کار در تیم‌های یادگیری ماشین

الگوریتم‌های یادگیری ماشین می‌توانند نحوه رسیدن از ورودی به خروجی یا از A تا B را بیاموزند. اما فرایند چگونه در یک پروژه یادگیری ماشین طی می‌شود؟

 فرض کنید می‌خواهیم محصولی را با یادگیری ماشین تولید کنیم. مثلاً محصول تولیدی ما مربوط به فناوری تشخیص گفتار است.

محصولاتی مثل الکسای آمازون، گوگل هوم، سیری اپل مثال‌هایی از این فناوری هستند.

گام‌های اساسی در یک پروژه علم داده

– جمع‌آوری داده

 جمع‌آوری داده نقطه شروع اغلب پروژه‌های هوش مصنوعی است. در همین مثال فروشگاه، ما می‌توانیم مجموعه‌داده‌ای بسازیم از نام کاربری، IPهای وارد شده، زمان ورود، میزان خرید و مواردی از این دست

– تحلیل داده‌ها

در این مرحله تیم داده‌کاوی ایده‌ها و تحلیل‌های زیادی را از داده‌ها بیرون می‌کشند.

برای مثال با در نظر گرفتن IP‌های که وارد سایت شده می‌توان فهمید برخی از کاربران که از کشورهای دیگر وارد سایت شده‌اند تا صفحه خرید محصول رفته‌اند اما به‌خاطر هزینه‌های زیاد خرید محصول از خارج از کشور از خرید منصرف شده‌اند. یا مثلاً ازطریق تحلیل داده ها الگویی به دست می‌آید که نشان می‌دهد در روزهای تعطیل خریدها افزایش یا کاهش داشته است. کشف نقاط اوج و نزول خرید می‌تواند در سیاست‌های تبلیغاتی شرکت هم اثرگذار باشد و تبلیغات اثرگذارتر پیش برود و از صرف هزینه‌های بیهوده پیشگیری می‌شود.

یک گروه تحلیل داده‌ خوب ایده‌های زیادی دارد و همه ایده‌ها را به‌صورت مستمر بررسی می‌کند. بنابراین در این مرحله ما با فرایندهای تکراری و بررسی‌های چندباره یک ایده مواجهیم.

– پیشنهاد فرضیه‌ها/ اقدامات

در مرحله آخر تیم تحلیل داده از دل بررسی و آزمون ایده‌های زیادی که دارد به چند فرضیه و اقدامات موثر در راستای آن فرضیه‌ها می‌رسد.

با به‌کارگیری استراتژی‌ها و بینش‌های جدیدی که از دل تحلیل داده‌ها درآمده دوباره داده‌های جدیدی تولید می‌شود. تیم داده‌کاوی دوباره این داده‌ها را تحلیل می‌کند و همان مراحل قبلی را طی می‌کند. اینجاست که چرخه گردش کاری یک تیم تحلیل داده شکل می‌گیرد.

برای اینکه درک بهتری از این چرخه داشته باشید، یک مثال دیگر می‌زنیم.

فرض کنیم می‌خواهیم با استفاده از علم داده پیشنهادهایی برای بهبود کار خط تولید یک کارخانه ارائه دهیم. بگذارید با همان مثال قبلی‌مان، یعنی ماگ، پیش برویم. قدم اول در تولید ماگ ترکیب خاک و دیگر مواد اولیه با هم است. مرحله دوم به شکل ماگ درآوردن این مواد اولیه است. در مرحله دوم حاصل کار مراحل قبلی رنگ‌آمیزی می‌شود و لعاب داده می‌شود. حال ماگ‌های ساخته شده به حرارت نیاز دارند، بنابراین آن‌ها را در کوره می‌گذاریم تا حرارت لازم را ببینند. مرحله آخر فرایند تولید ماگ هم تشخیص ماگ‌های سالم و غیر سالم و بدون کیفیت است.

بالا بردن بهره‌وری در خط تولید همواره از دغدغه‌های اصلی کارخانه‌های تولیدی بوده است. در اینجا هم تلاش برای به حداقل رساندن ماگ‌های معیوب و ناقص می‌تواند مسئله مهمی برای کارفرما باشد.

حال اگر به مراحل انجام پروژه داده‌کاوی بازگردیم، مرحله اول جمع‌آوری داده‌ است. در این مثال می‌توان اطلاعات بسیار زیادی جمع‌آوری کرد. از درصد استفاده از مواد اولیه صرف‌شده برای هر دسته ماگ تا مدت زمان ماندن در کوره، دمای کوره تا میزان محصولات نامرغوب در هر دسته از ماگ‌های تولید شده.

در اینجا هم تیم داده‌کاوی داده‌ها را بارها و بارها تحلیل می‌کند و به هم ربط می‌دهد و ایده‌های زیادی از داده‌ها بیرون می‌کشد. تیم پس از غربال کردن ایده‌ها و تحلیل‌هایش به تعداد اندکی ایده و راهنمای عمل مشخص می‌رسد.

این راهنمای عمل و استراتژی جدید در خط تولید به کار گرفته می‌شود، داده‌های جدید تولید می‌شود و این داده‌ها دوباره نیاز به تحلیل دارد و این چرخه ادامه پیدا می‌کند.

جمع‌بندی

بسته به اینکه پروژه‌ها در چه حوزه‌ای از هوش مصنوعی تعریف شوند، گردش کاری آن‌ها نیز متفاوت خواهد بود. در این مطلب با استفاده از مثال‌های مختلف گردش کار در پروژه‌های یادگیری ماشین و داده‌کاوی را بررسی کردیم.

لازمه هر نوع فعالیت در بازار هوش مصنوعی، چه در بخش سرمایه‌گذاری و چه به‌عنوان نیروی متخصص، آشنایی با روندی است که در هر پروژه هوش مصنوعی طی می‌شود.

برگرفته از dataio

ثبت نام در دوره یادگیری ماشین دایکه