در تهیه این مقاله از دوره هوش مصنوعی برای همه اندرو ان جی استفاده شده است که قطعا شماهایی که با هوش مصنوعی آشنا هستید نام اندرو ان جی را شنیده اید.
گردش کار در تیمهای یادگیری ماشین
الگوریتمهای یادگیری ماشین میتوانند نحوه رسیدن از ورودی به خروجی یا از A تا B را بیاموزند. اما فرایند چگونه در یک پروژه یادگیری ماشین طی میشود؟
فرض کنید میخواهیم محصولی را با یادگیری ماشین تولید کنیم. مثلاً محصول تولیدی ما مربوط به فناوری تشخیص گفتار است.
محصولاتی مثل الکسای آمازون، گوگل هوم، سیری اپل مثالهایی از این فناوری هستند.
گامهای اساسی در یک پروژه علم داده
– جمعآوری داده
جمعآوری داده نقطه شروع اغلب پروژههای هوش مصنوعی است. در همین مثال فروشگاه، ما میتوانیم مجموعهدادهای بسازیم از نام کاربری، IPهای وارد شده، زمان ورود، میزان خرید و مواردی از این دست
– تحلیل دادهها
در این مرحله تیم دادهکاوی ایدهها و تحلیلهای زیادی را از دادهها بیرون میکشند.
برای مثال با در نظر گرفتن IPهای که وارد سایت شده میتوان فهمید برخی از کاربران که از کشورهای دیگر وارد سایت شدهاند تا صفحه خرید محصول رفتهاند اما بهخاطر هزینههای زیاد خرید محصول از خارج از کشور از خرید منصرف شدهاند. یا مثلاً ازطریق تحلیل داده ها الگویی به دست میآید که نشان میدهد در روزهای تعطیل خریدها افزایش یا کاهش داشته است. کشف نقاط اوج و نزول خرید میتواند در سیاستهای تبلیغاتی شرکت هم اثرگذار باشد و تبلیغات اثرگذارتر پیش برود و از صرف هزینههای بیهوده پیشگیری میشود.
یک گروه تحلیل داده خوب ایدههای زیادی دارد و همه ایدهها را بهصورت مستمر بررسی میکند. بنابراین در این مرحله ما با فرایندهای تکراری و بررسیهای چندباره یک ایده مواجهیم.
– پیشنهاد فرضیهها/ اقدامات
در مرحله آخر تیم تحلیل داده از دل بررسی و آزمون ایدههای زیادی که دارد به چند فرضیه و اقدامات موثر در راستای آن فرضیهها میرسد.
با بهکارگیری استراتژیها و بینشهای جدیدی که از دل تحلیل دادهها درآمده دوباره دادههای جدیدی تولید میشود. تیم دادهکاوی دوباره این دادهها را تحلیل میکند و همان مراحل قبلی را طی میکند. اینجاست که چرخه گردش کاری یک تیم تحلیل داده شکل میگیرد.
برای اینکه درک بهتری از این چرخه داشته باشید، یک مثال دیگر میزنیم.
فرض کنیم میخواهیم با استفاده از علم داده پیشنهادهایی برای بهبود کار خط تولید یک کارخانه ارائه دهیم. بگذارید با همان مثال قبلیمان، یعنی ماگ، پیش برویم. قدم اول در تولید ماگ ترکیب خاک و دیگر مواد اولیه با هم است. مرحله دوم به شکل ماگ درآوردن این مواد اولیه است. در مرحله دوم حاصل کار مراحل قبلی رنگآمیزی میشود و لعاب داده میشود. حال ماگهای ساخته شده به حرارت نیاز دارند، بنابراین آنها را در کوره میگذاریم تا حرارت لازم را ببینند. مرحله آخر فرایند تولید ماگ هم تشخیص ماگهای سالم و غیر سالم و بدون کیفیت است.
بالا بردن بهرهوری در خط تولید همواره از دغدغههای اصلی کارخانههای تولیدی بوده است. در اینجا هم تلاش برای به حداقل رساندن ماگهای معیوب و ناقص میتواند مسئله مهمی برای کارفرما باشد.
حال اگر به مراحل انجام پروژه دادهکاوی بازگردیم، مرحله اول جمعآوری داده است. در این مثال میتوان اطلاعات بسیار زیادی جمعآوری کرد. از درصد استفاده از مواد اولیه صرفشده برای هر دسته ماگ تا مدت زمان ماندن در کوره، دمای کوره تا میزان محصولات نامرغوب در هر دسته از ماگهای تولید شده.
در اینجا هم تیم دادهکاوی دادهها را بارها و بارها تحلیل میکند و به هم ربط میدهد و ایدههای زیادی از دادهها بیرون میکشد. تیم پس از غربال کردن ایدهها و تحلیلهایش به تعداد اندکی ایده و راهنمای عمل مشخص میرسد.
این راهنمای عمل و استراتژی جدید در خط تولید به کار گرفته میشود، دادههای جدید تولید میشود و این دادهها دوباره نیاز به تحلیل دارد و این چرخه ادامه پیدا میکند.
جمعبندی
بسته به اینکه پروژهها در چه حوزهای از هوش مصنوعی تعریف شوند، گردش کاری آنها نیز متفاوت خواهد بود. در این مطلب با استفاده از مثالهای مختلف گردش کار در پروژههای یادگیری ماشین و دادهکاوی را بررسی کردیم.
لازمه هر نوع فعالیت در بازار هوش مصنوعی، چه در بخش سرمایهگذاری و چه بهعنوان نیروی متخصص، آشنایی با روندی است که در هر پروژه هوش مصنوعی طی میشود.
برگرفته از dataio