تصاویر پیچیده و زیبای جهان که توسط تلسکوپ فضایی جیمز وب (JWST) ثبت و منتشر میشود، چیزی بیش از پیکسلهای زیبایی است که به صفحههای کامپیوتر یا گوشیهای هوشمند راه پیدا میکنند. این تصاویر نشان دهنده دیتاهای علمی هستند؛ حجم بسیار زیادی دیتا. می توان گفت که تلسکوپ فضایی جیمز وب تقریباً 235 گیگابایت دیتای علمی در هر روز ارائه میکند.
تلسکوپ فضایی جیمز وب و سایر تلسکوپها و حسگرها جریان روزافزونی از دیتاها را در اختیار ستارهشناسانِ امروزی قرار دادهاند. این منابع به اخترشناسان توانایی بیسابقهای را میدهد تا به اعماق فضا بنگرند و همچون یک ماشین زمان، برخی از ستاره ها را در گذشته های دوردست رصد کنند تا از آنها برای انجام اکتشافات جدید، از جمله مطالعه چگونگی مرگ ستارهها استفاده نمایند.
کار اخیر ایالت پن با استفاده از دادههای تلسکوپ فضایی جیمز وب ممکن است نحوه درک دانشمندان از منشأ کهکشانها را تغییر دهد.
با توجه به حجم بالای این دیتاها، مدیریت همه آنها بدون مشکل نیست. اخترشناسان باید به ابررایانهها و الگوریتمهای پیشرفتهای که به آنها یادگیری ماشین گفته میشود، تکیه کنند تا بتوانند این حجم عظیم دیتاها را دریافت کنند، مدلهای دقیقی از وسعت فضا ایجاد کنند، اکتشافات را آشکار کنند و پرسشهای جدیدی را ایجاد کنند و همچنین تصاویری خیرهکننده از کیهان را خلق کنند! این تصاویر خیرهکننده تنها یک بخش از کارهای دانشمندان است.
جوئل لجا و وی. اشلی ویلار، هر دو استادیار نجوم و اخترفیزیک و استخدام مشترک ICDS، از جمله دانشمندانی هستند که ایالت پن را به عنوان پیشرو در استفاده از تکنیکهای یادگیری ماشین برای مدیریت بهتر جریانهای عظیم دیتاها معرفی کردند.
به گفته لجا، رویکردهای یادگیری ماشین به محققان این امکان را می دهد که کاهش دیتاها را با روشی کارآمدتر و دقیق تر از روش های قبلی انجام دهند. او افزود که در برخی موارد، مانند تفسیر تصویربرداری از کهکشان، این تکنیکهای یادگیری ماشین میتوانند نزدیک به یک میلیون برابر سریعتر از تحلیلهای سنتی باشند.
قبل از ظهور یادگیری ماشین، کاهش دادهها با استفاده از معادلات تحلیلی و جمع آوری مقادیر زیادی از داده ها در جداول انجام میشد. محققان زمان قابل توجهی را صرف جمع آوری و تجزیه و تحلیل داده ها می کنند. بدون یادگیری ماشین، محاسبات اغلب تکراری و وقتگیر بودند و هیچ راه کارآمدی برای سرعت بخشیدن به فرآیند وجود نداشت.
لجا گفت: این بسیار شبیه به برنامه ریزی یک سفر بسیار پیچیده است.
لجا گفت: «بگذارید فرض کنیم که در تلاش هستید بهترین راه را از لس آنجلس به سانفرانسیسکو بیابید. با استفاده از تکنیکهای قدیمی، فهرستی از جادهها تهیه میکنیم، هر مسیر را امتحان میکنیم، کل مسافت را در هر جاده کوچک محاسبه میکنیم (جادههای کوچک، بزرگراههای اصلی، راههای دوربرگردان) و باید هر مسیر را نقشهبرداری کنیم و این کار را انجام دهیم؛ یکی یکی. این روش خیلی خوبی برای انجام آن نیست. معمولاً پاسخ درست را به شما میدهد، اما یادگیری ماشین سعی میکند با استفاده از دادهها این کار را به روشی بسیار هوشمندانهتر انجام دهد. برای مثال، ممکن است در عوض از میلیونها مسیر سفر قبلی استفاده کند و سریع بپرسد کدام یک سریعتر است.
به گفته ویلار، یادگیری ماشین فقط نیروی انسانی را کاهش نمی دهد، این رویکردها می توانند کار محاسباتی را نیز کاهش دهند که به نوبه خود باعث صرفهجویی در انرژی می شود.
ویلار گفت: «مسئله نیروی انسانی مهم است، اما ما باید مشکل نیروی کار کامپیوتری را نیز در نظر بگیریم. این ساعتها از زمان محاسباتی زیادی استفاده میکند، که به این معنی است که انرژی زیادی مصرف میکند.»
تغییر میدان
به گفته اخترشناسان، درک این صرفه جویی در محاسبات اغلب دشوار است، اما الگوی جدیدی در اکتشافات نجومی ایجاد می کند.
لجا گفت: «یادگیری ماشین در حال تغییر کامل رشته من است؛ درواقع حجم عظیمی از دادهها را پردازش میکند و مدلهای پیچیده را به سرعت اجرا میکند، که به خوبی برای دادههای نجومی که در حال حاضر به سیستمهای ما سرازیر شدهاند، مناسب است.»
لجا با توضیح تجربه خود به عنوان فوق دکتری در هاروارد، گفت: فرآیند قدیمی از نظر محاسباتی نیز نابخشودنی بود.
لجا گفت: “این کار دسترسی ویژه ای را می طلبید و من مجبور شدم زمان زیادی را برای درخواست و سپس اجرای این شبیه سازی ها صرف کنم. من فقط یک بار توانستم آن را اجرا کنم، که می تواند برای علم بسیار ترسناک باشد. در حالت ایدهآل، میخواهید چندین بار محاسبات را انجام دهید تا چیزها را آزمایش کنید، سؤالات جدید را امتحان کنید و مطمئن شوید که آن را درست انجام دادهاید.»