تصاویر پیچیده و زیبای جهان که توسط تلسکوپ فضایی جیمز وب (JWST) ثبت و منتشر می‌شود، چیزی بیش از پیکسل‌های زیبایی است که به صفحه‌های کامپیوتر یا گوشی‌های هوشمند راه پیدا می‌کنند. این تصاویر نشان دهنده دیتاهای علمی هستند؛ حجم بسیار زیادی دیتا. می توان گفت که تلسکوپ فضایی جیمز وب تقریباً 235 گیگابایت دیتای علمی در هر روز ارائه می‌کند.

تلسکوپ فضایی جیمز وب و سایر تلسکوپ‌ها و حسگرها جریان روزافزونی از دیتاها را در اختیار ستاره‌شناسانِ امروزی قرار داده‌اند. این منابع به اخترشناسان توانایی بی‌سابقه‌ای را می‌دهد تا به اعماق فضا بنگرند و همچون یک ماشین زمان، برخی از ستاره ها را در گذشته های دوردست رصد کنند تا از آنها برای انجام اکتشافات جدید، از جمله مطالعه چگونگی مرگ ستاره‌ها استفاده نمایند.

کار اخیر ایالت پن با استفاده از داده‌های تلسکوپ فضایی جیمز وب ممکن است نحوه درک دانشمندان از منشأ کهکشان‌ها را تغییر دهد.

با توجه به حجم بالای این دیتاها، مدیریت همه آنها بدون مشکل نیست. اخترشناسان باید به ابررایانه‌ها و الگوریتم‌های پیشرفته‌ای که به آن‌ها یادگیری ماشین گفته می‌شود، تکیه کنند تا بتوانند این حجم عظیم دیتاها را دریافت کنند، مدل‌های دقیقی از وسعت فضا ایجاد کنند، اکتشافات را آشکار کنند و پرسش‌های جدیدی را ایجاد کنند و همچنین تصاویری خیره‌کننده از کیهان را خلق کنند! این تصاویر خیره‌کننده تنها یک بخش از کارهای دانشمندان است.

جوئل لجا و وی. اشلی ویلار، هر دو استادیار نجوم و اخترفیزیک و استخدام مشترک ICDS، از جمله دانشمندانی هستند که ایالت پن را به عنوان پیشرو در استفاده از تکنیک‌های یادگیری ماشین برای مدیریت بهتر جریان‌های عظیم دیتاها معرفی کردند.

به گفته لجا، رویکردهای یادگیری ماشین به محققان این امکان را می دهد که کاهش دیتاها را با روشی کارآمدتر و دقیق تر از روش های قبلی انجام دهند. او افزود که در برخی موارد، مانند تفسیر تصویربرداری از کهکشان، این تکنیک‌های یادگیری ماشین می‌توانند نزدیک به یک میلیون برابر سریع‌تر از تحلیل‌های سنتی باشند.

قبل از ظهور یادگیری ماشین، کاهش داده‌ها با استفاده از معادلات تحلیلی و جمع آوری مقادیر زیادی از داده ها در جداول انجام میشد. محققان زمان قابل توجهی را صرف جمع آوری و تجزیه و تحلیل داده ها می کنند. بدون یادگیری ماشین، محاسبات اغلب تکراری و وقت‌گیر بودند و هیچ راه کارآمدی برای سرعت بخشیدن به فرآیند وجود نداشت.

لجا گفت: این بسیار شبیه به برنامه ریزی یک سفر بسیار پیچیده است.

لجا گفت: «بگذارید فرض کنیم که در تلاش هستید بهترین راه را از لس آنجلس به سانفرانسیسکو بیابید. با استفاده از تکنیک‌های قدیمی، فهرستی از جاده‌ها تهیه می‌کنیم، هر مسیر را امتحان می‌کنیم، کل مسافت را در هر جاده کوچک محاسبه می‌کنیم (جاده‌های کوچک، بزرگراه‌های اصلی، راه‌های دوربرگردان) و باید هر مسیر را نقشه‌برداری کنیم و این کار را انجام دهیم؛ یکی یکی. این روش خیلی خوبی برای انجام آن نیست. معمولاً پاسخ درست را به شما می‌دهد، اما یادگیری ماشین سعی می‌کند با استفاده از داده‌ها این کار را به روشی بسیار هوشمندانه‌تر انجام دهد. برای مثال، ممکن است در عوض از میلیون‌ها مسیر سفر قبلی استفاده کند و سریع بپرسد کدام یک سریع‌تر است.

به گفته ویلار، یادگیری ماشین فقط نیروی انسانی را کاهش نمی دهد، این رویکردها می توانند کار محاسباتی را نیز کاهش دهند که به نوبه خود باعث صرفه‌جویی در انرژی می شود.

ویلار گفت: «مسئله نیروی انسانی مهم است، اما ما باید مشکل نیروی کار کامپیوتری را نیز در نظر بگیریم. این ساعت‌ها از زمان محاسباتی زیادی استفاده می‌کند، که به این معنی است که انرژی زیادی مصرف می‌کند.»

تغییر میدان

به گفته اخترشناسان، درک این صرفه جویی در محاسبات اغلب دشوار است، اما الگوی جدیدی در اکتشافات نجومی ایجاد می کند.

لجا گفت: «یادگیری ماشین در حال تغییر کامل رشته من است؛ درواقع حجم عظیمی از داده‌ها را پردازش می‌کند و مدل‌های پیچیده را به سرعت اجرا می‌کند، که به خوبی برای داده‌های نجومی که در حال حاضر به سیستم‌های ما سرازیر شده‌اند، مناسب است.»

لجا با توضیح تجربه خود به عنوان فوق دکتری در هاروارد، گفت: فرآیند قدیمی از نظر محاسباتی نیز نابخشودنی بود.

لجا گفت: “این کار دسترسی ویژه ای را می طلبید و من مجبور شدم زمان زیادی را برای درخواست و سپس اجرای این شبیه سازی ها صرف کنم. من فقط یک بار توانستم آن را اجرا کنم، که می تواند برای علم بسیار ترسناک باشد. در حالت ایده‌آل، می‌خواهید چندین بار محاسبات را انجام دهید تا چیزها را آزمایش کنید، سؤالات جدید را امتحان کنید و مطمئن شوید که آن را درست انجام داده‌اید.»

Published by

mm

ساره واحدی
svahedi72

ساره واحدی هستم؛ دانشجوی پانزدهمین دوره "علم داده" در آکادمی دایکه، دانشجوی کارشناسی ارشد فیزیک و علاقمند به کار کردن با دیتاها