علم نجوم از عصر گالیله تا زمان حال، به ویژه در دهه گذشته با سرعت بیسابقهای تکامل یافته و رشد کرده است.در این دوره جدید، تحقیقات ما از کیهان پیشرفت عظیمی کرده و برای کشف اسرار انرژی تاریک و ماده تاریک، شکلگیری و تکامل کهکشانها و ساختار کهکشان راه شیری تلاشهای فراوانی انجام شده است.
اگر علم داده میتواند به شرکتها در زمینههای سنتی زندگی مانند فناوری، تولید و خردهفروشی کمک کند تا کسبوکار خود را بهبود بخشند، تصور کنید که در زمینههای بسیار پیشرفته مانند نجوم چه کاری میتواند انجام دهد!
فضا بی نهایت است و انبوهی از اجرام آسمانی شگفت انگیز در انتظار مشاهده و کشف هستند. اخترشناسان اکنون ابزارهای فناوری مناسب و ابزارهای علم داده (هوش مصنوعی و یادگیری ماشینی) را در اختیار دارند تا توانایی خود را برای درک رویدادهای نجومی بسیار پیچیده، چه در نزدیکی ما و چه در دوردستها، کامل کنند.
با ظهور تلسکوپهای بزرگتر، تکنیکهای تصویربرداری، و توسعه بررسیهای نجومی در تلسکوپهای زمینی و تلسکوپهای فضایی، نجوم عصر جدید همانند چندین رشته و صنعت دیگر، با یک سونامی داده مواجه شده و نیازمند تغییرات اساسی در روش های مورد استفاده برای تحقیقات علمی است.
ابزارهای جمعآوری دیتاها وجود دارد، اما روشهای رمزگشایی آنها هنوز در حال تکامل است و این یکی از چالشهای اصلی تجزیه و تحلیل و تفسیر دادهها است. تغییر الگوی پژوهش در نجوم صورت گرفته است زیرا از فرضیه محور بودن، به داده محور بودن تبدیل شده است.
دیتاهایی با اندازههای نجومی!
وسعت جهان برای همه شناخته شده است؛ در جهان قابل مشاهده ما نزدیک به 200 میلیارد کهکشان وجود دراد، هر یک از این کهکشانها از چند هزار تا چند تریلیون ستاره دارند! این اعداد و ارقام گیج کننده است. نکته مهم اینجاست که مطابق با اندازه کیهان، دادههای گرفته شده از آن نیز نجومی است! اینجاست که تحلیل کلاندادهها به میدان میآید.
تحلیل کلادادهها به دانشمندان کمک می کند تا به طور مؤثر اطلاعات مفیدی را از حجم عظیمی از داده ها کشف کنند: خلاصه سازی، طبقه بندی، رگرسیون، خوشه بندی، ارتباط، تجزیه و تحلیل سری های زمانی، و تشخیص داده های پرت یا ناهنجاریها. تمام داده های عملی از طریق الگوریتم های تخصصی و مدل های ریاضی اجرا می شوند و الگوریتم های سنتی فقط تسلیم می شوند.
برای تبدیل دادههای خام به دانش قابل استفاده، باید تولید، جمعآوری، تبدیل، ذخیرهسازی، مدیریت، پیش پردازش، استخراج، تجسم، درک، ارزیابی و توضیح داده شود که همه اینها به ابزارهای تجزیه و تحلیل بستگی دارد.
بررسیهای آسمان در مقیاس بزرگتر، عمیقتر و در چند طول موج منجر به افزایش ابعاد دادههای نجومی میشود، در حالی که دادههای با ابعاد بالا باعث به اصطلاح نفرین ابعاد میشوند، یعنی خرابی. از روش های مرسوم ریاضی در نتیجه، مدلها و الگوریتمهای تحلیلی بسیار تخصصی برای جمعآوری و تجزیه و تحلیل دادهها مورد نیاز است.
پیشرفت در نجوم با علم داده
یک مثال خوب برای نقش بیگدیتا در نجوم، پروژه Galaxy Zoo است. در این پروژه که در سال 2007 آغاز شد، اخترفیزیکدانان وظیفه داشتند 900000 تصویر گرفته شده از نقشهبردار آسمان دیجیتال اسلون را در طی 7 سال طبقه بندی کنند تا مشخص کنند که کهکشان های موجود در تصویر بیضی هستند یا مارپیچی، و آیا آنها در حال چرخش هستند یا نه؟
حجم انبوه داده، تجزیه و تحلیل انسانی را تقریبا غیرممکن کرد. اگر یک نفر قصد تکمیل این پروژه را داشت باید 24 ساعت شبانه روز و 7 روز هفته را به مدت 3 الی 5 سال کار میکرد! بنابرین راه حل این مسئله در ایجاد مدل های جدید علم داده برای اندازه گیری مجموعه داده های بزرگِ تجربی و شبیه سازیها نهفته است.
این مجموعه داده ها شامل داده های ماموریت های خورشیدی، داده های بررسی سیارات فراخورشیدی، بررسی های آسمان در طول موج های مختلف، آشکارسازهای امواج گرانشی و شبیه سازی های نجومی در مقیاس بزرگ است. همه این ها در کنار هم، به اخترشناسان کمک می کنند تا به اهداف مهم تحقیقاتی خود برسند.
شناخت بهتر خورشید ما
خورشید بزرگترین منبع انرژی بالقوه برای سیاره ما است. انرژی خورشیدی بخش مهمی از پایداری و انرژی پاک برای ماست، نه تنها برای انرژی خورشیدی، بلکه به عنوان نمونهای طبیعی از انرژی همجوشی نیز به آن احتیاج داریم.
با وجود اهمین خورشید، اما درک ما محدود به داده هایی است که دانشمندان قادر به جمع آوری آنها هستند. برای مثال، دمای خورشید و حرکت عمودی پلاسمای خورشیدی، مشاهده نسبتاً آسانی دارند، اما حرکت افقی بسیار سختتر است، و کلید بسیاری از اسرار خورشید را در دست دارد.
برای حل این مشکل، دانشمندان ایالات متحده و ژاپن یک مدل شبکه عصبی برای تجزیه و تحلیل دادهها و شبیهسازیهای متعدد آشفتگی پلاسما میسازند. پس از آموزش شبکه عصبی، امکان استنباط حرکت افقی تنها با استفاده از حرکت عمودی و دمای خورشید فراهم شد.
این تکنیک نه تنها پیامدهای گستردهای برای نجوم خورشیدی دارد، بلکه بخشهای دیگری مانند فیزیک پلاسما، دینامیک سیالات و مطالعات تحقیقاتی همجوشی را نیز بهبود میبخشد. پروژه های بعدی نیز با استفاده از این نوع داده برای رصدهای خورشیدی با وضوح بالا با تلسکوپ بالون جدید SUNRISE-3 برنامهریزی شده است.
جمعسپاری داده های نجومی
یکی دیگر از کاربردهای رایج علم داده در نجوم، استفاده از جمعسپاری یا به بیان دیگر استفاده از هزاران «شهروند دانشمند» است. با ترکیب تلاشهای این افراد در جهت نقشه برداری از آسمان و تجزیه و تحلیل انبوه داده ها میتوان به نتایج درخشانی رسید.
پروژه ای به نام Exoplanet Explorers از داده های تلسکوپ فضایی کپلر ناسا برای کشف حداقل 5 سیاره فراخورشیدی (سیارههایی در خارج از منظومه شمسی ما) استفاده کرد. این اولین سیستم چند سیاره ای است که به طور کامل با تلاش ها و تجزیه و تحلیل دادههای جمعی کشف شد!
این تحقیق ابتدا یک سیستم 4 سیاره ای را نشان داد، اما بعداً با تجزیه و تحلیل دادههای بیشتر مشخص شد که سیاره پنجم نیز وجود دارد. بیش از 14000 داوطلب در این پروژه شرکت کردند و همچنان به مشاهده و تجزیه و تحلیل داده های بیشتری در طول زمان ادامه می دهند.
کاوش در مریخ
دانشمندان سالهاست که در جستجوی شواهدی از حیات در مریخ هستند، مأموریتهای رباتیکِ جدید به زودی نمونههایی از خاک و سنگِ سطح این سیاره را در زمین به ما تحویل خواهند داد. این مأموریتها عمدتاً بر تجزیه و تحلیل طیف سنجی جرمی برای بررسی نمونه هایی از شن های مریخ با هدف جستجوی نشانه هایی از حیات در گذشته متکی است.
حجم داده هایی که نیاز به تجزیه و تحلیل دارند بسیار زیاد خواهد بود، بنابراین ناسا به روش های جدیدی برای تجزیه و تحلیل سریع نمونه ها نیاز دارد. برای حل این چالش، ناسا با شرکت جمعسپاریِ جهانی HeroX و فروشنده علم داده DrivenData همکاری کرده است تا چالش جدید خود را اجرا کند؛ «طیف سنجی مریخ: چالش کشف شواهد حیات در گذشته» و جایزه 30000 دلاری را برای خلاقانه ترین روش تجزیه و تحلیل در نظر گرفته است.
دانشمندان امیدوارند با استفاده از تکنیکهای یادگیری ماشین، که در آن مجموعه عظیمی از دادهها به مدلهای تحلیلی جدید تبدیل میشوند، فرآیند تجزیه و تحلیل شیمیایی را خودکار کرده و نتیجهگیریهای مهم را هرچه سریعتر به دست آورند. انتظار میرود که نتایج این مدلها به مأموریتهای آینده مریخ کمک کند تا سریعتر و کارآمدتر شوند.
برگرفته از: simplilearn و deskera