با پیشرفت تکنولوژی در زمینه تلسکوپها، کامپیوتر و دستگاههای آشکارساز، نجوم نیز مانند بسیاری از زمینه های دیگر، به یک زمینه بسیار غنی از داده تبدیل شده است. در حال حاضر تعداد زیادی آرشیو دیتاها و پیمایش آسمان وجود دارد که حاوی چندین ترابایت اطلاعات است. منبع اولیه دادههای نجومی، مشاهدات آسمان به شیوهای سیستماتیک در دامنهای از طول موجهای بالاست. حجم قابل توجهی از اطلاعات نیز با برخی شبیه سازی ها تولید می شود.
این یک تغییر بزرگ در شیوه مطالعات نجومی است زیرا در گذشته، یک جرم نجومی منفرد برای مطالعه استفاده می شد، اما در حال حاضر می توان کل جهان را به طور سیستماتیک ترسیم کرد. این نجومِ جدید که مبتنی بر داده های بزرگ و بیگ دیتا است، میتواند دانشمندان و دانشجویانی که به تلسوپ های بزرگ دسترسی ندارند را نیز در مطالعات علمی مشارکت دهد، این همکاریها به طور حقیقی نیازی به دسترسی مستقیم به تلسکوپها ندارد.
دانشمندان برای مدیریت و کاوش این حجم عظیم از داده ها با چالش فنی قابل توجهی روبرو هستند. این بزرگ شدن ناگهانی دادههای مربوط به نجوم، دادههای تحلیلی سنتی نجومی را ناکافی کرده است. با این حال، این مسائل تقریباً در تمام زمینه های غنی از داده مشترک است. و البته امیدواریم که برخی از ایده ها و بینش های حاصل از این کار بر حوزه های دیگری از علم و فناوری تأثیر بگذارد.
ماهیت داده های نجومی
به طور کلی داده های نجومی بسیار متنوع و ناهمگن هستند، هم در محتوا و هم در قالب.
با وجود همه این تنوع و ناهمگونی، داده های نجومی و تجزیه و تحلیل بعدی آن را می توان به طور گسترده در پنج حوزه طبقه بندی کرد:
• داده های تصویربرداری
• تولید کاتالوگ با پردازش داده های تصویربرداری
• انجام اندازه گیری های بعدی مانند طیف سنجی و قطبش
• مطالعه حوزه زمان
• انجام شبیه سازی
حجم بسیار زیادی از داده های آرشیو شده در نجوم در مکان های مختلف در انواع سیستم های پایگاه داده ذخیره می شود. بنابراین، مفهوم داده های بزرگ برای استخراج داده ها از این پایگاه های داده مختلف در مکان های مختلف حیاتی است.
کاربردهای بیگ دیتا در علم نجوم
تجزیه و تحلیل دادههای نجومی در مقیاس بزرگ
تفاوت نجوم با یوتیوب، فیس بوک و توییتر الزامات محاسباتی برای تجزیه و تحلیل داده ها است و تجزیه و تحلیل تخصصی بیشتری توسط داده های نجوم مورد نیاز است. بخشی از این کار با پردازش در محل و کاهش داده ها توسط رایانه های واقع در نزدیکی تلسکوپ های رصدخانه انجام می شود. به دلیل ماهیت بلادرنگ و حجم زیاد داده، این تحلیل اولیه دشوار است. اما می تواند به طور موازی بر روی چندین هسته انجام شود و بسیار کارآمد باشد.
رابطه بین داده های ورودی و خروجی بر اساس نمونه های ورودی-خروجی را می توان با روش های یادگیری ماشین پوشش داد. و این به روش های مختلف اخترفیزیکی ثابت شده است. برای مثال، دانیل مورتلاک و همکارانش از سیستم تحلیل بیزی برای یافتن دورترین اختروش شناسایی شده تا کنون استفاده می کنند. این اجرام بسیار درخشان در مرکز کهکشان های بزرگ شکل گرفته اند و یافتن آنها بسیار سخت است. مقایسه بیزی از بسیاری جهات کمک کرده است، مثلا کمک به دانشمندان برای انتخاب چند جرم محتمل برای رصد مجدد از بین هزاران کاندید.
فواصل در نجوم، از زمین تا کهکشان ها از روی انتقال به سرخ نشان داده شده توسط آنها در طیف اندازه گیری می شود، اما هنوز دقیق نیست مگر اینکه از طیف سنجی استفاده شود. روشهای یادگیری ماشین بهطور گستردهای بهمنظور دریافت انتقال به سرخ دقیق از نورسنجی استفاده میکنند. یکی دیگر از کاربردها را می توان اندازه گیری علوم تصویری کهکشان ها دانست.
طبقه بندی گروهی از کهکشان ها پس از بررسی اولیه، توسط پروژه علمی شهروندی Galaxy Zoo تسریع شد، که هدف آن مشارکت عموم در طبقه بندی کهکشان ها است. افرادی که داوطلب شدند در بیش از 100 میلیون طبقه بندی مشارکت داشته اند.این پروژه اخترفیزیکدانان را قادر می سازد تا به دنبال ارتباط بین ظاهر کهکشان ها (مورفولوژی) و ویژگی های داخلی و خارجی باشند.
جستجوی سیارات یکی از زیر شاخه های رو به رشد اخترفیزیک است. فضاپیمای کپلر ناسا از سال 2009 در حال کاوش و جستوجوی سیارات خارجی بوده و منحنی نوری ستارگان را مشاهده میکند که درخشندگی ستارگان را در فواصل زمانی منظم اندازهگیری میکند. تغییرات در روشنایی بررسی میشود که نشان میدهد سیارهای میتوانست در مقابل آن حرکت کرده باشد. اگر این اتفاق در فواصل منظم و کاهش نوری که از ستاره میآید ادامه پیدا کند، احتمالاً ممکن است یک سیاره فراخورشیدی باشد.
اکنون گوگل یک نرم افزار هوش مصنوعی معرفی کرده است تا با تجزیه و تحلیل داده های بزرگ به دست آمده از تلسکوپ های مختلف، سیارات فراخورشیدی را نقشه برداری کند. ماهواره بررسی سیاره فراخورشیدی گذری که با نام TESS نیز شناخته می شود در سال 2017 پرتاب شد. در این تلسکوپ الگوریتم هایی تعبیه شده بود که به طور قابل توجهی بهبود یافته اند تا سیارات با اندازه زمین را با اطمینان بیشتری برای مشاهدات بعدی شناسایی کنند.
مشکلاتی مانند فوران های خورشیدی که می توانند زندگی روی زمین را از جهات مختلف تحت تاثیر قرار دهند، به صورت بلادرنگ توسط تلسکوپ های فضایی رصد می شوند. در غیر این صورت ممکن است برای فضانوردان خطرناک باشد یا به فضاپیماها و ماهواره ها آسیب برساند.
هدف اصلی این است که با تجزیه و تحلیل داده ها، درک درستی از خورشید داشته باشیم و به سرعت حوادثی مانند فوران های خورشیدی را شناسایی کنیم و اقدامات لازم را در زمان مناسب انجام دهیم. این نظارت مداوم توسط نرم افزار خودکار انجام می شود، اما همه رویدادها شناسایی نمی شوند. احتمال فوران توسط دانشمندان بر اساس داده های بزرگ تجزیه و تحلیل شده پیش بینی می شود.
پیمایش دیجیتالی آسمان
این بخش بر روی بررسی های آسمانی مستقر بر روی زمین، رصدخانه های زمینی و رصدخانه های فضایی متمرکز است. این بخش بیشتر بر روی مجموعههای دادههای همگن از پیمایش آسمان دیجیتال و اهداف خاص آنها تمرکز دارد. تغییرات اساسی در زمینه نجوم عمدتاً توسط پیمایش دیجیتالی آسمان در مقایسه با سایر منابع نجومی متفاوت انجام میشود.
اساساً این به دو دلیل ایجاد می شود. اول مقدار زیادی از داده ها که در طول موج های متعدد تولید می شوند، و دوم، در نتیجه همگن بودن داده ها در هر بررسی. کارآیی بررسیهای زمینی آینده با ادغام بررسیهای مختلف بیشتر بهبود مییابد و راههای کاملاً جدیدی برای تحقیق باز خواهد شد.
انفجار داده ها
در دهه 1990، نجوم از یک علم نسبتاً ضعیف به یک حوزه غنی از داده تبدیل شد و دلیل اصلی آن بررسیهای بزرگ آسمان دیجیتال بود. پیمایش های بزرگ معروف به پیمایش های آسمان به منابع داده غالب در نجوم تبدیل شدند و این روند همچنان ادامه دارد و حجم داده ها در نجوم هر سال دو برابر می شود. در گذشته، کاتالوگ های مشتق شده از پیمایش ها را می توان از کاغذهای چاپی به دست آورد، اما با افزایش حجم داده ها، کاتالوگ منابع شروع به ثبت میلیون ها جرم کردند. به همین دلیل پایگاههای داده، دادهکاوی، خدمات وب و سایر ابزارها و تکنیکهای محاسباتی به بخش استانداردی از حوزه نجوم تبدیل شدند.
به دلایلی که در بالا ذکر کردیم، نجوم مبتنی بر پیمایش آسمان بسیار محبوب شد. اما بدیهی است که توزیع داده ها در بررسی های مختلف (در طول موج های مختلف) از نظر علمی پتانسیل بالاتری دارد، زیرا می تواند اطلاعاتی را آشکار کند که در داده های ترکیب شده وجود دارد، اما در هر حجم داده های منفرد، نمی توان آن را به دست آورد.
چالشهای پیچیده زیادی با مدیریت کلان دادههای پیچیده و کشف دانش در آنها آشکار میشود: نحوه پردازش، ذخیره، ترکیب، کالیبره کردن و دسترسی به آنها با استفاده از سختافزار و نرمافزار مدرن و شبکهها. این یک زمینه بسیار در حال توسعه است که به طور گسترده تلاش های جمعی را بین ستاره شناسان و مهندسان کامپیوتر ایجاد می کند.
اهداف پیمایش آسمان
پیمایش ها را می توان به صورت زمینی یا فضایی یا بسته به انگیزه علمی و روش شناسی، محدوده طول موج آنها، دسته مشاهداتی مانند تصویربرداری، قطب سنجی، طیف سنجی، خصوصیات زمانی، عمق و پوشش منطقه ای آنها طبقه بندی کرد.
پانوراما پیمایش ها ممکن است با سرشماری انواع خاصی از منابع مانند اختروشها یا ستارگان که ممکن است برای تحقیقاتی مانند ساختار کهکشان مفید باشند، بهطور علمی انجام شود. تمایز علمی واضحی بین پیمایش ها و مشاهدات نجومی که به طور سنتی هدف قرار می گیرند وجود دارد. هدف از بررسی ها ترسیم و توصیف محتوای اخترفیزیکی و توزیع اجرام سماوی در فضا است.
اما مشاهدات نجومی خواص دقیق هر یک از منابع یا تعداد نسبتاً کمی از آنها را هدف قرار می دهد. پیمایش ها اغلب به عنوان راه هایی برای یافتن چنین اهدافی برای مطالعه با جزئیات عمل می کنند.
مشاهدات نجومی و همچنین بررسی ها اغلب توسط فناوری های جدید تسهیل می شود. با بهبود فناوریهای آشکارساز و تلسکوپ، دامنههای طول موج جدید یا حساسیت یا وضوح بیشتر باز میشوند و دید وسیع و واضحی از آسمان از نظر فنی فراهم میکنند. با پیشرفت چشمگیر فناوریهای اطلاعات و محاسبات مانند مفاهیم کلان داده برای پردازش مقادیر زیادی داده، برخی از تغییرات کیفی جالب در روشهایی که ما جهان خود را مطالعه میکنیم رخ داده است.
بررسی های طیف سنجی معمولاً تعدادی از اجسام انتخاب شده از بررسی های تصویربرداری را هدف قرار می دهند. اما هدف اصلی بررسیهای برونکهکشانی معمولاً بهدست آوردن انتقال به سرخ و تعیین ویژگیهای فیزیکی اهداف مانند نرخهای تشکیل ستاره در صورت وجود است. در مورد بررسیهای کهکشانی، اندازهگیری سرعتهای شعاعی و فراوانی شیمیایی ستارهها اهداف معمولی هستند.
ادامه مقاله را در بخش دوم مطالعه نمایید.