با پیشرفت تکنولوژی در زمینه تلسکوپ‌ها، کامپیوتر و دستگاه‌های آشکارساز، نجوم نیز مانند بسیاری از زمینه های دیگر، به یک زمینه بسیار غنی از داده تبدیل شده است. در حال حاضر تعداد زیادی آرشیو دیتاها و پیمایش آسمان وجود دارد که حاوی چندین ترابایت اطلاعات است. منبع اولیه داده‌های نجومی، مشاهدات آسمان به شیوه‌ای سیستماتیک در دامنه‌ای از طول موج‌های بالاست. حجم قابل توجهی از اطلاعات نیز با برخی شبیه سازی ها تولید می شود.

این یک تغییر بزرگ در شیوه مطالعات نجومی است زیرا در گذشته، یک جرم نجومی منفرد برای مطالعه استفاده می شد، اما در حال حاضر می توان کل جهان را به طور سیستماتیک ترسیم کرد. این نجومِ جدید که مبتنی بر داده های بزرگ و بیگ دیتا است، می‌تواند دانشمندان و دانشجویانی که به تلسوپ های بزرگ دسترسی ندارند را نیز در مطالعات علمی مشارکت دهد، این همکاری‌ها به طور حقیقی نیازی به دسترسی مستقیم به تلسکوپ‌ها ندارد.

دانشمندان برای مدیریت و کاوش این حجم عظیم از داده ها با چالش فنی قابل توجهی روبرو هستند. این بزرگ شدن ناگهانی داده‌های مربوط به نجوم، داده‌های تحلیلی سنتی نجومی را ناکافی کرده است. با این حال، این مسائل تقریباً در تمام زمینه های غنی از داده مشترک است. و البته امیدواریم که برخی از ایده ها و بینش های حاصل از این کار بر حوزه های دیگری از علم و فناوری تأثیر بگذارد.

ماهیت داده های نجومی

به طور کلی داده های نجومی بسیار متنوع و ناهمگن هستند، هم در محتوا و هم در قالب.
با وجود همه این تنوع و ناهمگونی، داده های نجومی و تجزیه و تحلیل بعدی آن را می توان به طور گسترده در پنج حوزه طبقه بندی کرد:

• داده های تصویربرداری
• تولید کاتالوگ با پردازش داده های تصویربرداری
• انجام اندازه گیری های بعدی مانند طیف سنجی و قطبش
• مطالعه حوزه زمان
• انجام شبیه سازی

حجم بسیار زیادی از داده های آرشیو شده در نجوم در مکان های مختلف در انواع سیستم های پایگاه داده ذخیره می شود. بنابراین، مفهوم داده های بزرگ برای استخراج داده ها از این پایگاه های داده مختلف در مکان های مختلف حیاتی است.

 کاربردهای بیگ دیتا در علم نجوم

تجزیه و تحلیل داده‌های نجومی در مقیاس بزرگ

تفاوت نجوم با یوتیوب، فیس بوک و توییتر الزامات محاسباتی برای تجزیه و تحلیل داده ها است و تجزیه و تحلیل تخصصی بیشتری توسط داده های نجوم مورد نیاز است. بخشی از این کار با پردازش در محل و کاهش داده ها توسط رایانه های واقع در نزدیکی تلسکوپ های رصدخانه انجام می شود. به دلیل ماهیت بلادرنگ و حجم زیاد داده، این تحلیل اولیه دشوار است. اما می تواند به طور موازی بر روی چندین هسته انجام شود و بسیار کارآمد باشد.

رابطه بین داده های ورودی و خروجی بر اساس نمونه های ورودی-خروجی را می توان با روش های یادگیری ماشین پوشش داد. و این به روش های مختلف اخترفیزیکی ثابت شده است. برای مثال، دانیل مورتلاک و همکارانش از سیستم تحلیل بیزی برای یافتن دورترین اختروش شناسایی شده تا کنون استفاده می کنند. این اجرام بسیار درخشان در مرکز کهکشان های بزرگ شکل گرفته اند و یافتن آنها بسیار سخت است. مقایسه بیزی از بسیاری جهات کمک کرده است، مثلا کمک به دانشمندان برای انتخاب چند جرم محتمل برای رصد مجدد از بین هزاران کاندید.

فواصل در نجوم، از زمین تا کهکشان ها از روی انتقال به سرخ نشان داده شده توسط آنها در طیف اندازه گیری می شود، اما هنوز دقیق نیست مگر اینکه از طیف سنجی استفاده شود. روش‌های یادگیری ماشین به‌طور گسترده‌ای به‌منظور دریافت انتقال به سرخ دقیق از نورسنجی استفاده می‌کنند. یکی دیگر از کاربردها را می توان اندازه گیری علوم تصویری کهکشان ها دانست.

طبقه بندی گروهی از کهکشان ها پس از بررسی اولیه، توسط پروژه علمی شهروندی Galaxy Zoo تسریع شد، که هدف آن مشارکت عموم در طبقه بندی کهکشان ها است. افرادی که داوطلب شدند در بیش از 100 میلیون طبقه بندی مشارکت داشته اند.این پروژه اخترفیزیکدانان را قادر می سازد تا به دنبال ارتباط بین ظاهر کهکشان ها (مورفولوژی) و ویژگی های داخلی و خارجی باشند.

جستجوی سیارات یکی از زیر شاخه های رو به رشد اخترفیزیک است. فضاپیمای کپلر ناسا از سال 2009 در حال کاوش و جست‌وجوی سیارات خارجی بوده و منحنی نوری ستارگان را مشاهده می‌کند که درخشندگی ستارگان را در فواصل زمانی منظم اندازه‌گیری می‌کند. تغییرات در روشنایی بررسی می‌شود که نشان می‌دهد سیاره‌ای می‌توانست در مقابل آن حرکت کرده باشد. اگر این اتفاق در فواصل منظم و کاهش نوری که از ستاره می‌آید ادامه پیدا کند، احتمالاً ممکن است یک سیاره فراخورشیدی باشد.

اکنون گوگل یک نرم افزار هوش مصنوعی معرفی کرده است تا با تجزیه و تحلیل داده های بزرگ به دست آمده از تلسکوپ های مختلف، سیارات فراخورشیدی را نقشه برداری کند. ماهواره بررسی سیاره فراخورشیدی گذری که با نام TESS نیز شناخته می شود در سال 2017 پرتاب شد. در این تلسکوپ الگوریتم هایی تعبیه شده بود که به طور قابل توجهی بهبود یافته اند تا سیارات با اندازه زمین را با اطمینان بیشتری برای مشاهدات بعدی شناسایی کنند.

مشکلاتی مانند فوران های خورشیدی که می توانند زندگی روی زمین را از جهات مختلف تحت تاثیر قرار دهند، به صورت بلادرنگ توسط تلسکوپ های فضایی رصد می شوند. در غیر این صورت ممکن است برای فضانوردان خطرناک باشد یا به فضاپیماها و ماهواره ها آسیب برساند.

هدف اصلی این است که با تجزیه و تحلیل داده ها، درک درستی از خورشید داشته باشیم و به سرعت حوادثی مانند فوران های خورشیدی را شناسایی کنیم و اقدامات لازم را در زمان مناسب انجام دهیم. این نظارت مداوم توسط نرم افزار خودکار انجام می شود، اما همه رویدادها شناسایی نمی شوند. احتمال فوران توسط دانشمندان بر اساس داده های بزرگ تجزیه و تحلیل شده پیش بینی می شود.

پیمایش دیجیتالی آسمان

این بخش بر روی بررسی های آسمانی مستقر بر روی زمین، رصدخانه های زمینی و رصدخانه های فضایی متمرکز است. این بخش بیشتر بر روی مجموعه‌های داده‌های همگن از پیمایش آسمان دیجیتال و اهداف خاص آنها تمرکز دارد. تغییرات اساسی در زمینه نجوم عمدتاً توسط پیمایش دیجیتالی آسمان در مقایسه با سایر منابع نجومی متفاوت انجام می‌شود.

اساساً این به دو دلیل ایجاد می شود. اول مقدار زیادی از داده ها که در طول موج های متعدد تولید می شوند، و دوم، در نتیجه همگن بودن داده ها در هر بررسی. کارآیی بررسی‌های زمینی آینده با ادغام بررسی‌های مختلف بیشتر بهبود می‌یابد و راه‌های کاملاً جدیدی برای تحقیق باز خواهد شد.

 انفجار داده ها

در دهه 1990، نجوم از یک علم نسبتاً ضعیف به یک حوزه غنی از داده تبدیل شد و دلیل اصلی آن بررسی‌های بزرگ آسمان دیجیتال بود. پیمایش های بزرگ معروف به پیمایش های آسمان به منابع داده غالب در نجوم تبدیل شدند و این روند همچنان ادامه دارد و حجم داده ها در نجوم هر سال دو برابر می شود. در گذشته، کاتالوگ های مشتق شده از پیمایش ها را می توان از کاغذهای چاپی به دست آورد، اما با افزایش حجم داده ها، کاتالوگ منابع شروع به ثبت میلیون ها جرم کردند. به همین دلیل پایگاه‌های داده، داده‌کاوی، خدمات وب و سایر ابزارها و تکنیک‌های محاسباتی به بخش استانداردی از حوزه نجوم تبدیل شدند.

به دلایلی که در بالا ذکر کردیم، نجوم مبتنی بر پیمایش  آسمان بسیار محبوب شد. اما بدیهی است که توزیع داده ها در بررسی های مختلف (در طول موج های مختلف) از نظر علمی پتانسیل بالاتری دارد، زیرا می تواند اطلاعاتی را آشکار کند که در داده های ترکیب شده وجود دارد، اما در هر حجم داده های منفرد، نمی توان آن را به دست آورد.

چالش‌های پیچیده زیادی با مدیریت کلان داده‌های پیچیده و کشف دانش در آنها آشکار می‌شود: نحوه پردازش، ذخیره، ترکیب، کالیبره کردن و دسترسی به آنها با استفاده از سخت‌افزار و نرم‌افزار مدرن و شبکه‌ها.  این یک زمینه بسیار در حال توسعه است که به طور گسترده تلاش های جمعی را بین ستاره شناسان و مهندسان کامپیوتر ایجاد می کند.

اهداف پیمایش آسمان

پیمایش ها را می توان به صورت زمینی یا فضایی یا بسته به انگیزه علمی و روش شناسی، محدوده طول موج آنها، دسته مشاهداتی مانند تصویربرداری، قطب سنجی، طیف سنجی، خصوصیات زمانی، عمق و پوشش منطقه ای آنها طبقه بندی کرد.

پانوراما پیمایش ها ممکن است با سرشماری انواع خاصی از منابع مانند اختروش‌ها یا ستارگان که ممکن است برای تحقیقاتی مانند ساختار کهکشان مفید باشند، به‌طور علمی انجام شود. تمایز علمی واضحی بین پیمایش ها و مشاهدات نجومی که به طور سنتی هدف قرار می گیرند وجود دارد. هدف از بررسی ها ترسیم و توصیف محتوای اخترفیزیکی و توزیع اجرام سماوی در فضا است.

اما مشاهدات نجومی خواص دقیق هر یک از منابع یا تعداد نسبتاً کمی از آنها را هدف قرار می دهد. پیمایش ها اغلب به عنوان راه هایی برای یافتن چنین اهدافی برای مطالعه با جزئیات عمل می کنند.

مشاهدات نجومی و همچنین بررسی ها اغلب توسط فناوری های جدید تسهیل می شود. با بهبود فناوری‌های آشکارساز و تلسکوپ، دامنه‌های طول موج جدید یا حساسیت یا وضوح بیشتر باز می‌شوند و دید وسیع و واضحی از آسمان از نظر فنی فراهم می‌کنند. با پیشرفت چشمگیر فناوری‌های اطلاعات و محاسبات مانند مفاهیم کلان داده برای پردازش مقادیر زیادی داده، برخی از تغییرات کیفی جالب در روش‌هایی که ما جهان خود را مطالعه می‌کنیم رخ داده است.

بررسی های طیف سنجی معمولاً تعدادی از اجسام انتخاب شده از بررسی های تصویربرداری را هدف قرار می دهند. اما هدف اصلی بررسی‌های برون‌کهکشانی معمولاً به‌دست آوردن انتقال به سرخ و تعیین ویژگی‌های فیزیکی اهداف مانند نرخ‌های تشکیل ستاره در صورت وجود است. در مورد بررسی‌های کهکشانی، اندازه‌گیری سرعت‌های شعاعی و فراوانی شیمیایی ستاره‌ها اهداف معمولی هستند.

ادامه مقاله را در بخش دوم مطالعه نمایید.

Published by

ساره واحدی
svahedi72

ساره واحدی هستم؛ دانشجوی پانزدهمین دوره "علم داده" در آکادمی دایکه، دانشجوی کارشناسی ارشد فیزیک و علاقمند به کار کردن با دیتاها