با افزایش پیچیدگی در داده های ژنومی، محققان «هوش مصنوعی» و «یادگیری ماشین» را به عنوان راه هایی برای شناسایی الگوهای معنادار تلقی می کنند که از آن برای اهداف مراقبت های بهداشتی و تحقیقاتی بهره می برند.
استفاده از روشهای محاسباتی مانند هوش مصنوعی و یادگیری ماشین در حوزه ژنتیک همچنان گسترش می یابد تا درک ما را از الگوهای پنهان در مجموعه دادههای بزرگ و پیچیده ژنومیک از پروژههای تحقیقاتی پایه و بالینی بهبود بخشد.
هوش مصنوعی چیست؟
تعاریف زیادی برای هوش مصنوعی (AI) وجود دارد. یکی از این تعریف ها برای هوش مصنوعی این است که «هوش مصنوعی یک علم و درواقع مجموعهای از فناوریهای محاسباتی است که از روشهایی که انسان ها از سیستمهای عصبی و بدن خود برای رفتارهای مختلف (از جمله: حس کردن، یادگیری، استدلال و اقدام) استفاده میکنند، الهام گرفتهاست. البته که در عمل معمولا به شکل کاملا متفاوتی از انسان ها عمل میکند.»
هوش مصنوعی می تواند به عنوان نرم افزار و یا ابزاری ایجاد شود که قادر به تقلید از هوش انسانی باشد، این تقلید می تواند در زمینه های خاص یا حتی فراتر از آن در زمینه های متفاوتی اعمال شود. برای اینکه بتوانند یک هوش مصنوعی بسازند، دانشمندان به مجموعه ای از داده های بزرگ با توضیح خوبی نیاز دارند که ابتدا به آنها کمک کند تا تکنیک ها و فرآیندهای مورد استفاده توسط انسان ها را برای تجزیه و تحلیل و تفسیر سناریوهای پیچیده درک کنند. حوزه هوش مصنوعی حوزه ای پویا است و محققان به طور مداوم در حال توسعه تکنیک ها و ابزارهای جدید هستند.
یادگیری ماشین و یادگیری عمیق چیست؟
یادگیری ماشین و یادگیری عمیق دو حوزه از هوش مصنوعی هستند که در سالهای اخیر به طور فزایندهای مورد توجه قرار گرفتهاند. هر دو نوع یادگیری زیرمجموعههایی از هوش مصنوعی می باشند. یادگیری ماشین (Machine Learning) فرآیندی است که از طریق آن میتوان به ماشینها این قابلیت را داد که یک مجموعه داده مشخص را دریافت کنند و بدون برنامهریزی واضح و مستقیم در مورد آنچه که باید یاد بگیرند، بتوانند موضوع مورد نظر را بیاموزند.
ماشینها معمولاً میتوانند به روش های مختلفی از جمله یادگیری تحت نظارت یا یادگیری بدون نظارت یاد بگیرند. در یادگیری نظارت شده، دانشمندان علم داده، مجموعه دادههای آموزشی و آزمایشی را به طور جداگانه به ماشینها ارائه میدهند. داده های آموزشی دارای دسته بندی های تعریف شده ای هستند (به عنوان مثال، افراد مبتلا به بیماری قلبی عروقی و افراد سالم) که ماشین می تواند از آنها برای استنباط ویژگی های پنهان داده ها و متمایز کردن دسته ها از یکدیگر استفاده کند. سپس ماشین میتواند از این دانش برای کار بر روی دادههای آزمایشی و پیشبینیهای آگاهانه استفاده کند مثلاً اینکه کدام افراد در یک جمعیت احتمال ابتلا به بیماری قلبی عروقی را دارند.
در یادگیری بدون نظارت، ماشینها میتوانند الگوها را در مجموعه دادههای بزرگ تشخیص دهند و بدون نیاز به کمک اضافی از سوی انسان، دنیای واقعی را پیشبینی کنند.
وقتی ماشینها میتوانند بدون نظارت یاد بگیرند، کفته می شود که که به طور«عمیق» در حال یادگیری هستند. یادگیری عمیق (Deep learning) یک تکنیک نسبتا جدید است که برای پیاده سازی یادگیری ماشین استفاده می شود. یک الگوریتم یادگیری عمیق مجموعه ای از داده ها را می گیرد و با تقلید از نحوه تعامل نورون های مغز انسان با یکدیگر، الگوها و اطلاعات مهم در آن مجموعه داده را پیدا می کند. این الگوریتمها شبکههای عصبی مصنوعی هستند؛ یک سیستم محاسباتی که توانایی مغز را برای سنجش اهمیت برخی از دادهها در مقابل سایر دادهها و مدیریت سوگیری را شبیهسازی میکند.
چرا در ژنتیک به هوش مصنوعی و یادگیری ماشین نیاز داریم؟
حدود 20 سال از تکمیل پیشنویس توالی ژنوم انسان میگذرد. این نقطه عطف منجر به تولید مقدار فوقالعاده زیادی از دادههای ژنتیکی شده است. پیشبینیها نشان میدهد که تحقیقات ژنومیک در دهه آینده بین 2 تا 40 اگزابایت داده تولید خواهد کرد.
توالییابی DNA و سایر تکنیکهای بیولوژیکی همچنان به افزایش تعداد و پیچیدگی چنین مجموعههای دادهای ادامه خواهند داد. به همین دلیل محققان ژنومیک به ابزارهای محاسباتی مبتنی بر هوش مصنوعی و همچنین یادگیری ماشین نیاز دارند تا بتوانند اطلاعات ارزشمندی را که در این گنجینه بزرگ داده پنهان شده است، به درستی مدیریت، استخراج و تفسیر کنند.
برخی از کاربردهای هوش مصنوعی و یادگیری ماشین در ژنتیک:
اگرچه استفاده از ابزارهای هوش مصنوعی و یادگیری ماشین در ژنتیک هنوز در مراحل اولیه است، اما در حال حاضر نیز محققان از توسعه برنامههایی که به شیوههای خاصی کمک میکنند، بهره بردهاند. برخی از نمونهها عبارتند از:
- تشخیص دقیق اختلالات ژنتیکی: با استفاده از برنامههای هوش مصنوعی تحلیل چهره و بررسی ویژگیهای ظاهری افراد
- تشخیص نوع اولیه سرطان با بیوپسی مایع: به کمک تکنیکهای یادگیری ماشین
- پیشبینی روند پیشرفت نوع خاصی از سرطان در بیماران
- شناسایی جهشهای ژنتیکی عامل بیماری با مقایسه آنها با جهشهای بیخطر از طریق یادگیری ماشین
- بهبود عملکرد ابزارهای ویرایش ژن مانند CRISPR با استفاده از یادگیری عمیق.
این تنها چند نمونه از روشهایی است که با استفاده از آن، هوش مصنوعی و یادگیری ماشین به پیشبینی و شناسایی الگوهای پنهان در دادههای ژنتیکی کمک میکند. دانشمندان همچنین از این فناوری برای پیشبینی تغییرات آینده در ژنوم ویروسهای آنفولانزا و SARS-CoV-2 به منظور کمک به تلاشهای بهداشت عمومی استفاده میکنند.
نقش NHGRI در پیوند هوش مصنوعی، یادگیری ماشین و ژنتیک:
گروه کاری علم داده در ژنتیک NHGRI با همکاری نزدیک با انستیتو ملی بهداشت (NIH) و سایر موسسات دانشگاهی، به تعریف حوزههای حیاتی در ژنتیک برای هوش مصنوعی و یادگیری ماشین میپردازد. این گروه همچنین به تعریف نقش منحصر به فرد NHGRI در فعال کردن تحقیقات یادگیری ماشین برای کمک به هر دو علم ژنتیک و ژنتیک پزشکی کمک میکند. در آوریل 2021، NHGRI یک کارگاه مجازی در مورد یادگیری ماشین در ژنتیک برگزار کرد که طیف گستردهای از پیشرفتهای امیدوارکننده در همکاری هوش مصنوعی و تحقیقات ژنتیک را به نمایش گذاشت.
NHGRI همچنین بخش کلیدی برنامه جدید “پل به هوش مصنوعی” (Bridge2AI) از صندوق مشترک NIH است. هدف برنامه Bridge2AI عمل به عنوان سکوی پرتابی برای پذیرش گسترده هوش مصنوعی در مقابله با چالشهای پیچیده پزشکی بیولوژیکی و پزشکی دقیق است.
علاوه بر مشارکت در Bridge2AI، NHGRI همچنین به طور مستقل تحقیقاتی در علم بین رشته ای هوش مصنوعی و یادگیری ماشین و ژنتیک را تامین مالی میکند. این مجموعه همچنین بر اطمینان از بازتاب منصفانه و اخلاقی تنوع گونههای انسانی در دادههای ژنومیکی مورد استفاده در برنامههای هوش مصنوعی و یادگیری عمیق تمرکز دارد. NHGRI همچنین از تحقیقات در مورد پیامدهای اخلاقی، حقوقی و اجتماعی استفاده از هوش مصنوعی و یادگیری ماشین در ژنتیک حمایت میکند.
برگرفته از سایت genome.gov