در این مقاله، توضیح میدهیم که چگونه علم داده در حال پیشبرد نوآوریها در بیوتکنولوژی پزشکی و ژنومیک است.
بدن انسان حاوی انبوهی از اطلاعات ژنومی است. نه تنها DNA ما از حدود سه میلیارد باز ژنومی تشکیل شده است، بلکه اگر تمام DNA موجود در بدن انسان را در طول هم قرار دهیم، طول آن به دو برابر قطر منظومه شمسی میرسد، یا به عبارت دیگر معادل 600 برابر فاصله زمین تا ماه است. در این مقیاس DNA هر سلول سه متر طول خواهد داشت.
بیوتکنولوژی یا زیست فناوری، که به استفاده از موجودات زنده یا سیستمهای بیولوژیکی و مشتقات آنها برای ساخت محصولات تلاش میکند، با کمک دادهها، اطلاعات و آمار به پیش میرود. طبق مجله ساینس، در سال ۲۰۱۴، بیوانفورماتیک به جای اینکه صرفاً ابزاری برای زیستشناس یا متخصص بیوتکنولوژی باشد، به یک رشته مستقل تبدیل شد. هوش تجاری، تحلیل دادهها و پیشرفتهای تکنولوژیکی برای توسعه فناوریها و درمانهای جدید و غلبه بر چالشهای فعلی بسیار مهم هستند.
ژنومیک
در زمینه بیگ دیتا در بیوتکنولوژی، اولین چیزی که به ذهن خطور میکند احتمالاً مربوط به توالییابی ژنوم است. پروژه ژنوم انسان که از ۱۹۹۰ تا ۲۰۰۳ اجرا شد، تلاشی پیشگامانه بود که به ما امکان دسترسی به سه میلیارد پایگاه داده را داد و درِ اطلاعاتی در مورد جهشها، ژنها و موارد دیگر را به روی ما گشود.
ما اکنون در دنیایی زندگی میکنیم که دادههای ژنوم در نوک انگشتان ما قرار دارد؛ این دادهها را میتوان طی چند ساعت و با هزینهای کمتر از ۱۰۰۰ پوند توالییابی کرد.
دادههای در دسترس در حال حاضر به محققان این امکان را میدهد تا بینشهای ارزشمندی در زمینه پزشکی، تحقیقات صحنه جرم و غیره به دست آورند. برای کارآمدی در کار با این حجم داده، دانشمندان داده از چارچوبها و ابزارهایی برای ذخیره، ردیابی، دریافت، تجزیه و تحلیل و تفسیر دادهها استفاده میکنند.
اکنون ابزارهایی برای تفسیر خودکار ژنهای خاص ساخته میشود و شرکتهای نرمافزاری مانند DNAnexus، Knome و NextBio تفسیر ژنوم را آغاز کردهاند. نکته جالب این است که NextBio حتی با شرکت Intel برای بهبود Hadoop برای تجزیه و تحلیل دادههای بزرگ ژنومی همکاری کرده است. صنایع داروسازی و مراقبتهای بهداشتی میتوانند از این بینش برای بهبود تشخیص، کمک به کشف دارو یا توسعه استراتژیهای پزشکی شخصیسازیشده استفاده کنند.
کشف دارو، توسعه و ژنومیک
عرضه یک محصول دارویی جدید به بازار فرآیندی طولانی، دشوار و با موانع متعدد است. کارآزماییها به طور مرتب در رسیدن به اهداف خود، مانند ثبتنام بیماران، شکست میخورند که این امر میتواند باعث تأخیر بیشتر و در نتیجه افزایش هزینههای فرآیندی شود که در حال حاضر گران است.
با این حال، قبل از اینکه مسائل مربوط به جذب بیمار برای کارآزمایی بالینی رخ دهد، دانشمندان ابتدا باید یک کاندید دارویی را شناسایی کنند، که این فرآیند همچنان شامل نقاط داده، آزمایشها و تجزیه و تحلیلهای ریسک/فایده متعددی است.
اکنون میتوانیم از نرمافزار خودکار برای غربالگری میلیونها ترکیب استفاده کنیم تا کاندیداهای دارو برای کارآزمایی بالینی را شناسایی کنیم. متخصصان داروسازی میتوانند اجازه دهند هوش مصنوعی (AI) کار دشوار غربالگری از میان یک لیست عظیم از داروهای بالقوه را انجام دهد و ارزیابی کند که کدام دارو با معیارهای خاص کارآزمایی مطابقت دارد.
برای مثال، شرکت بیوتکنولوژی Numerate مدلهای پیشبینیکنندهای برای کمک به طراحی داروهای مولکول کوچک، پیشبینیهایی در مورد سمیت، متابولیسم، جذب، توزیع و موارد دیگر ایجاد میکند. همچنین میتوان از هوش مصنوعی برای ابداع ترکیبات جدید از ترکیبات مختلف استفاده کرد. بنابراین شرکتهای دارویی میتوانند کاندیداهای دارو را غربالگری کنند و مواردی را انتخاب کنند که به احتمال زیاد در کارآزماییهای بالینی موفق شوند.
بیگ دیتا در بیوتکنولوژی فقط منحصر به ژنومیک نیست بلکه دادهها ممکن است توسط حسگرها نیز جمعآوری شوند. حسگرهای پوشیدنی، قابل بلع یا قابل کاشت میتوانند جریان دادهای مداوم را برای کارآزماییهای بالینی فراهم کنند.
این دادهها میتواند فاصله بین اندازهگیریهای انجامشده در قرار ملاقاتها را کاهش دهد، خطاهای انسانی را کاهش دهد، دلایل ترک کردن کارآزمایی را شناسایی کند و به بیماران امکان دهد راحتتر زندگی عادی خود را ادامه دهند. هر گونه بهبودی در فرآیند کشف دارو یا کارآزمایی بالینی میتواند میلیونها دلار در هزینههای توسعه صرفهجویی کند و در نتیجه زمان عرضه یک داروی بالقوه نجاتدهنده به بازار را تسریع کند.
کلیدهای آینده
دانشمندان علم داده، کلیدهای آینده تحلیل دادهها برای بیوتکنولوژی پزشکی را در دست دارند. برای ظهور نوآوری، این صنعت به دانشمندان علم داده و بیوتکنولوژیستهای آموزش دیده با مهارت در زبانهای برنامهنویسی و کدگذاری از جمله پایتون،R, SQL و ++C و موارد دیگر نیاز دارد. آنها همچنین به دانش زمینهای در مورد جمعآوری داده، ذخیرهسازی، الگوریتمها، اعتبارسنجی و تجسم داده برای استخراج معنا از دادههای بیولوژیکی نیاز دارند.
دانش و مهارتهای لازم برای نوشتن با این زبانها عمدتاً در اختیار دانشمندان داده با مدارک تحصیلی پیشرفته است، به این معنی که سرمایهگذاری روی فریلنسرها یا آموزش استعدادهای داخلی برای استفاده کامل از دادههای ژنومی بسیار مهم است.
منبع: drugtargetreview.com