در این مقاله، توضیح می‌دهیم که چگونه علم داده در حال پیشبرد نوآوری‌ها در بیوتکنولوژی پزشکی و ژنومیک است.

بدن انسان حاوی انبوهی از اطلاعات ژنومی است. نه تنها DNA ما از حدود سه میلیارد باز ژنومی تشکیل شده است، بلکه اگر تمام DNA موجود در بدن انسان را در طول هم قرار دهیم، طول آن به دو برابر قطر منظومه شمسی می‌رسد، یا به عبارت دیگر معادل 600 برابر فاصله زمین تا ماه است. در این مقیاس DNA هر سلول سه متر طول خواهد داشت.

بیوتکنولوژی یا زیست فناوری، که به استفاده از موجودات زنده یا سیستم‌های بیولوژیکی و مشتقات آن‌ها برای ساخت محصولات تلاش می‌کند، با کمک داده‌ها، اطلاعات و آمار به پیش می‌رود. طبق مجله ساینس، در سال ۲۰۱۴، بیوانفورماتیک به جای اینکه صرفاً ابزاری برای زیست‌شناس یا متخصص بیوتکنولوژی باشد، به یک رشته مستقل تبدیل شد. هوش تجاری، تحلیل داده‌ها و پیشرفت‌های تکنولوژیکی برای توسعه فناوری‌ها و درمان‌های جدید و غلبه بر چالش‌های فعلی بسیار مهم هستند.

ژنومیک

در زمینه بیگ دیتا در بیوتکنولوژی، اولین چیزی که به ذهن خطور می‌کند احتمالاً مربوط به توالی‌یابی ژنوم است. پروژه ژنوم انسان که از ۱۹۹۰ تا ۲۰۰۳ اجرا شد، تلاشی پیشگامانه بود که به ما امکان دسترسی به سه میلیارد پایگاه داده را داد و درِ اطلاعاتی در مورد جهش‌ها، ژن‌ها و موارد دیگر را به روی ما گشود.

ما اکنون در دنیایی زندگی می‌کنیم که داده‌های ژنوم در نوک انگشتان ما قرار دارد؛ این داده‌ها را می‌توان طی چند ساعت و با هزینه‌ای کمتر از ۱۰۰۰ پوند توالی‌یابی کرد.

داده‌های در دسترس در حال حاضر به محققان این امکان را می‌دهد تا بینش‌های ارزشمندی در زمینه پزشکی، تحقیقات صحنه جرم و غیره به دست آورند. برای کارآمدی در کار با این حجم داده، دانشمندان داده از چارچوب‌ها و ابزارهایی برای ذخیره، ردیابی، دریافت، تجزیه و تحلیل و تفسیر داده‌ها استفاده می‌کنند.

اکنون ابزارهایی برای تفسیر خودکار ژن‌های خاص ساخته می‌شود و شرکت‌های نرم‌افزاری مانند DNAnexus، Knome و NextBio تفسیر ژنوم را آغاز کرده‌اند. نکته جالب این است که NextBio حتی با شرکت Intel برای بهبود Hadoop برای تجزیه و تحلیل داده‌های بزرگ ژنومی همکاری کرده است. صنایع داروسازی و مراقبت‌های بهداشتی می‌توانند از این بینش برای بهبود تشخیص، کمک به کشف دارو یا توسعه استراتژی‌های پزشکی شخصی‌سازی‌شده استفاده کنند.

کشف دارو، توسعه و ژنومیک

عرضه یک محصول دارویی جدید به بازار فرآیندی طولانی، دشوار و با موانع متعدد است. کارآزمایی‌ها به طور مرتب در رسیدن به اهداف خود، مانند ثبت‌نام بیماران، شکست می‌خورند که این امر می‌تواند باعث تأخیر بیشتر و در نتیجه افزایش هزینه‌های فرآیندی شود که در حال حاضر گران است.

با این حال، قبل از اینکه مسائل مربوط به جذب بیمار برای کارآزمایی بالینی رخ دهد، دانشمندان ابتدا باید یک کاندید دارویی را شناسایی کنند، که این فرآیند همچنان شامل نقاط داده، آزمایش‌ها و تجزیه و تحلیل‌های ریسک/فایده متعددی است.

اکنون می‌توانیم از نرم‌افزار خودکار برای غربالگری میلیون‌ها ترکیب استفاده کنیم تا کاندیداهای دارو برای کارآزمایی بالینی را شناسایی کنیم. متخصصان داروسازی می‌توانند اجازه دهند هوش مصنوعی (AI) کار دشوار غربالگری از میان یک لیست عظیم از داروهای بالقوه را انجام دهد و ارزیابی کند که کدام دارو با معیارهای خاص کارآزمایی مطابقت دارد.

برای مثال، شرکت بیوتکنولوژی Numerate مدل‌های پیش‌بینی‌کننده‌ای برای کمک به طراحی داروهای مولکول کوچک، پیش‌بینی‌هایی در مورد سمیت، متابولیسم، جذب، توزیع و موارد دیگر ایجاد می‌کند. همچنین می‌توان از هوش مصنوعی برای ابداع ترکیبات جدید از ترکیبات مختلف استفاده کرد. بنابراین شرکت‌های دارویی می‌توانند کاندیداهای دارو را غربالگری کنند و مواردی را انتخاب کنند که به احتمال زیاد در کارآزمایی‌های بالینی موفق شوند.

بیگ دیتا در بیوتکنولوژی فقط منحصر به ژنومیک نیست بلکه داده‌ها ممکن است توسط حسگرها نیز جمع‌آوری شوند. حسگرهای پوشیدنی، قابل بلع یا قابل کاشت می‌توانند جریان داده‌ای مداوم را برای کارآزمایی‌های بالینی فراهم کنند.

این داده‌ها می‌تواند فاصله بین اندازه‌گیری‌های انجام‌شده در قرار ملاقات‌ها را کاهش دهد، خطاهای انسانی را کاهش دهد، دلایل ترک کردن کارآزمایی را شناسایی کند و به بیماران امکان دهد راحت‌تر زندگی عادی خود را ادامه دهند. هر گونه بهبودی در فرآیند کشف دارو یا کارآزمایی بالینی می‌تواند میلیون‌ها دلار در هزینه‌های توسعه صرفه‌جویی کند و در نتیجه زمان عرضه یک داروی بالقوه نجات‌دهنده به بازار را تسریع کند.

کلیدهای آینده

دانشمندان علم داده، کلیدهای آینده تحلیل داده‌ها برای بیوتکنولوژی پزشکی را در دست دارند. برای ظهور نوآوری، این صنعت به دانشمندان علم داده و بیوتکنولوژیست‌های آموزش دیده با مهارت در زبان‌های برنامه‌نویسی و کدگذاری از جمله پایتون،R, SQL و ++C  و موارد دیگر نیاز دارد. آنها همچنین به دانش زمینه‌ای در مورد جمع‌آوری داده، ذخیره‌سازی، الگوریتم‌ها، اعتبارسنجی و تجسم داده برای استخراج معنا از داده‌های بیولوژیکی نیاز دارند.

دانش و مهارت‌های لازم برای نوشتن با این زبان‌ها عمدتاً در اختیار دانشمندان داده با مدارک تحصیلی پیشرفته است، به این معنی که سرمایه‌گذاری روی فریلنسرها یا آموزش استعدادهای داخلی برای استفاده کامل از داده‌های ژنومی بسیار مهم است.

منبع: drugtargetreview.com

Published by

ساره واحدی
svahedi72

ساره واحدی هستم؛ دانشجوی پانزدهمین دوره "علم داده" در آکادمی دایکه، دانشجوی کارشناسی ارشد فیزیک و علاقمند به کار کردن با دیتاها