شرکت بیوتکنولوژی قصد دارد “زیست شناسی چتپپ” را ایجاد کند-آیا کار آن را انجام می دهد؟


محققان منطقه اساسی داده های ژنتیکی را در مالت جمع می کنند

قیف گرگ

یک شرکت بیوتکنولوژی انگلیس به نام Basecamp Research در سالهای اخیر صرف جمع آوری داده های ژنتیکی از میکروب های ساکن در محیط های شدید در سراسر جهان کرده و بیش از یک میلیون گونه و نزدیک به 10 میلیارد ژن جدید را برای علم شناسایی کرده است. وی ادعا می کند که این بانک اطلاعاتی عظیم از تنوع زیستی این سیاره به تشکیل “چت بیولوژی” کمک می کند که به سؤالات مربوط به زندگی روی زمین پاسخ می دهد – اما هیچ تضمینی برای کار کردن وجود ندارد.

یورگ اونمنن در موسسه Leibniz DSMZ در آلمان ، که یکی از متنوع ترین مجموعه های فرهنگ های میکروبی در جهان را در خود جای داده است ، می گوید که افزایش توالی های ژنتیکی شناخته شده گرانبها است ، اما ممکن است منجر به نتایج مفیدی برای مواردی مانند کشف مواد مخدر یا شیمی نشود بدون اینکه اطلاعات بیشتری در مورد ارگانیسم هایی که از آنها جمع شده اند ، ایجاد شود. وی گفت: “من اطمینان ندارم كه در پایان ، درک كاركردهای واقعاً جدید با این افزایش نیروی بی رحمانه در فضای دنباله تسریع می شود.”

در سالهای اخیر ، محققان در حال توسعه تعدادی از مدل های یادگیری اتوماتیک آموزش دیده برای شناسایی مدل ها و پیش بینی روابط در میانه مقادیر زیادی از داده های بیولوژیکی هستند. مشهورترین آنها Alphafold است که می تواند ساختار سه بعدی یک پروتئین را صرفاً بر اساس داده های ژنتیکی پیش بینی کند ، و سازندگان خود را در Google DeepMind جایزه نوبل شیمی 2024 کسب کرده است.

در حالی که چنین مدلهای “زیست شناسی تولیدی” از آنجا که از آنجا پیچیده تر شده اند ، در آنجا بهبود نیافته اند. فرانسیس دینگ در دانشگاه کالیفرنیا ، برکلی. یکی از دلایل می تواند عدم داده در مورد تنوع زیستی باشد. “مدل های زیست شناسی فعلی بر روی مجموعه داده ها تشکیل شده اند که به طور نامتناسب گونه های خوب و خوب را نشان می دهند (برای مثال ، E. coliماوس ، انسان) و این مدل ها برای پیش بینی خواص در توالی سایر قسمت های درخت زندگی بدتر هستند. “

محققان Basecamp تصمیم گرفتند این شکاف تنوع زیستی را پر کنند. با توجه به یک بانک اطلاعاتی در حال رشد شرکت شامل نمونه هایی از بیش از 120 سایت در 26 کشور جهان است. گزارش این شرکت منتشر کرده است. جاناتان فینمدیر علوم شرکت می گوید که تلاش های مجموعه بر محیط های افراطی متمرکز شده است که هنوز نمونه برداری نشده اند ، از یخ زدن آب در زیر یخ های دریای قطب شمال گرفته تا منابع داغ جنگل. فین توضیح می دهد: “بیشتر نمونه هایی که ما ساخته ایم نمونه های پروکیوتیک هستند: باکتری ها ، میکروب ها و ویروس های آنها.” “من می دانم که ما در آنجا قارچ داریم.”

تجزیه و تحلیل ژنتیکی این نمونه ها تفاوت هایی را در ژنهای تقریباً جهانی از طریق درخت زندگی نشان داده است – بر اساس این ، این شرکت معتقد است که داده ها حاوی اطلاعاتی از بیش از یک میلیون گونه است که در مجموعه داده های ژنومی عمومی که برای تشکیل مدل های زیست شناسی هوش مصنوعی استفاده نمی شوند ، وجود ندارد. به گفته محققان ، این جمع شامل حدود 9.8 میلیارد ژن تازه شناسایی شده ، افزایش 10 بار در تعداد ژنهای شناخته شده است که هر یک از آنها برای یک پروتئین بالقوه مفید کد می کند.

فین توضیح می دهد: “با نشان دادن این مدل ها ، یک قطعه بزرگ از طبیعت ، آنها باید عملکرد زیست شناسی را بهتر درک کنند.” “ما در حال تلاش برای ساختن یک گربه زیست شناسی هستیم.”

با تخمین های خاص ، زمین میزبان است بسیاری مانند یک میلیارد گونه میکروبیتقریباً هیچ یک به خوبی مشخص نشده است. بنابراین ، جای تعجب آور نیست که این شرکت زندگی زیادی را شناسایی کرده است. می گوید: “تقریباً اجتناب ناپذیر است که اگر بیشتر کاوش کنید ، انواع بیشتری از ژن های مختلف دریافت می کنید.” قطعات لئوپولد در موسسه Wellcoma Sanger ، انگلستان.

اما Basecamp این ایده را مطرح می کند که تمام مطالب جدید می تواند گرانبها باشد – و تنها نیست. می گوید: “این یکی از هیجان انگیز ترین چیزهایی است که من مدتها دیده ام.” ناتان فرییک محقق در یادگیری خودکار در Genentech ، یک شرکت بیوتکنولوژی در ایالات متحده. به طور کلی ، او می گوید کار روی مدل های هوش مصنوعی برای زیست شناسی بر بهبود الگوریتم ها یا تولید داده های بیشتر در آزمایشگاه ها به جای بیرون رفتن در جهان و جمع آوری نمونه ها متمرکز شده است.

با این حال ، دلایلی برای شک و تردید در مورد آنچه که این بانک اطلاعاتی منجر به مدلهای بهبود یافته ای که شرکت می خواهد باشد وجود دارد. از یک طرف ، مشخص نیست که این تنوع جدید پروتئین ها عملکردهای جدیدی از گرانبها را نشان می دهد ، مانند آنزیم ها یا پروتئین های پلاستیکی خورده شده که می توانند برای انتشار ژنتیکی مورد استفاده مجدد قرار گیرند. قطعات توضیح می دهد: “آنها باید نشان دهند که این تازگی به یک روش یا روش دیگر مفید است.”

علاوه بر این ، اگر ژنهای جدید واقعاً با مواردی که قبلاً می شناسیم متفاوت است ، Overmann نمی بیند که چگونه ابزارهای موجود می توانند به راحتی عملکردهای خود را پیش بینی کنند ، یا چگونه می توان از داده ها برای شکل گیری یک مدل جدید استفاده کرد. او می گوید: “شما نمی دانید که اکثر ژن ها چه کاری انجام می دهند.” این شرکت می توانست گنجی از زیست شناسی های جدید را جمع کند ، اما بدون کار آزمایشگاهی قدیمی تر برای درک آنچه در آنجا وجود دارد ، می تواند مرموز باشد ، حتی برای قدرتمندترین هوش مصنوعی.

سوژه ها:


منبع: https://www.newscientist.com/article/2484323-biotech-firm-aims-to-create-chatgpt-of-biology-will-it-work/?utm_campaign=RSS%7CNSNS&utm_source=NSNS&utm_medium=RSS&utm_content=home

توسط احمد گل کار

احمد گل کار