Protein yapısını tahmin etmek artık biraz daha ‘kolay’

semaver

New member
Proteinlerin yapısını tahmin etmek son derece karmaşık bir iştir ancak bilimsel düzeyde çok önemlidir. Bu bilgi, diğer şeylerin yanı sıra, bu moleküllerin biyolojik süreçlerdeki işlevini ve rolünü anlamaya olanak tanır; organizmaların evrimini inceleyin veya daha etkili ilaçlar geliştirin. Bu perşembe günü Meta şirketi (eski adıyla Facebook), Google’ın DeepMind’i tarafından geliştirilen AlphaFold gibi diğer benzer algoritmalardan 60 kat daha hızlı proteinlerin yapısını tahmin edebilen EMSFold adlı yeni bir yazılım hakkında ‘Science’ dergisinde bir çalışma yayınladı. şirketi ve Avrupa Biyoinformatik Enstitüsü ile aynı çözünürlük ve hassasiyeti koruyor.


İnsan vücudunun yaklaşık 20.000 farklı protein içerdiği tahmin edilmektedir. Proteinler, belirli bir üç boyutlu yapı oluşturmak üzere birbirleriyle etkileşime giren uzun amino asit zincirlerinden (organik moleküller) oluşur. Bir proteinin, amino asitler arasındaki etkileşime bağlı olarak benimseyebileceği birçok olası üç boyutlu yapı vardır ve bu moleküllerin dizisindeki küçük değişiklikler bile, proteinin son yapısında büyük farklılıklara yol açabilir. Ayrıca hücresel ortam da bu süreci etkiler. Bütün bunlar, bir proteinin son şeklinin ne olacağını doğru bir şekilde tahmin etmeyi çok zorlaştırıyor.

Meta tarafından sunulan üçüncü versiyon olan yeni model, yaklaşık 617 milyon protein yapısına ilişkin tahminler içeriyor. Bunların 225 milyondan fazlası yüksek derecede güvenilirliğe sahip tahminlerdir. «Sonuçların kalitesi yeterince ikna edici. Derin sinir ağlarına (AlphaFold ve RoseTTAFold) dayanan önceki önerilerle ilk fark, yeni modellerin hesaplanmasının çok daha kolay ve çok daha hızlı olmasıdır (bir ila iki büyüklük mertebesinde)”, diye ifade etti Katalanca profesörü Alfonso Valencia Bilim Medya Merkezi (SMC) tarafından toplanan açıklamalarda, Araştırma ve İleri Araştırmalar Enstitüsü (ICREA) ve Barselona Ulusal Süper Bilgisayar Merkezi’nde (BSC) Yaşam Bilimleri direktörü.


Şirketler arası rekabet



EMSFold’un tahminleri, Dünya üzerindeki en az anlaşılan bazı proteinlerin yapılarını (%10’dan fazla) içeriyor. Valencia, “Bu, yeni metodolojiyi, önceki yöntemlerin kapsamı dışında olan ve biyotıp uygulamaları üzerinde doğrudan etkisi olan nokta mutasyonlarının sonuçlarını tahmin etmek için doğrudan uygulanabilir hale getiriyor” diyor. Benzer şekilde yazarlar, canlı organizmalarda doğal olarak üretilen proteinlerde bulunmayan özelliklere sahip olacak şekilde laboratuvarda değiştirilen ve biyoteknoloji ve biyotıp alanında çok ilginç uygulamalara sahip olan doğal olmayan proteinlerin yapısını tahmin etmek için EMSFold’u kullandılar.

Bu yapıları belirlemek için EMSFold, dil modellerine, yani büyük doğal dil verisi kümelerini analiz etmek ve bir kelime dizisinin olasılığını tahmin etmek için kullanılan istatistiksel yöntemlere güvenmiştir. Valencia, “Prensip, halihazırda popüler olan ChatGPT ile aynıdır; bu durumda, insan dilinin karakterleri yerine proteinleri oluşturan amino asit zincirlerine (20 harfli kod) uygulanır” diye açıklıyor.

Profesör şunu ekliyor: “Büyük teknoloji şirketlerinin tüm bu çabaları azınlıkta ve teorik olarak kabul edilen bir konuya yatırması çok şaşırtıcı. Bunun Meta ve Google/DeepMind arasındaki bir rekabet olduğunu düşünmek kolaydır. Bu anlamda her iki firmanın da yazılım geliştirmiş olması ve sonuçların açık bir şekilde ulaşılabilir olması ilginçtir ki bu, bu firmalarda pek yaygın olmayan bir durumdur. Bir başka olası neden de protein yapısı tahmininin, metin tabanlı dil modellerinin tahminlerini geliştirmek için en yararlı referans olmasıdır.