
Pekerjaan Google DeepMind dengan Alphafold tidak ada ajaib, tetapi itu mahal secara komputasi. Dengan mengingat hal itu, para peneliti Apple berangkat untuk mengembangkan metode alternatif untuk menggunakan AI untuk memprediksi struktur 3D protein, dan itu menunjukkan janji. Inilah detailnya.
Jika Anda tidak terbiasa Alphafoldini adalah model AI inovatif Google DeepMind yang dapat memprediksi struktur 3D protein dari urutan asam amino. Ini sangat berharga dalam membantu mengembangkan obat yang lebih efektif, serta bahan yang sama sekali baru.
Sampai beberapa tahun yang lalu, ini dulunya merupakan masalah yang sangat sulit. Memprediksi struktur atom tiga dimensi dari protein tunggal bisa memakan waktu berbulan-bulan, dan bahkan bertahun-tahun.
Tetapi berkat Alphafold, dan sekarang AlphAfold2, serta model canggih lainnya seperti Rosettafold, dan Esmfold, proses prediksi ini membutuhkan waktu sesedikit beberapa jam, atau bahkan beberapa menit, tergantung pada perangkat keras.
Masing -masing model ini menggunakan metode dan kerangka kerja sendiri untuk mencapai akurasi tinggi, tetapi secara umum, mereka membutuhkan perhitungan yang sangat mahal, dan kerangka kerja mereka memiliki struktur yang sangat ketat.
Seperti yang dikatakan oleh para peneliti Apple:
“Model lipatan protein yang mapan seperti Alphafold2 dan Rosettafold telah mencapai akurasi inovatif dengan mengandalkan arsitektur yang direkayasa dengan cermat yang mengintegrasikan desain khusus domain yang berat secara komputasi untuk tugas-tugas pelipatan protein seperti pemahaman yang sulit, dan pemahaman yang sulit, dan tria, dan tria, dan tria, dan tria, dan tria. Proses pembuatan struktur yang mendasari ke dalam model -model ini, alih -alih memilih untuk membiarkan model mempelajari hal ini secara langsung dari data, yang dapat bermanfaat karena berbagai alasan. “
Masukkan lipat sederhana Apple
Di dalamnya model yang diusulkanalih-alih mengandalkan “MSA, peta interaksi berpasangan, pembaruan segitiga atau modul geometris setara lainnya,” Apple mengandalkan apa yang disebut model pencocokan aliran, yang diperkenalkan pada tahun 2023 dan telah terbukti sangat populer untuk model teks-ke-gambar dan teks-ke-3D.
Singkatnya, model pencocokan aliran adalah evolusi model difusi yang kami bahas dalam posting ini. Tetapi alih -alih hanya menghilangkan noise dari gambar awal, mereka belajar jalur yang lebih halus yang mengubah noise acak langsung menjadi gambar yang sudah jadi dalam sekali jalan.
Dan karena metode ini melewatkan banyak langkah denoising, itu kurang mahal secara komputasi, dan menghasilkan hasil lebih cepat.

Para peneliti Apple melatih lipat sederhana di berbagai ukuran yang berbeda, termasuk parameter 100m, 360m, 700m, 1.1b, 1.6b, dan 3b, dan mengevaluasinya pada “dua tolok ukur prediksi struktur protein yang diadopsi secara luas: Cameo22 dan Casp14, yang merupakan uji yang ketat untuk generalisasi, ketahanan, dan akurat level atom-level.
Hasilnya sangat menjanjikan:
“Terlepas dari kesederhanaannya, Simplefold mencapai kinerja kompetitif dibandingkan dengan dasar-dasar ini. Dalam kedua tolok ukur, Simplefold menunjukkan kinerja yang lebih baik secara konsisten daripada ESMFLOW yang juga merupakan model pencocokan aliran yang dibangun dengan ESM Embeddings. Pada cameo22, Simplefold dari hasil yang sebanding dengan model lipat terbaik (EG, ESMFOLD, ROSEttafold2, dan Alphafold2). Rosettafold2/Alphafold2 pada sebagian besar metrik tanpa menerapkan perhatian segitiga yang mahal dan heuristik dan MSA. ”
Dan
“Untuk kelengkapan, kami melaporkan hasil Simplefold menggunakan berbagai ukuran model. Model terkecil Simplefold-100m menunjukkan kinerja kompetitif mengingat efisiensi dalam pelatihan dan inferensi. Secara khusus, Simplefold mencapai lebih dari 90% kinerja Esmfold pada Cameo22, yang menunjukkan efektivitas model lipat menggunakan blok arsitektur tujuan umum.

Mereka juga melihat peningkatan kinerja yang selaras dengan penskalaan, yang berarti bahwa model yang lebih besar dengan lebih banyak data pelatihan dengan andal memberikan kinerja lipat yang lebih baik, terutama pada tolok ukur yang paling menantang.
Akhirnya, mereka mencatat bahwa Simplefold hanyalah langkah pertama, dan mengatakan bahwa mereka “berharap (itu) berfungsi sebagai inisiatif bagi masyarakat untuk membangun model generatif protein yang efisien dan kuat.”
Anda dapat membaca Studi lengkap tentang arxiv.