Екип от изследователи на изкуствения интелект, биолози и специалисти по еволюция в EvolutionaryScale и Arc Institute в САЩ е проектирал и изградил модел на изкуствен интелект, който може да генерира кода за синтез на нови протеини. В статията си, публикувана в списание Science, групата описва факторите, които са участвали в разработването на техния нов модел на ИИ, който те наричат ESM3, и как са го използвали за синтезиране на неизвестен досега ярък, флуоресцентен протеин.

Предишни изследвания са показват, че синтезирането на протеини може да осигури уникален поглед върху структурата и функцията на естествените протеини. Досега повечето такива протеини са копия на тези, които се срещат в природата. За това ново изследване изследователите използват модел на изкуствен интелект, за да имитират еволюционния процес на протеин, който никога не е съществувал в природата.

Генерирането на изкуствени белтъци дава възможност за нови пътища за изследвания, както за по-добро разбиране на природата на белтъците и тяхното използване, така и за разработване на нови приложения. Изследователският екип използва данни за съществуващи протеини като основа за генериране на нови протеини.

ESM3 е мултимодален генеративен езиков модел, което означава, че подобно на своите братовчеди чатботове, той се учи посредством огромни количества данни. В този случай мултимодалният генеративен езиков модел е обучен върху 771 милиарда лексеми, генерирани от 3,15 милиарда протеинови последователности, 236 милиона протеинови структури и 539 милиона протеинови анотации.

Според изследователите това е все едно да дадете на модела 500 милиона години еволюционно познание, което му позволява да започне с основен код, който еволюира във виртуалното време до съвременен виртуален протеин. След това виртуалният белтък e превърнат в реален изкуствен белтък с помощта на стандартни техники за синтез на белтъци. Резултатът e белтък с генетична последователност, която се различавала от другите известни белтъци.

Изследователският екип специално поисква от своя модел да генерира нов зелен флуоресцентен протеин - други такива протеини, които флуоресцират под ултравиолетова светлина, често се използват като маркери. Екипът нарича новия протеин esmGFP. Те предполагат, че техният модел и други подобни биха могли да се използват за създаване на нови протеини, които да се използват в медицината, изследванията на околната среда и много други приложения.

Източник: Phys.org