Científicos israelíes hacen «hablar» a las proteínas gracias a la inteligencia artificial

03/Jul/2026

Israel Económico

 

 

Un avance desarrollado por investigadores del Technion y la Universidad de Tel Aviv promete revolucionar la medicina y el diseño de fármacos al traducir secuencias biológicas complejas a lenguaje humano estándar

 

Un equipo de investigadores israelíes desarrolló un sistema de inteligencia artificial (IA) capaz de traducir secuencias de proteínas directamente a descripciones en lenguaje natural, un avance que promete acelerar la comprensión de las funciones biológicas y acortar los tiempos en el diseño de nuevos fármacos y materiales.

 

A través de un artículo publicado en la revista científica PNAS, los investigadores, del Technion y de la Universidad de Tel Aviv, presentaron BetaDescribe, un sistema de IA que traduce secuencias de proteínas en descripciones en lenguaje natural, el que hablamos los humanos.

 

En biología, el orden de los componentes de una proteína (su secuencia) funciona como un alfabeto o un texto en un idioma desconocido. Los científicos israelíes trataron esa secuencia biológica como si fuera una cadena de palabras en «idioma proteína».

 

BetaDescribe actúa como un traductor bilingüe: lee el «idioma» de la secuencia de la proteína y genera un texto en lenguaje natural (español, inglés o cualquier lenguaje humano) explicando qué hace esa proteína.

 

Un elemento clave para la medicina

Voceros de las universidades recordaron que el análisis de proteínas es esencial en medicina y biotecnología, como lo demuestran avances como Ozempic, un fármaco cuyo desarrollo se inspiró en un péptido hallado en la saliva de un lagarto del desierto poco común y que se utiliza para tratar la obesidad, la diabetes y otras afecciones.

 

Sin embargo, la caracterización experimental de proteínas sigue siendo un proceso largo y costoso, e incluso los grandes modelos de lenguaje (LLM, elemento clave en la IA que utilizamos todos los días) vienen teniendo un éxito limitado en esta tarea.

 

Ese desafío inspiró el desarrollo de BetaDescribe, un sistema de IA que convierte secuencias de proteínas en descripciones textuales detalladas de sus funciones y otras características.

 

Una ilustración que muestra cómo un sistema creado en Israel «traduce» la secuencia biológica de las proteínas a lenguaje humano estándar

Así se traduce al inglés el «idioma» de las proteínas (Ilustración: Technion)

La tecnología también proporciona información detallada sobre las propiedades funcionales de una proteína, su actividad catalítica, su participación en procesos metabólicos y los posibles sitios de unión relevantes para aplicaciones médicas y de otro tipo.

 

Un idioma para acelerar la investigación

Según el reporte, los investigadores demostraron la eficacia del nuevo sistema al describir con éxito seis proteínas previamente no caracterizadas.

 

«Se espera que esta tecnología acelere la investigación médica, el descubrimiento de fármacos y los avances en biotecnología y agricultura», apuntaron los portavoces.

 

Es que la capacidad de generar rápidamente hipótesis basadas en evidencia sobre las funciones de proteínas desconocidas podría «acortar significativamente el camino desde el descubrimiento básico hasta las aplicaciones médicas e industriales, haciendo que el análisis biológico sea más preciso y eficiente», completaron.

 

El trabajo publicado en PNAS detalló que el desarrollo de este sistema no arrancó desde cero, sino que los investigadores utilizaron Llama 2 —el modelo de lenguaje de código abierto desarrollado por Meta—. A partir de esa estructura, que ya maneja billones de palabras en idioma humano, el equipo entrenó a la IA con bases de datos combinadas de biología y texto en inglés para que incorporara el conocimiento científico específico.