agosto 1, 2021

Conjunto de datos de estructura de proteínas de código abierto DeepMind generado por AlphaFold 2

Todas las sesiones de Transform 2021 ahora están disponibles bajo demanda. Mira ahora.


DeepMind y el Instituto Europeo de Bioinformática (EMBL), un laboratorio de ciencias de la vida con sede en Hinxton, Inglaterra, anunciaron hoy el lanzamiento de lo que afirman es la base de datos más completa y precisa de estructuras para proteínas expresadas por el genoma humano. En una rueda de prensa conjunta organizada por la revista Naturaleza, las dos organizaciones dijeron que la base de datos, AlphaFold Protein Structure Database, que fue creada usando el sistema AlphaFold 2 de DeepMind, estará disponible para la comunidad científica en las próximas semanas.

La receta de las proteínas (moléculas grandes compuestas de aminoácidos que son los componentes básicos de los tejidos, músculos, cabello, enzimas, anticuerpos y otras partes esenciales de los organismos vivos) está codificada en el ADN. Son estas definiciones genéticas las que circunscriben sus estructuras tridimensionales, que a su vez determinan sus capacidades. Pero el plegamiento de proteínas, como se le llama, es muy difícil de entender a partir de una única secuencia genética coincidente. El ADN solo contiene información sobre las cadenas de residuos de aminoácidos y no sobre la forma final de esas cadenas.

DeepMind AlphaFold base de datos 2

Arriba: una estructura de la proteína de la tuberculosis predicha por AlphaFold 2.

Crédito de la imagen: DeepMind

En diciembre de 2018, DeepMind intentó abordar el desafío del plegamiento de proteínas con AlphaFold, el producto de dos años de trabajo. Su sucesor, AlphaFold 2, anunciado en diciembre de 2020, lo mejoró para superar a los métodos de predicción de plegamiento de proteínas de la competencia. En los resultados de la 14a evaluación CASP (Evaluación crítica de la predicción de estructuras), AlphaFold 2 tuvo errores promedio comparables al ancho de un átomo (o 0,1 nanómetros), competitivo con los resultados de los métodos experimentales.

“La base de datos AlphaFold muestra el potencial de la inteligencia artificial para acelerar profundamente el progreso científico. El sistema de aprendizaje automático de DeepMind no solo ha expandido en gran medida nuestro conocimiento acumulado de las estructuras de las proteínas y el proteoma humano de la noche a la mañana, sino que su profunda comprensión de los componentes básicos de la vida es una tremenda promesa para el futuro del descubrimiento científico «, dijo. Alphabet y Google, en un comunicado de prensa.

Iluminando las estructuras proteicas

AlphaFold 2 se inspira en los campos de la biología, la física y el aprendizaje automático, aprovechando el hecho de que una proteína plegada puede considerarse como un «gráfico espacial» en el que los residuos de aminoácidos (aminoácidos contenidos en un péptido o una proteína) son nudos. y bordes que conectan los residuos en estrecha proximidad. AlphaFold 2 aprovecha un algoritmo de IA que intenta interpretar la estructura de este gráfico mientras piensa en el gráfico implícito que está construyendo, utilizando secuencias relacionadas evolutivamente, alineación de secuencias múltiples y una representación de pares de residuos de aminoácidos.

En una base de código de fuente abierta lanzada la semana pasada, DeepMind simplificó enormemente AlphaFold 2. Si bien el sistema de fuente cerrada tomó días de tiempo de cálculo para generar estructuras, la versión de fuente abierta es aproximadamente 16 veces más rápida y puede producir estructuras. En minutos u horas, dependiendo del tamaño de la proteína.

Estas mejoras permitieron a DeepMind y EMBL crear más de 350.000 predicciones de estructura de proteínas, incluido el proteoma humano (que incluye 20.000 proteínas), más del doble de la cantidad de estructuras de alta precisión disponibles para los investigadores. Además, DeepMind y EMBL utilizaron AlphaFold 2 para predecir las estructuras de otros 20 «organismos biológicamente significativos», produciendo más de 350.000 estructuras en total para E. coli, moscas de la fruta, ratones, pez cebra, levaduras, parásitos de la malaria, bacterias de la tuberculosis y más. . El plan es expandir la cobertura a más de 100 millones de propiedades a medida que se realicen mejoras tanto en AlphaFold 2 como en la base de datos.

DeepMind AlphaFold base de datos 2

Arriba: predicción de AlphaFold 2 de una proteína parásita de la malaria.

Crédito de la imagen: DeepMind

«Este será uno de los conjuntos de datos más importantes del mapeo del genoma humano», dijo el subdirector general del EMBL, Ewan Birney, en un comunicado. “Hacer que las predicciones de AlphaFold 2 sean accesibles para la comunidad científica internacional abre muchas nuevas vías de investigación, desde enfermedades desatendidas hasta nuevas enzimas para la biotecnología y todo lo demás. Esta es una gran herramienta científica nueva, que complementa las tecnologías existentes y nos permitirá ampliar los límites de nuestra comprensión del mundo ”.

Algunos científicos advierten que AlphaFold 2 probablemente no sea la solución definitiva cuando se trata de predecir la estructura de las proteínas. Steven Finkbeiner, profesor de neurología en la Universidad de California en San Francisco, dijo Cableado en una entrevista que es demasiado pronto para contar las implicaciones para el descubrimiento de fármacos, dada la amplia variación en las estructuras dentro del cuerpo humano. Pero DeepMind sostiene que AlphaFold 2, si se perfecciona aún más, podría aplicarse a problemas previamente intratables, incluidos los relacionados con los esfuerzos epidemiológicos. El año pasado, la compañía predijo varias estructuras de proteínas del SARS-CoV-2, incluida la ORF3a, cuya composición anteriormente era un misterio.

Conjunto de datos de proteínas DeepMind

Arriba: una proteína de levadura, nuevamente predicha por AlphaFold 2.

Crédito de la imagen: DeepMind

DeepMind dice que está comprometido a hacer que AlphaFold 2 esté disponible «a gran escala» y trabajar con socios para explorar nuevas fronteras, como cómo múltiples proteínas forman complejos e interactúan con el ADN, el ARN y moléculas pequeñas. A principios de este año, la compañía anunció una asociación con la Iniciativa de Medicamentos para Enfermedades Desatendidas con sede en Ginebra, una organización farmacéutica sin fines de lucro que espera usar AlphaFold para identificar compuestos para tratar afecciones para las cuales los medicamentos siguen siendo difíciles de alcanzar. El Center for Enzyme Innovation está utilizando el sistema para ayudar a diseñar enzimas más rápidas para reciclar plásticos de un solo uso contaminantes. Y equipos de la Universidad de Colorado Boulder y la Universidad de California en San Francisco están estudiando la resistencia a los antibióticos y la biología del SARS-CoV-2 con AlphaFold 2.

“Las proteínas son como máquinas biológicas diminutas y deliciosas. De la misma manera que la estructura de una máquina te dice lo que hace, la estructura de una proteína nos ayuda a entender su función. Las proteínas son como máquinas biológicas diminutas y deliciosas. De la misma manera que la estructura de una máquina te dice lo que hace, la estructura de una proteína nos ayuda a entender su función «, escribió el CEO de DeepMind, Demis Hassabis, en una publicación de blog publicada hoy.» En DeepMind, nuestra tesis siempre ha sido que la inteligencia artificial puede acelerar en gran medida los avances en muchos campos de la ciencia y, a su vez, hacer avanzar a la humanidad. Creamos AlphaFold y la base de datos de estructura de proteínas AlphaFold para respaldar y elevar los esfuerzos de los científicos de todo el mundo en el importante trabajo que realizan. la inteligencia tiene el potencial de revolucionar la forma en que se hace la ciencia en el siglo XXI, y esperamos con interés los descubrimientos que AlphaFold podría ayudar a la comunidad científica a desbloquear en el futuro «.

VentureBeat

La misión de VentureBeat es ser una plaza urbana digital para que los responsables de la toma de decisiones técnicas obtengan información sobre la tecnología y las transacciones transformadoras. Nuestro sitio proporciona información esencial sobre tecnologías y estrategias de datos para guiarlo en el liderazgo de sus organizaciones. Te invitamos a convertirte en miembro de nuestra comunidad, para acceder a:

  • información actualizada sobre temas de su interés
  • nuestros boletines
  • contenido privado líder en el pensamiento y acceso con descuento a nuestros valiosos eventos, como Transformar 2021: Para saber mas
  • funciones de red y más

Hágase miembro

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *