Grandes avances en la biología

La estructura tridimensional del ADN, determinada el año en que nací, 1953 [ 1 ], ha tenido un profundo impacto en la ciencia y, de hecho, en mi propia vida profesional. Resolver la estructura del ADN sentó las bases de gran parte de lo que ha seguido en la biología molecular, la evolución, la genómica, la base genética de la enfermedad y muchos otros campos. La doble hélice es un icono para la ciencia y su progreso, al igual que una manzana con una mordida de ella representa los avances en las computadoras y ese pequeño pájaro tweeting para el surgimiento de las redes sociales.
La doble hélice es la forma exquisita de la naturaleza de codificar la información biológica: arreglos alternativos de fosfatos y azúcares unidos covalentemente en una hélice diestra. Cada unidad de fosfato y un azúcar de cinco carbonos (desoxirribosa) forman un nucleótido. Añadir una de las cuatro bases nitrogenadas: adenina (A), citosina (C), guanina (G) y timina (T), y puede construir, como hicieron Watson y Crick en 1953, dos hebras complementarias que codifican el modelo genético de Vida como una serie de cuatro letras. Para los humanos, eso es 3.000.000.000 de letras en total, dispuestas en 23 cromosomas. La molécula de ADN personifica la naturaleza tridimensional de la vida, y es esa característica, que me ha intrigado toda mi carrera.
La diversión comienza cuando se considera que las estructuras químicas tridimensionales pueden determinarse aplicando experimentalmente las leyes de la física y las herramientas computacionales. Los Braggs, padre e hijo, mostraron en 1913 que los sólidos cristalinos producían patrones de rayos X difractados. Los patrones fluyen desde las dimensiones de la retícula cristalina repetitiva. El descubrimiento de que la intensidad de los puntos de difracción resultante es una función de la posición de los átomos -más específicamente, sus nubes de electrones- afirmó la naturaleza atómica de la materia, pero también dio a luz el campo de la cristalografía de rayos X.
Muchos años más tarde, en 1975, empecé mi carrera de postgrado en Adelaida, Australia, donde se había llevado a cabo el trabajo pionero de Braggs. Utilizando la técnica de cristalografía de rayos X, determiné las estructuras de los componentes del ADN unidos a moléculas pequeñas, en particular, los fármacos cis-platino y sus variantes. El objetivo era determinar el modo de vinculación y determinar si se podían encontrar fármacos más potentes y menos tóxicos. Cisplatino, el más simple de esta clase de compuestos, fue aprobado por la Food and Drug Administration en 1978 y todavía está en uso hoy en día [ 4 ]. El cisplatino ataca a los tumores uniendo las cadenas de ADN para interrumpir la replicación celular.Desafortunadamente, también afecta a las células normales, dando lugar a efectos secundarios indeseables. No obstante, establece el papel que juegan las estructuras tridimensionales en las primeras etapas del proceso de descubrimiento de fármacos. Que algunos aspectos de la eficacia de una droga se reducen a las interacciones sutiles de los átomos individuales es notable, y vamos a revisar esto a continuación después de 30 años de perspicacia adicional.
Escribir y ejecutar programas de computadora que definían las posiciones de los átomos en la materia era tan genial, que estaba enganchado. Sin el beneficio de las pantallas gráficas por ordenador que existen hoy en día, las posiciones atómicas fueron dibujadas a partir de hojas de plexiglás como contornos: al igual que en los mapas de relieve geográficos, la cercanía de contornos representaba una empinada colina y pico, pero aquí identificaron picos de electrones Densidad-la posición de los átomos. La emoción de trazar estructuras atómicas que nadie había visto antes permanece conmigo hasta el día de hoy.
A medida que avanzaban las técnicas, los ordenadores y la instrumentación, también aumentaba el tamaño y el número de estructuras moleculares determinadas. Como becario postdoctoral en Sheffield, Reino Unido, a finales de los años setenta, pasé la mano de unas pocas docenas de átomos a miles. Trabajando en la ferritina de almacenamiento de hierro, se determinó que la ferritina estaba compuesta de 24 cadenas de proteínas individuales dispuestos en perfecta simetría para formar una molécula esférica capaz de almacenar 4.500 hierro iones [ 5 ]. Sólo había alrededor de 80 estructuras de proteínas en el momento, varias de las cuales habían llevado a premios Nobel porque, como la ferritina, ayudaron a iluminar la función biológica y, de hecho, el mal funcionamiento. La estructura de ferritina aumentó nuestra comprensión del metabolismo del hierro y estados de enfermedad directamente asociados como la neuroferritinopatía, un trastorno neurodegenerativo asociado con una mutación en la cadena ligera de ferritina. Un cambio de una sola letra en el ADN del gen de la ferritina conduce a un cambio significativo en la estructura proteica resultante. Un cambio lo suficientemente profundo como para afectar la captación de hierro. Un resultado de la deposición de hierro y ferritina en el cerebro es un trastorno del movimiento, que ahora se puede diagnosticar con pruebas genéticas. Medir los niveles de ferritina sérica es ahora una prueba de diagnóstico estándar para una variedad de enfermedades que involucran deficiencia de hierro.
Unos años más tarde, en la Universidad de Columbia en Nueva York, justo cuando salían puestos de trabajo y computadoras personales, mi equipo de ingeniería se hizo cargo y me interesé en la construcción de hardware y software utilizando estas nuevas herramientas. Allí, probablemente habría permanecido si no fuera por una nueva iniciativa audaz: el proyecto del genoma humano. Hasta entonces, aquellos de nosotros que usamos computadoras para resolver problemas biológicos eran, para decirlo cortésmente, valores atípicos. De repente, éramos una parte integral del proceso de descubrimiento, contribuyentes vitales tanto al montaje del genoma como a la gestión de la gran cantidad de datos digitales resultantes del proyecto. Era 1995, nos llamaban bioinformáticos, y pude ver lo que venía: la biomedicina como ciencia computacional.
Combinando mis habilidades computacionales adquiridas con mis habilidades de biología estructural, empecé a hacer preguntas utilizando el corpus completo de información estructural, para entonces, en 3.800 estructuras y creciendo rápidamente. Para analizar los datos, necesitábamos bases de datos para un acceso rápido y organizado y una descripción consistente de los datos para el análisis comparativo. El trabajo en esta área finalmente llevó a un grupo de nosotros que mantiene el Protein Data Bank (PDB), un repositorio mundial de información sobre estructuras biológicas [ 6 ]. Fue inmensamente gratificante ayudar a proporcionar un recurso que fue utilizado por muchos miles de investigadores cada mes.Irónicamente, los desarrolladores de bases de datos, los biocuradores y otros responsables del intercambio de datos en la comunidad siguen siendo los héroes no reconocidos de la biología, ya que siguen siendo infravalorados en el sistema académico. La Academia todavía tiene que apreciar completamente la era digital, pero eso es otra historia. Esta historia trata sobre un camino de carrera alegre y sinuoso y la ciencia que, con suerte, eventualmente sería valiosa para el público. Esa investigación fue en muchas direcciones, pero mucho fue impulsado por lo que se podría hacer con el AP. Aquí, me centraré en dos aspectos muy diferentes de esa investigación -evolución y descubrimiento de fármacos- y lo que nuestro laboratorio contribuyó.
Quizás mi hecho favorito en toda biología es que las proteínas, transcritas y traducidas a partir del ADN, consisten en 20 aminoácidos enlazados juntos en una cadena polipeptídica.Suponiendo una longitud de cadena media de 300 aminoácidos, esto conduce a 20 300posibilidades, más que todos los átomos en el universo. Sin embargo, a nuestro conocimiento, al menos de acuerdo con RefSeq [ 7 ], una base de datos de las secuencias de referencia de proteínas, sólo hemos descubierto 79 millones de proteínas hasta la fecha. Hay, sin duda, muchos para ser descubierto, pero sin embargo, será un número muy pequeño en comparación con lo que es posible. Aún más asombroso es que estas 79 millones de cadenas unidimensionales se pliegan en aproximadamente 1.000 pliegues tridimensionales de proteínas únicas [ 8 ]. Por increíble que sea, toda la vida está compuesta por 1.000 piezas tridimensionales de rompecabezas reunidas en una multitud de maneras: el reduccionismo de la naturaleza. ¿Cómo podemos utilizar este hecho para estudiar la evolución? Se sigue que con tan pocos pliegues, la invención de un nuevo pliegue durante la evolución, o la frecuencia con la que se usa un pliegue, es un evento importante. Estudiando estos eventos, previamente hechos con secuencias de ADN y proteínas, hemos determinado cómo la cambiante geoquímica de la Tierra, tal como se refleja en nuevos pliegues de proteínas, y cómo el cambio en el uso de esos pliegues afectó el desarrollo de la vida. ]. Mirando hacia el futuro, no sólo tenemos una herramienta para entender el impacto del medio ambiente en la vida, sino que también podemos diseñar proteínas que la naturaleza todavía tiene que descubrir o descubrir y luego descartar. Esta investigación tiene muchas implicaciones, por ejemplo, comprender el cambio climático, aumentar la producción de alimentos y aumentar la producción de energía a partir de biocombustibles.
Considere un aspecto completamente diferente de la vida en tres dimensiones: descubrimiento de fármacos. Una visión simplista de la acción del fármaco es encontrar una pequeña molécula -como el cisplatino, que hemos conocido antes- y obligarla a un objetivo de proteína, ADN o ARN, modificando de este modo su acción y teniendo un efecto deletéreo sobre una enfermedad . Si sólo fuera así de simple. Los efectos secundarios de los fármacos surgen por una serie de razones, una importante es que los fármacos no se unen a un solo objetivo sino a múltiples objetivos con afinidad variable. Lo que en realidad estamos experimentando es un efecto colectivo, un efecto sobre el sistema completo. Para añadir a la complejidad, cada uno de nosotros experimenta un efecto colectivo diferente, dados nuestros estados genéticos, fisiológicos y ambientales específicos.
La comprensión de este sistema humano complejo y el diseño de fármacos que conducen a mejores resultados de salud se conoce como sistemas de farmacología [ 10 ], y estamos haciendo progresos. Comienza con una comprensión de la naturaleza tridimensional de cómo las drogas se unen a sus objetivos a escala. El espacio químico tridimensional ocupado por las drogas y los objetivos biológicos es enorme, pero las 80 estructuras de proteínas que teníamos en 1980 han crecido hasta aproximadamente 125.000 y es posible comparar algorítmicamente la similitud de los bolsillos de unión a través de este conjunto completo de proteínas. Sabemos cada vez más con qué otras moléculas interactúan estas proteínas, qué vías bioquímicas pueden encontrarse y mucho más. Poniendo esto junto, podemos comenzar a hacer predicciones computacionales sobre la eficacia de un compuesto dado, que puede informar a la prueba experimental. La promesa es acelerar el proceso de descubrimiento de fármacos y facilitar la medicina personalizada, donde la dosis y el tipo de fármaco se ajustan a nuestro perfil genético y físico específico.

Este breve recorrido de la carrera de investigación de una persona abarca 40 años, comenzando con moléculas tridimensionales simples y terminando con los comienzos de entender la salud humana como un sistema computable. Qué privilegio ha sido aportar una pequeña parte a este progreso. Mientras escuchamos de los grandes avances en la ciencia, es importante recordar que esos descubrimientos, y los muchos hallazgos más pequeños, son los esfuerzos acumulados de muchos científicos que comparten abiertamente su trabajo.Colectivamente, esto afecta positivamente todos los aspectos de nuestras vidas. ¿Quieres prueba? Durante mis días en la Tierra, la esperanza de vida en todo el mundo ha aumentado de 47 a 73 años de edad [ 11 ]. Si eso no es éxito, no sé qué es.