miércoles, 15 de marzo de 2017

Toda biología es biología computacional

"¿Cómo la gente como usted consigue papeles del último-autor?" Un biólogo celular principal me hizo esta pregunta en 2008 durante la entrevista para mi trabajo actual, implicando que nunca podría tomar un papel mayor en proyectos de investigación. Yo había sido entrenado en matemáticas y aprendizaje de máquinas, pero ahora estaba entrevistando para un trabajo de biología computacional en un instituto de investigación del cáncer. Mi entrevistador no estaba muy seguro de cuál podría ser mi contribución a la biología. ¿No son los profesionales de computación simplemente proveedores de servicios? ¿Es práctico tener, pero sin ninguna visión científica real? Ella claramente preocupada por mi capacidad de hacer investigación biológica independiente.
Y no era la última en preocuparse. En 2012, con varios trabajos de último autor a mi nombre, fui candidato para una beca de Investigación Joven de la Organización Europea de Biología Molecular, pero no la obtuve. La retroalimentación proporcionada por el panel de entrevistas llamó a mi grupo una "unidad de servicios matemáticos", afirmó "una falta de comprensión en profundidad de la biología", y denunció "una confianza excesivamente fuerte en los colaboradores".
El año pasado, finalmente vimos cuán bajo puede ser la opinión del trabajo computacional en la comunidad biomédica, cuando el editor en jefe del New England Journal of Medicine usó el término "parásitos de investigación" para describir a los biólogos computacionales Datos [ 1 ].
En los últimos 20 años, los métodos computacionales se han convertido en una parte bien establecida de la biología, pero los ejemplos anteriores muestran que los biólogos y los médicos de la "vieja escuela" -que toman decisiones sobre publicaciones, financiamiento y carreras- siguen incómodos con personas como Yo, que fueron entrenados en otras disciplinas, persiguen preguntas biológicas diferentes a las suyas, y usan enfoques no cubiertos en la mayoría de los entrenamientos biológicos. Si incluso mis colegas en las ciencias de la vida no ven por qué la investigación computacional importa, ¿cómo podrá alguien ver su valor?
En lo que sigue, voy a argumentar que el pensamiento computacional y los métodos computacionales son tan centrales para la búsqueda de la comprensión de la vida que hoy en día toda la biología es la biología computacional.

La biología computacional trae orden a nuestra comprensión de la vida


"La biología se adaptó a la computadora, no la computadora a la biología", escribe Hallam Stevens en Life Out of Sequence [ 2 ], su relato etnográfico e histórico de la biología computacional. "Las computadoras no sólo amplían la vieja biología, sino que traen consigo herramientas y preguntas completamente nuevas, como la estadística, la simulación y la gestión de datos, que modificaron completamente la forma en que se está llevando a cabo la investigación biológica".

Un ejemplo clave de cómo las computadoras reconfiguran la investigación biológica es el uso de bases de datos y ontologías. El conocimiento biológico de hoy se define, organiza y se accede a través de la computación. Si Carl von Linné (también conocido como Carl Linnaeus), el botánico sueco y padre de la taxonomía, vivió hoy, sería un biólogo computacional ( Fig. 1 ).Como botánico, podría asumir un papel de liderazgo en un proyecto como transPLANT ( http://www.transplantdb.eu/ ) para organizar lo que sabemos acerca de los genotipos y fenotipos de cultivos y plantas modelo. O podría trabajar con Gene Ontology Consortium ( http://www.geneontology.org/ ) para crear vocabularios compartidos que unifican el conocimiento biológico a través de los organismos. Al igual que el Systema Naturae de Linné, tales bases de datos son contribuciones intelectuales clave a nuestra comprensión de la vida.Cada otro tipo de investigación biológica se basa en estos fundamentos.

miniatura
Fig. 1. Carl von Linné, botánico sueco y padre de la taxonomía, sería hoy un biólogo computacional.
Crédito de la imagen: Nationalmuseum Stockholm.

La biología computacional le permite ver el panorama general


Otra forma en que las computadoras han reestructurado la biología es mediante la introducción de estadísticas y métodos de análisis de datos. Un buen ejemplo es la comprensión de cómo los procesos mutacionales de forma genomas [ 3 ]. Los procesos mutacionales -ya sea el humo del cigarrillo, la luz solar o los defectos en la recombinación homóloga- no son visibles en las mutaciones individuales sino sólo en sus patrones globales. ¿Con qué frecuencia se convierte un C en un T? ¿Cómo varía esta frecuencia dependiendo de los vecinos de la base mutada? ¿Cuánto de esta frecuencia se explica por otras características del genoma, como el tiempo de replicación? Responder a estas preguntas nos ayuda a entender las propiedades básicas de los procesos mutacionales activos en las células, y sólo es posible mediante técnicas estadísticas que identifican patrones y correlaciones.

Estos tipos de análisis necesitan grandes recopilaciones de datos y, por lo tanto, el éxito de la biología computacional está estrechamente vinculado al éxito de los esfuerzos a gran escala para reunir genotipos y fenotipos de organismos modelo y humanos. Uno de los primeros ejemplos resaltando el poder de los enfoques computacionales fue la secuenciación del genoma humano, que mostró cómo eficientemente la alineación computacional y los métodos de andamiaje fueron capaces de ensamblar los fragmentos de ADN producidos durante la escopeta de secuenciación [ 4 ], y la próxima generación secuenciación técnicas dependen completamente Avances en la biología computacional para analizar grandes cantidades de secuencia corta lee [ 5 ]. La secuenciación del ADN fue una vez un Premio Nobel digno de desarrollo. Ahora, la biología computacional es líder en convertirlo en un enfoque ampliamente disponible y práctico para la biología básica y la investigación médica, que actualmente está revolucionando lo que sabemos sobre los tejidos y las células individuales.

La biología computacional proporciona un atlas de la vida


Mediante la combinación de grandes colecciones de datos con bases de datos y estadísticas, la biología computacional está proporcionando un mapa de referencia para la biología, un atlas de la vida que mantiene unidas las intuiciones individuales. Este mapa no está en el nivel de resolución proporcionado por Google Street View, sino que es un mapa como el utilizado por Columbus, Magellan o Vasco da Gama-intrépidos exploradores en busca de aventura. El mapa proporciona un esquema general, pero muchas áreas son incompletas, y algunas partes importantes podrían incluso faltar y esperar a ser descubiertas. "Aquí hay dragones", simplemente dice. Pero aún con todas estas deficiencias, el mapa sigue siendo una guía indispensable: el atlas de la vida proporcionado por la biología computacional constituye el fondo para planificar, ejecutar e interpretar todos los experimentos enfocados a pequeña escala que investigan las áreas inexploradas y empujan los límites de Conocimiento biológico.

La biología computacional convierte las ideas en hipótesis


Por último, las computadoras reconfiguraron la biología haciendo que los conceptos difusos fueran rigurosos y comprobables. He aquí un ejemplo de mi propia investigación: durante décadas, los investigadores del cáncer han discutido la idea de que la heterogeneidad genética entre las células en el mismo tumor ayuda a hacer un cáncer resistente a la terapia [ 6 ]. Es una idea simple: cuanto más diversa sea la población de células, más probable es que un subconjunto de células sea resistente a la terapia y pueda regenerar el tumor después de que todas las otras células hayan muerto.

Pero, ¿cómo exactamente se puede medir la "heterogeneidad genética" y cuán grande es su influencia en el desarrollo de la resistencia? Para responder a estas preguntas, tuvimos que convertir la idea en una hipótesis comprobable. Se utilizaron enfoques genómicos para medir los cambios en el genoma del cáncer en diferentes sitios en un paciente y luego se definieron las medidas cuantitativas de la heterogeneidad, que podría ser comparado estadísticamente con la información clínica sobre la resistencia al tratamiento. Y de hecho, encontramos pruebas que apoyan la idea inicial de que la heterogeneidad determina la resistencia [ 7 ].

Este es sólo uno de muchos ejemplos en los que un enfoque cuantitativo computacional era necesario para convertir una idea difusa en una hipótesis comprobable. La biología computacional sobresale en la destilación de enormes cantidades de datos complejos en algo comprobable en el laboratorio húmedo, con lo que se configura y se dirige el seguimiento experimental.

Descansa en paz, biología computacional


Pipette biólogo. Biólogo de microscopía. Biólogo de cultivo celular. ¿Alguna vez has escuchado alguno de esos títulos de trabajo? No claro que no. Todos son biólogos, porque son las preguntas que abordas que importan, no las herramientas que usas, y los biólogos computacionales son sólo biólogos que usan una herramienta diferente.

La siguiente síntesis moderna en biología será impulsada por la absorción de métodos matemáticos, estadísticos y computacionales en el entrenamiento biológico convencional. Se verá más y más como la formación en física y combinar la enseñanza de técnicas experimentales con la teoría matemática y análisis de datos. Y entonces, incluso los biólogos de la "vieja escuela" verán a los biólogos computacionales como uno de los suyos.


Referencias

  1. 1.Longo DL y Drazen JM, Compartición de Datos Editoriales, N Engl J Med 2016; 374: 276 - 277 doi: 10.1056 / NEJMe1516564. Pmid: 26789876
  2. 2.Stevens Hallam, Life Out of Sequence: Una historia controlada por datos de la bioinformática, The University of Chicago Press; 2013