viernes, 29 de septiembre de 2017

El control de los genes

Rendimiento del ADN.
Crédito: © k_e_n / Fotolia
Investigación en la Universidad de York ha revelado que los genes están controlados por "nano balones de fútbol" - estructuras que parecen balones de fútbol, ​​pero 10 millones de veces más pequeño que la pelota promedio.
Mediante la colocación de pequeñas sondas incandescentes en los factores de transcripción - químicos especiales dentro de las células que controlan si un gen se activa o no, los investigadores obtuvieron una nueva e interesante visión de cómo se controlan los genes.
Fundamentalmente, descubrieron que los factores de transcripción no funcionan como moléculas individuales como se pensaba anteriormente, sino como un fósforo esférico tipo fútbol de alrededor de siete a diez moléculas de aproximadamente 30 nanómetros de diámetro.
El descubrimiento de estos nano balones no sólo ayudará a los investigadores a entender más acerca de las formas básicas en que funcionan los genes, sino que también puede proporcionar importantes conocimientos sobre los problemas de salud humana asociados con una gama de diferentes trastornos genéticos, incluido el cáncer.
La investigación, apoyada por el Consejo de Investigación en Biotecnología y Ciencias Biológicas (BBSRC) y publicada en eLife, fue llevada a cabo por científicos de la Universidad de York y la Universidad de Gotemburgo y la Universidad de Tecnología de Chalmers, Suecia.
Los investigadores emplearon microscopía de super resolución avanzada para ver los nano balones en tiempo real, utilizando el mismo tipo de células de levadura utilizadas en la cocción y elaboración de cerveza.
El profesor Mark Leake, Presidente de Física Biológica de la Universidad de York, quien dirigió el trabajo, dijo: "Nuestra capacidad de ver dentro de las células vivas, una molécula a la vez, es simplemente impresionante.
"No teníamos ni idea de que descubriéramos que los factores de transcripción operaban de esta manera agrupada." Todos los libros de texto sugirieron que se usaron moléculas únicas para activar y desactivar los genes, no estos locos balones nanos que observamos ".
El equipo cree que el proceso de agrupación se debe a una estrategia ingeniosa de la célula para permitir que los factores de transcripción para llegar a sus genes objetivo lo más rápido posible.
El profesor Leake dijo: "Nos dimos cuenta de que el tamaño de estos nano balones es un partido muy cerca de las lagunas entre el ADN cuando está arrugado dentro de una célula.Como el ADN dentro de un núcleo es realmente exprimido, se obtienen pequeñas diferencias entre separar hebras de ADN que son como la malla en una red de pesca.El tamaño de esta malla es realmente cerca del tamaño de los balones nano que vemos.
"Esto significa que los nano balones pueden rodar a lo largo de segmentos de ADN, pero luego saltar a otro segmento cercano.Esto permite al nano fútbol para encontrar el gen específico que controla mucho más rápidamente que si no nano hopping era posible.En otras palabras, las células pueden responder tan pronto como sea posible a las señales del exterior, que es una enorme ventaja en la lucha por la supervivencia ".
Los genes están hechos de ADN, la llamada molécula de la vida. Desde el descubrimiento de que el ADN tiene una forma de doble hélice, hecha en los años 50 por los investigadores pioneros de la biofísica, se ha aprendido mucho acerca de los factores de transcripción que pueden controlar si un gen se activa o no.
Si un gen se activa, la maquinaria molecular especializada en la célula lee su código genético y lo convierte en una molécula de proteína única. Miles de diferentes tipos de moléculas de proteínas pueden ser hechas, y cuando interactúan que pueden impulsar el edificio de todos de las notables estructuras encontradas dentro de las células vivas.
El proceso de controlar qué genes se activan o desactivan en cualquier punto del tiempo es fundamental para toda la vida. Cuando va mal, esto puede conducir a graves problemas de salud. En particular, la conmutación disfuncional de los genes puede dar lugar a células que crecen y se dividen de manera incontrolable, lo que en última instancia, puede conducir al cáncer.
Esta nueva investigación puede ayudar a proporcionar una visión de los problemas de salud humana asociados con una gama de diferentes trastornos genéticos. Las próximas etapas serán extender esta investigación a tipos más complicados de células que la levadura - y finalmente a las células humanas.
Fuente de la historia:
Materiales suministrados por la Universidad de York . Nota: El contenido puede ser editado para el estilo y la longitud.

jueves, 28 de septiembre de 2017

La replicacion del ADN y el envejecimiento

Cuando trato de explicar temas puntuales y complejos científicos siempre me encuentro con el mismo problema. ¿Qué nivel debo dar? Lo que está claro es que no es un tema baladí, puesto que los temas, como la audiencia, son muy variados. Algún compañero me aconsejó con su mejor intención, “no te compliques la vida, JAL, y explica en un nivel intermedio”. Error, respondo yo. Con ese nivel, los que se queden por debajo no entenderán, y los perderé. Los que estén por encima, se aburrirán, y los perderé. Por ello, acertadamente o no, prefiero la divulgación en diente de sierra, es decir, un tema quedará algo espeso –pido disculpas por ello-, y otro, bastante más light. Sea como fuere, recurrir a comparaciones, a algún símil o casi parábolas mesiánicas para explicar ciertos conceptos complejos, está dejando de ser la excepción…
Creo que fue la hijita pequeña del Premio Nobel de Medicina de 1978, Werner Arber, quien, para explicar lo que hacía su papi, esto es, descubrir unas enzimas que cortan específicamente el ADN -las enzimas de restricción- recurría a un cuento donde un sastre, su papá, cortaba la tela, el ADN, con unas tijeras muy bonitas, las enzimas… Pues bien, otro genio, Alexei Olovnikov, recurrió a una estación de tren, para hablarnos de replicación del ADN y envejecimiento. Esta es su historia según la narra Cayetano von Kobbe, investigador del CSIC.
Nos encontramos en el otoño de 1966, en una estación de metro de Moscú. El investigador de la antigua Unión soviética, Alexei Olovnikov está dándole vueltas a la charla que acaba de escuchar sobre el “límite de Hayflick”, que describe la capacidad finita para dividirse de las células humanas en cultivo (unas 50-70 divisiones, según el tipo de célula). Llegado a este límite, la célula deja de dividirse, proceso denominado senescencia celular.
Pero la mente de Alexei pensó también en el mecanismo molecular; la replicación del ADN, el cual se copia a sí mismo, replica, cada vez que la célula se divide, proceso que llevan a cabo unas proteínas denominadas polimerasas. De pronto el tren entra en la estación, y Alexei se imagina que los raíles son el ADN y los vagones, la polimerasa… Envuelto en el ruido del momento, su mente ordena las piezas del puzle. El límite de Hayflick para la división celular, la replicación y los famosos telómeros, esos capuchones que protegen el final de los cromosomas.
Imagina una vía de 100 metros de largo, y un tren de 10 metros de largo, con 2 vagones (vagón delantero y el trasero). Al vagón trasero se le encarga hacer una foto de cada metro de la vía por la que pasa. El tren comienza a avanzar y el vagón trasero va haciendo sus fotos. Cuando el vagón delantero llega al final de la vía, se para. En ese momento el trabajo de hacer fotos finaliza, pero el vagón trasero sólo ha podido hacer 90 fotos, equivalente a 90 metros, y no las 100 correspondientes a la vía entera, dado que el propio tren ocupa una zona “muerta” de 10 metros. Si cambiamos el trabajo de hacer una foto por el de hacer una copia real del ADN, con una polimerasa en lugar de una cámara, llegaremos a la misma conclusión. Este es el problema del final de la replicación, ya que el ADN de nuestros cromosomas es lineal. ¿Y qué hay al final de los cromosomas? Los telómeros, como digo, estructuras complejas, que cuidan de los extremos cromosómicos.
Esto es lo que imaginó Alexei, y que, trasladado a nuestras células, significa que en cada división celular una parte del final de nuestros cromosomas, los telómeros, se va acortando. El límite de Hayflick tenía una explicación molecular, “demasiado acortamiento cromosómico debe ser la causa de la senescencia celular, se decía a sí mismo Alexei. A partir de ese momento se inició una apasionante carrera para explicar los mecanismos implicados en el envejecimiento celular y, ya puestos del organismo; de nosotros.
Es curioso, qué en esa misma época, el eminente científico norteamericano James Watson, pensara en el mismo problema, un año después, aunque su fuente de inspiración fueran los bacteriófagos en vez de un tren. La visión de Alexei Olevnikoz en aquella estación de metro de Moscú le sirvió para convertirse en el científico que solucionó el problema del final de la replicación y principio del envejecimiento, al menos, en su parte molecular.

La hormona que podría estar haciendo su perro agresivo descubierto

¿Por qué algunos perros se vuelven agresivos?
Crédito: © Kseniia / Fotolia
Para algunos dueños de perros, un paseo tranquilo puede resultar estresante en el momento en que su compañero canino ve a otro cachorro caminando. Los perros con lo que se conoce como "agresión de correa" pueden ladrar, gruñir o lanzarse a otros perros durante las caminatas, estableciendo la escena para una interacción tensa y potencialmente peligrosa.
Entonces, ¿por qué algunos perros atacan en la correa, mientras que otros no? Las hormonas pueden ser en parte culpables, según una nueva investigación dirigida por Evan MacLean de la Universidad de Arizona.
Aunque una serie de estudios han examinado el papel de la testosterona y la serotonina en la agresión en perros y otros mamíferos, esas hormonas pueden ser sólo una parte de la historia, de acuerdo con los resultados de MacLean, que se publican en un número especial de la revista Frontiers in Psychology .
MacLean y sus colaboradores miraron específicamente la ocitocina y la vasopresina - hormonas que también se encuentran en los seres humanos - y encontraron que pueden desempeñar un papel importante en la formación del comportamiento social de los perros.
Una mejor comprensión de la biología detrás de la agresión canina podría ayudar con el desarrollo de las intervenciones, dijo MacLean, profesor asistente de antropología y director del Centro de Cognición Canina de Arizona en la Escuela de Antropología de la UA.
"La agresión de los perros es un problema enorme: miles de personas son hospitalizadas cada año por mordeduras de perros, especialmente niños, y la agresión es una de las principales razones por las que los perros son renunciados a los refugios", dijo MacLean. "Si hay formas de intervenir y afectar los procesos biológicos que producen agresión, eso podría tener un enorme beneficio tanto para las personas como para los perros".
MacLean estaba interesado en la oxitocina y la vasopresina, algunas veces pensadas como hormonas "yin y yang", debido a la creciente investigación sobre su papel en la biología del comportamiento social.
La ocitocina, que es importante en el parto y la lactancia, a veces se llama la "hormona del amor", ya que sus niveles en los seres humanos se ha demostrado que aumentan cuando abrazamos o besar a un ser querido. La vasopresina es una hormona estrechamente relacionada involucrada en la retención de agua en el cuerpo. En contraste con la oxitocina, se ha relacionado con la agresión en humanos, con investigaciones previas que sugieren que las personas con problemas de agresión crónica tienen altos niveles de vasopresina.
Para el estudio actual, MacLean y sus colaboradores reclutaron perros de diferentes edades, razas y sexos, cuyos dueños informaron luchas con agresión de correa. Para cada perro agresivo reclutado, los investigadores encontraron un perro no agresivo del mismo sexo, edad y raza para servir como una comparación.
Durante el experimento, cada perro fue sostenido en una correa por su dueño. Al otro lado de la sala, un experimentador tocó el audio de un perro ladrando detrás de una cortina, antes de retirar la cortina para revelar un modelo de perro realista con un manipulador humano.
Los perros en el estudio se presentaron de la misma manera con ruidos cotidianos y tres objetos comunes: una caja de cartón, una bolsa de basura y una bola de yoga inflada.
Las respuestas de los perros y los niveles hormonales se midieron antes y después de la interacción.
Mientras que ninguno de los perros en el estudio reaccionó agresivamente hacia la caja, la bolsa o la bola, muchos de los perros en el grupo de la agresión de la correa tenían respuestas agresivas al perro modelo, incluyendo ladrar, gruñir y lunging.
Los perros que reaccionaron agresivamente mostraron niveles más altos de vasopresina total en sus sistemas, sugiriendo un vínculo entre la vasopresina y la agresión.
Los investigadores no observaron diferencias en los niveles de oxitocina entre los dos grupos de perros. Sin embargo, cuando compararon los niveles de oxitocina de los perros de mascota en el estudio con un grupo de perros de asistencia, que fueron específicamente criados para tener temperamentos no agresivos, encontraron que los perros de asistencia tenían niveles más altos de oxitocina y una mayor cantidad de oxitocina- vasopresina. Esto apoya la idea de que la oxitocina puede ayudar a inhibir la agresión en los perros.
"Ver altos niveles de oxitocina en perros de asistencia es totalmente coherente con su fenotipo de comportamiento - que son perros muy, muy amigables que no son agresivos hacia las personas u otros perros", dijo MacLean.
Las intervenciones existentes para los problemas de conducta de los perros a menudo se dirigen a la testosterona y la serotonina - las otras dos hormonas más comúnmente estudiadas en el contexto de la agresión canina. Los dueños de mascotas comúnmente neutralizar a los perros machos para ayudar a controlar los niveles de testosterona, que se ha relacionado con la agresión. Y para controlar los niveles de serotonina, que se cree para reducir la agresión, algunos perros se prescriben ISRS, o inhibidores selectivos de la recaptación de serotonina, el tipo más común de antidepresivos.
Investigaciones futuras podrían considerar nuevas intervenciones centradas en la vasopresina y la oxitocina, dijo MacLean.
"Sería razonable pensar que si la vasopresina facilita la agresión, usted podría desarrollar productos farmacéuticos que podrían dirigirse al sistema de vasopresina para ayudar en los casos en que los perros son realmente agresivos", dijo. "La oxitocina y la vasopresina se están utilizando ampliamente como agentes terapéuticos en humanos ahora La regulación del sistema de oxitocina ha estado implicada en cosas que van desde el autismo a la esquizofrenia hasta el trastorno de estrés postraumático y hay ensayos clínicos que buscan administrar oxitocina como un fármaco para crear algún tipo de respuesta de comportamiento Es interesante pensar que tal vez algunas de estas mismas terapias que estamos tratando con la gente podría ser útil en los perros ".
En cuanto a por qué algunos perros tienen niveles más altos de vasopresina, la experiencia de vida puede ser un factor, dijo MacLean.
"Hay un montón de trabajo que muestra que las experiencias en su vida puede cambiar la forma de las hormonas función", dijo MacLean. "Para muchos perros que tienen problemas de agresión, los propietarios informan que el inicio de los síntomas agresivos ocurrió después de algún tipo de experiencia traumática. A menudo fue que el perro fue atacado por otro perro y está en un estado hipervigilante después de ese evento - casi como una reacción post-traumática. "
Una buena noticia para los dueños de mascotas y sus cachorros: Una forma de aumentar los niveles de oxitocina en los perros y disminuir la vasopresina es a través de interacciones amistosas perro-humano. Y el efecto se extiende a las personas también.
"Trabajos previos demuestran que las interacciones amistosas perro-humano pueden crear una liberación en la oxitocina en los perros, y cuando los perros interactúan con las personas, vemos que sus niveles de vasopresina bajan con el tiempo", dijo MacLean. "Estos son efectos bidireccionales No es sólo que cuando estamos acariciando a un perro, el perro está teniendo esta respuesta hormonal - lo estamos teniendo, también."
Fuente de la historia:
Materiales suministrados por la Universidad de Arizona . Nota: El contenido puede ser editado para el estilo y la longitud.

Más del 38 % de las poblaciones de loros tropicales americanos están amenazadas

<p>La captura para el comercio local e internacional es una de las amenazas principales sobre estas aves tropicales / Igor Berkunsky</p>
La captura para el comercio local e internacional es una de las amenazas principales sobre estas aves tropicales / Igor Berkunsky
La captura para el comercio local e internacional y la pérdida del hábitat natural son las amenazas principales sobre estas aves tropicales del orden Psittaciformes, según el artículo dirigido por los expertos Igor Berkunsky, de la Universidad Nacional del Centro de la Provincia de Buenos Aires (Argentina) y Juan Masello de la Universidad Justus Liebig, (Alemania). En la investigación colaboran un total de 101 expertos de 76 instituciones y organizaciones no gubernamentales, que han podido determinar las principales amenazas que afectan a 192 poblaciones de 96 especies de loros neotropicales en veintiún países.
La captura para el tráfico de mascotas ha sido una de las principales amenazas para la conservación de los loros silvestres. De 1980 a 1990, millones de individuos fueron capturados en el Neotrópico e importados a los Estados Unidos, Europa y Asia. Esta  extracción intensiva de loros pudo ser la causa del declive y la extinción local de muchas especies, como podría ser el caso del guacamayo de Spix.
Sudamérica, el Sudeste Asiático y Oriente Medio juegan un rol principal en el tráfico legal e ilegal de loros
En el continente africano, el tráfico de loros grises africanos ha jugado un rol principal en su virtual eliminación de Ghana y otras regiones de África. En la actualidad, algunas de las especies más amenazadas en Brasil son el guacamayo de Spix (Cyanopsitta spixii) y la amazona brasileña (Amazona brasiliensis). Especies como la cotorrita del sol (Aratinga solstitialis) y la cotorrita dorsinegra (Touit melanonotus) se encuentran en una situación de especial vulnerabilidad por el reducido tamaño de sus poblaciones.
En el ámbito de la protección, la Ley de Conservación de Aves Silvestres (Wild Bird Conservation Act, 1992) impulsada por EE UU y la prohibición permanente del tráfico de aves silvestres por parte de la Unión Europea de 2007 han contribuido a reducir el tráfico internacional en grandes mercados. Sin embargo, Sudamérica, el Sudeste Asiático y Oriente Medio continúan jugando hoy día un rol principal en el tráfico legal e ilegal. Algunos países del Neotrópico han reforzado su legislación para proteger los loros silvestres, como es el caso de México y Nicaragua. No obstante, en Bolivia, Brasil, México y Perú se mantienen unos niveles preocupantes de tráfico local.
Cuando el hábitat natural desaparece
La actividad agrícola, la tala selectiva y otras actividades de origen antrópico han alterado el hábitat natural de estas especies, que se ven afectadas por un promedio de diez tipos de amenazas diferentes. Esta situación pone en peligro el 38 % de las poblaciones de Psittaciformes neotropicales, pero el escenario real podría ser todavía peor de lo que se ha evaluado, alertan los expertos.
Tal como explica Juan Carlos Guix, "seria preciso impulsar acciones destinadas a la protección efectiva de los hábitats y las áreas naturales protegidas". En paralelo, "también convendría realizar programas sociales y educativos con las poblaciones humanas que viven en los entornos de las áreas naturales protegidas, y dotar de más recursos la vigilancia y la fiscalización del comercio ilegal".
El nuevo estudio, publicado en la revista Biological Conservation, está impulsado por el Grupo de Trabajo en Psittaciformes de la Unión Internacional de Ornitólogos, que incluye a más de doscientos especialistas de todo el mundo.
Referencia bibliográfica:

miércoles, 27 de septiembre de 2017

LA SAL CAUSA DIABETES

Un estudio presentado en el congreso anual de la Asociación Europea para el Estudio de la Diabetes, que se celebró hace unos días en Lisboa, ha establecido que existe una relación entre el consumo de sal y el riesgo de desarrollar diabetes tipo 2. Ya no es sólo el azúcar, sino la sal, la que puede causar esta enfermedad.  
El componente principal de la sal, el sodio, es el que puede aumentar las posibilidades de desarrollo de la diabetes, así como otra afección, la diabetes autoinmune del adulto, en la que las células productoras de insulina del páncreas son destruidas por el propio sistema inmune del cuerpo. El 40% de la sal es sodio, lo que significa que, por cada 2,5 gramos de sal, ingerimos uno de sodio. 
En España consumimos unos 12 gramos diarios de sal, más del doble de lo que recomienda la Organización Mundial de la Salud (OMS), que sitúa el límite en cinco gramos por día. La mayor parte de la población supera la cantidad aconsejada. 
Los embutidos, las conservas, los precocinados o el pan son algunos de los alimentos que más sal contienen. Habitualmente son los hipertensos o los que sufren problemas renales o cardiovasculares los que tienen más restringido su uso. 
La autora principal del trabajo, la investigadora Bahareh Rasouli, del Instituto de Medicina Ambiental del Karolinska Institutet (Suecia), explica que el sodio, al acumularse, provoca que el cuerpo retenga agua para poder diluirlo. «Esto incrementa el volumen de sangre en el torrente sanguíneo, lo que implica que el corazón tenga que trabajar más, y aumenta la presión en los vasos». 
Estos efectos conducen a la hipertensión, que es un factor de riesgo para, por ejemplo, enfermedades cardiovasculares. «La ingesta de comidas muy saladas también se asocia a un aumento del riesgo de padecer cáncer de estómago y afecta a los huesos. Sin embargo, había poca evidencia que sugiriese que el consumo de sodio pudiese ser un factor de riesgo en la diabetes tipo 2», añade. 
Trabajos anteriores aludían a que la relación entre el sodio y la diabetes tipo 2 podría deberse a un efecto directo en la resistencia a la insulina, así como por fomentar la hipertensión o el incremento de peso. «Aún no se ha investigado si tomar sodio está relacionado con la aparición de diabetes autoinmune», dice Rasouli. 
Los autores sugieren que puede haber una relación entre la diabetes y el sodio. En concreto, han advertido que por cada gramo extra de sodio consumido al día aumenta, de media, un 65% el riesgo de desarrollar diabetes tipo 2. Cuando el consumo sobrepasaba la cantidad recomendada en 2,9 gramos de sodio –unos 7,3 gramos de sal– por día, el riesgo se elevaba hasta un 72%. Respecto a la repercusión en la diabetes autoinmune latente, el riesgo alcanzaba el 82%. 
«Es un estudio observacional; por lo tanto, no podemos probar una relación causal entre un consumo elevado de sal y el riesgo de diabetes. En el futuro, sería interesante investigar en estudios clínicos controlados si una reducción de sal en la dieta es beneficiosa para la prevención de la diabetes», asegura la autora. 
Para llegar a estas conclusiones, el equipo usó datos de otro trabajo que analizaba los factores de riesgo en el desarrollo de estas dos enfermedades y los comparó con 355 casos de diabetes autoinmune latente y 1136 de diabetes tipo 2. Ambos grupos rellenaron un cuestionario sobre sus hábitos alimenticios para calcular su consumo diario de calorías, nutrientes y sodio. También se tuvo en consideración la influencia genética, la edad, el género, el índice de masa corporal, los hábitos de vida, el historial familiar y la ingesta de potasio. 
«Si estos resultados se confirman en otras poblaciones, podrían tener importantes implicaciones en la prevención primaria de la diabetes tipo 2 y la diabetes autoinmune en adultos», concluye la experta.

martes, 26 de septiembre de 2017

El yoga podría favorecer la neuroplasticidad cerebral

Las mujeres mayores que practican yoga podrían tener un mayor grosor en áreas del cerebro implicadas en la memoria y la atención, según un estudio realizado sobre una pequeña muestra.
Los investigadores pretendían averiguar si las practicantes de yoga, a largo plazo, mostraban alguna diferencia en su estructura cerebral. Así, realizaron escáneres cerebrales a 42 mujeres mayores de 60 años. La mitad practicaban yoga con regularidad durante los últimos 15 años, y la otra mitad eran mujeres sanas y físicamente activas, pero no practicaban yoga. Ambos grupos tenían unos niveles educativos parecidos.
El grupo de practicantes de yoga presentaba un mayor grosor cortical en regiones cerebrales implicadas en las funciones ejecutivas, como la atención. Incluso al compararlas con otras mujeres con un buen estado de salud y activas de su misma edad, las que practicaban yoga normalmente tenían un mayor grosor en la corteza prefrontal izquierda.
Esto contribuye a las evidencias de que el yoga podría tener efectos neuroplásticos en el cerebro y traducirse en un mejor estado de ánimo y una mejor cognición, sobre todo considerando que el deterioro cognitivo por el envejecimiento normalmente se asocia con un volumen menor en las áreas corticales del cerebro.

El tacto del renacuajo dispara el instinto paternal de la rana venenosa

<p>Las ranas venenosas adultas transportan a sus espaldas incluso renacuajos que no pertenecen a su prole. / Andrius Pasukonis/Eva Ringler</p>
Las ranas venenosas adultas transportan a sus espaldas incluso renacuajos que no pertenecen a su prole. / Andrius Pasukonis/Eva Ringler
El cuidado de las crías se extiende a todo el reino animal y las ranas venenosas no son una excepción. Una vez que los renacuajos eclosionan, los padres los recogen y los llevan en sus espaldas hasta los charcos donde se desarrollarán. Hasta ahora, los procesos que desencadenan el cuidado parental se habían estudiado en aves y mamíferos, pero no en estas ranas.
Un estudio publicado en Journal of Experimental Biology revela por primera vez cuál es el estímulo concreto que dispara el instinto paternal de las ranas cuando llevan a sus crías a las charchas repartidas por todo el bosque.
Los científicos de la Universidad de Viena (Austria) y la de Harvard (EE UU) comprobaron con un experimento qué es lo que motivaba a las ranas a desplazarse y para ello, colocaron renacuajos con los que no tenían ninguna relación familiar en las espaldas de diferentes anfibios adultos machos y hembras.
Incluso las hembras, que en condiciones normales rara vez desempeñan el papel de transportistas, asumieron las funciones de los machos
Los resultados demostraron que las ranas venenosas son padres ejemplares. Incluso las hembras, que en condiciones normales rara vez desempeñan el papel de “transportistas”, asumieron las funciones parentales como los machos cuando se les colocaron renacuajos en sus espaldas.
Crías propias o ajenas
Los científicos pudieron seguir a las ranas gracias a la colocación de transmisores miniatura. “Queríamos saber si los renacuajos ajenos también eran transportados a las charcas. Los resultados muestran que, aunque los renacuajos no sean recogidos por los adultos, el contacto con las espaldas de las ranas adultas es suficiente para desencadenar el transporte”, declara el líder del proyecto, Andrius Pašukonis, de la universidad austríaca.
Las pruebas realizadas a machos y hembras revelaron que todos los ejemplares transportaron a los renacuajos independientemente de su origen y de si los recogían ellos mismos o no.
A pesar de que los investigadores desconocen aún el mecanismo por el que este comportamiento instintivo se produce, sospechan que los estímulos táctiles como ciertos movimientos de los renacuajos podrían entrar en juego. “Estos hallazgos son interesantes porque revelan cómo un estímulo puede impulsar este comportamiento tan complejo”, añade el científico. Además, el tacto también motiva el recuerdo de los lugares a los que tienen que ir.  
Referencia bibliográfica:
Andrius Pašukonis, Kristina Barbara Beck, Marie-Therese Fischer, Steffen Weinlein, Susanne Stückler y Eva Ringler. “Induced parental care in a poison frog: a tadpole cross-fostering experiment” Journal of Experimental Biology

“Hay más huracanes porque estamos rozando un punto de inflexión climático”

30
<p><a href="http://www.bc3research.org/es/marijose_sanz.html" target="_blank">María José Sanz</a>, directora del BC3 / Ikerbasque</p>
María José Sanz, directora del BC3 / Ikerbasque
Primero el huracán Irma, que causó estragos en las islas del Caribe y Florida, y ahora María, que ha arrasado Puerto Rico, han puesto en alerta al mundo por la magnitud de estos fenómenos atmosféricos cuya crudeza va en aumento como consecuencia del cambio climático. María José Sanz (Valencia, 1963) dirige el Basque Centre for Climate Change (BC3), una institución que ha sido seleccionada en varias ocasiones para formar parte del Grupo Intergubernamental de Expertos sobre el Cambio Climático (IPCC, por sus siglas en inglés) y que también estará en el próximo informe de evaluación.
Estamos sufriendo huracanes cada vez más intensos y devastadores. ¿Qué papel tiene el cambio climático en este proceso?
El sistema climático es bastante complejo. Cuando se hizo el Cuarto Informe de Evaluación del IPCC en 2007 se intuyó que podía haber un incremento de fenómenos extremos. En el texto de 2014 ya se recogían evidencias. Estos ciclones ocurren porque hay ciertos puntos de inflexión en los procesos físicos que regulan el clima y, una vez que se pasan, ciertos fenómenos se aceleran. Es muy probable que estemos muy cerca o hayamos pasado el punto de inflexión.
¿Por qué se concentran en el Caribe?
En el Atlántico y el Caribe estos fenómenos suceden porque el agua del océano almacena más energía que antes. Pero también se observa una tropicalización en el Mediterráneo debida al calentamiento de la superficie del agua, que está provocando tornados sobre este mar.
Pero los tornados en el Mediterráneo no son nuevos, ¿no?
“La tropicalización del Mediterráneo, que se debe al calentamiento, está provocando tornados”
Siempre ha habido pequeños tornados, pero ahora se dan con más intensidad no solo en el Mediterráneo, también en el Caribe. Se han alterado los grandes fenómenos que regulan el clima. Por ejemplo, el anticiclón de las Azores ya no se coloca donde debería. Esto hace que pasen borrascas por el norte de España y tengamos el tiempo anómalo de este verano.
¿El derretimiento del hielo ártico también tiene algo que ver? 
Que se haya fundido gran parte de la capa de hielo en el Ártico implica un descenso de las corrientes marinas, lo que altera la circulación oceánica, que es otro regulador del clima. El mayor peligro no está en la atmósfera, sino en lo que la atmósfera traspasa a sistemas que tienen una inercia mucho mayor, como el océano. Y eso no se cambia de un día para otro. Aunque dejáramos de emitir COhay procesos que continuarían acelerándose.
En España lo que preocupa es la sequía, que se prevé como la peor en los últimos veinte años.  
“El anticiclón de las Azores ya no se coloca donde debería, por eso en España hemos tenido el tiempo anómalo de este verano”
Siempre ha habido ciclos de sequía con ritmos bastante más amplios que los actuales. En España, en primer lugar, los cambios en el uso de la tierra que se han producido en los últimos siglos influyen en la climatología. Pero además, dependemos mucho de la energía hídrica. Cuando hay sequía, utilizamos otros tipos de energía que aumentan las emisiones.
¿Lo estamos haciendo bien a la hora de adaptarnos al cambio climático?
España siempre ha sufrido este tipo de fenómenos, no nos resultan nuevos. Por ejemplo, ya se ha debatido mucho sobre cómo gestionar de forma más racional el agua para la la agricultura. Ahora habrá que poner más énfasis en la conservación y en la respuesta a otras demandas de agua, porque tenemos un turismo muy intenso, que provoca fuertes variaciones en el consumo humano.
¿Qué ocurrirá con el Acuerdo de París?
El Acuerdo de París supone un cambio de paradigma: todos los países, tanto desarrollados como en vías de desarrollo, toman conciencia de que hay un problema. Todos coinciden de forma voluntaria en que deben hacer algo, lo exponen públicamente y se comprometen a que les hagan un seguimiento. Es un cambio radical. Antes, los únicos que tenían obligación de hacer algo para reducir emisiones, según el Protocolo de Kioto, eran los países desarrollados.
“A pesar de Trump, la sociedad estadounidense no se ha desligado de los problemas del clima”
¿Qué supone el boicot de Donald Trump a este acuerdo?
Como EE UU es uno de los motores del Acuerdo de París, al cambiar políticamente parece que se desvincula. Sin embargo, la sociedad estadounidense no se desliga del problema y, de hecho, su Senado ha destinado una partida presupuestaria para apoyar la convención del IPCC.
¿Y las otras grandes economías?
China, que tiene problemas muy graves de contaminación atmosférica, ha visto una ventana de oportunidad económica en tecnologías contra el calentamiento global. Hoy es la primera potencia en equipos de energía eólica del mundo. El sector privado está cambiando a mayor velocidad de lo que nosotros percibimos. Hay nuevas oportunidades de negocio. 
Aunque hubiera punto de retorno, algunas regiones van a sufrir igualmente las consecuencias del calentamiento global. ¿Se hace un análisis de su impacto local en los informes del IPCC? 
Cada vez más, porque es una de las demandas de los últimos años. Dentro del IPCC se ha debatido mucho sobre cómo bajar a escalas que son relevantes para quien hace las políticas que deben tener efecto en las zonas afectadas. Hay que actuar a nivel local.

viernes, 22 de septiembre de 2017

Las máquinas inteligentes aprenden a ser curiosas

Eric Nyquist para la revista Quanta
Usted probablemente no puede recordar lo que se siente al jugar Super Mario Bros. por primera vez, pero trate de imaginarlo. Un mundo de juegos de 8 bits parpadea en ser: cielo azul bebé, suelo de piedra tessellated, y en medio, un hombre de cuclillas, de color rojo de pie todavía - esperando. Está mirando hacia la derecha; usted lo empuja más lejos en esa dirección. Unos cuantos pasos más revelan una hilera de ladrillos que se cierne sobre sus cabezas y lo que parece un hongo enojado y ambulatorio. Otro movimiento de los controles hace que el hombre se levante, su puño de cuatro píxeles apuntando hacia el cielo. ¿Ahora que? Tal vez tratar de combinar el empujón hacia la derecha y la primavera hacia el cielo? Hecho. Entonces, una sorpresa: El hombre pequeño golpea su cabeza contra uno de los ladrillos que se ciernen, que flexiona hacia arriba y luego se encaja hacia atrás como si la primavera de carga, la propulsión del hombre hacia la tierra sobre el hongo que se acerca y aplastándolo instantáneamente. Mario rebotó de los restos aplastados con un suave salto. Arriba, cuadros de cobre con brillantes "?" Símbolos parecen preguntar: ¿Qué pasa ahora?
Esta escena sonará familiar a cualquier persona que creció en los años 80, pero usted puede mirar a un jugador mucho más joven en el canal de YouTube de Pulkit Agrawal . Agrawal , un investigador de ciencias de la computación de la Universidad de California en Berkeley, está estudiando cómo la curiosidad innata puede hacer que aprender una tarea desconocida - como jugar Super Mario Bros. por primera vez - sea más eficiente. La captura es que el jugador novato en el video de Agrawal no es humano, ni siquiera vivo. Al igual que Mario, es sólo software. Pero este software viene equipado con algoritmos experimentales de aprendizaje automático diseñados por Agrawal y sus colegas Deepak Pathak , Alexei A. Efros y Trevor Darrell en el Berkeley Artificial Intelligence Research Lab con un sorprendente propósito: hacer una máquina curiosa.
"Se puede pensar en la curiosidad como una especie de recompensa que el agente genera internamente por sí misma, para que pueda explorar más sobre su mundo", dijo Agrawal. Esta señal de recompensa generada internamente se conoce en la psicología cognitiva como "motivación intrínseca". La sensación que usted puede haber experimentado vicariamente durante la lectura de la descripción del juego anterior - un deseo de revelar más de lo que está esperando fuera de la vista o simplemente fuera de su alcance , sólo para ver qué pasa - esa es la motivación intrínseca.
Los seres humanos también responden a las motivaciones extrínsecas, que se originan en el medio ambiente. Ejemplos de estos incluyen todo, desde el salario que recibe en el trabajo a una demanda entregada a punta de pistola. Los científicos de computación aplican un enfoque similar llamado refuerzo aprendizaje para entrenar sus algoritmos: El software obtiene "puntos" cuando realiza una tarea deseada, mientras que las sanciones siguen el comportamiento no deseado.
Pero este enfoque de la zanahoria y el palo de aprendizaje de la máquina tiene sus límites, y los investigadores de inteligencia artificial están empezando a ver la motivación intrínseca como un componente importante de agentes de software que pueden aprender de manera eficiente y flexible - es decir, y animales. Los enfoques para el uso de la motivación intrínseca en la IA se han inspirado en la psicología y la neurobiología - por no hablar de la investigación de la IA de décadas de edad, ahora de reciente relevancia. ("Nada es realmente nuevo en el aprendizaje automático", dijo Rein Houthooft , investigador científico de OpenAI , una organización independiente de investigación de inteligencia artificial).
Dichos agentes pueden ser entrenados en videojuegos ahora, pero el impacto del desarrollo de una AI "curiosa" significa trascender cualquier atractivo de novedad. "Elige tu área de aplicación favorita y te daré un ejemplo", dijo Darrell, co-director del laboratorio de Inteligencia Artificial de Berkeley. "En casa, queremos automatizar la limpieza y la organización de objetos. En logística, queremos que el inventario sea movido y manipulado. Queremos vehículos que puedan navegar entornos complicados y rescatar robots que puedan explorar un edificio y encontrar personas que necesitan rescatar. En todos estos casos, estamos tratando de resolver este problema realmente difícil: ¿Cómo se hace una máquina que puede resolver su propia tarea? "

El problema con los puntos

El aprendizaje de refuerzo es una gran parte de lo que ayudó a que el software AlphaGo de Google venciera al mejor jugador humano del mundo en Go , un juego antiguo e intuitivo que se consideraba invulnerable al aprendizaje automático. Los detalles del uso exitoso del aprendizaje de refuerzo en un dominio particular son complejos, pero la idea general es simple: Dar un algoritmo de aprendizaje, o "agente", una función de recompensa, una señal matemáticamente definida para buscar y maximizar. A continuación, ponerlo suelto en un entorno, que podría ser cualquier mundo real o virtual. A medida que el agente actúa en el entorno, las acciones que aumentan el valor de la función de recompensa se refuerzan. Con suficiente repetición - y si hay algo que las computadoras son mejores que las personas, es la repetición - el agente aprende patrones de acción, o políticas, que maximizan su función de recompensa. Idealmente, estas políticas darán como resultado que el agente alcance algún estado final deseable (como "ganar en Go"), sin que un programador o ingeniero tenga que codificar a mano todos los pasos que el agente necesita tomar a lo largo del camino.
En otras palabras, una función de recompensa es el sistema de guía que mantiene un agente de refuerzo-aprendizaje-impulsado bloqueado en el objetivo. Cuanto más claramente se define el objetivo, mejor se realiza el agente - es por eso que muchos de ellos están actualmente probados en los viejos videojuegos, que a menudo proporcionan esquemas de recompensas extrínsecas simples basados ​​en puntos. (Los gráficos en bloque y bidimensionales también son útiles: los investigadores pueden ejecutar y repetir sus experimentos rápidamente porque los juegos son relativamente fáciles de emular).
Sin embargo, "en el mundo real, no hay puntos", dijo Agrawal. Los científicos informáticos quieren que sus creaciones exploren nuevos ambientes que no vienen precargados con objetivos cuantificables.
Además, si el medio ambiente no proporciona recompensas extrínsecas con rapidez y regularidad, el agente "no tiene ni idea de si está haciendo algo bien o mal", dijo Houthooft. Como un misil de búsqueda de calor incapaz de bloquear a un objetivo, "no tiene ningún modo de [guiarse a sí mismo] a través de su entorno, por lo que simplemente se vuelve loco".
Además, incluso las funciones de recompensas extrínsecas, que pueden guiar a un agente para que muestre un comportamiento impresionantemente inteligente, como la capacidad de AlphaGo de ser el mejor jugador humano de Go, no se transferirán o generalizarán fácilmente a ningún otro contexto sin una modificación extensa. Y ese trabajo debe hacerse a mano, que es precisamente el tipo de trabajo que el aprendizaje de la máquina se supone que nos ayuda a esquivar en primer lugar.
En lugar de una batería de agentes pseudo-inteligentes que pueden golpear de forma fiable objetivos específicos como los misiles, lo que realmente queremos de la IA es más como una capacidad de pilotaje interno. "Usted hace sus propias recompensas, ¿verdad?" Dijo Agrawal. "No hay dios que te diga constantemente 'más uno' por hacer esto o 'menos uno' por hacer eso."

Curiosidad como copiloto

Deepak Pathak nunca se propuso modelar algo tan airosamente psicológico como la curiosidad en el código. "La palabra" curiosidad "no es otra cosa que decir," un modelo que lleva a un agente a explorar eficientemente su entorno en presencia de ruido ", dijo Pathak, investigador del laboratorio de Darrell en Berkeley.
Pero en 2016, Pathak estaba interesado en el escaso problema de las recompensas para el aprendizaje del refuerzo. El software de aprendizaje profundo, impulsado por técnicas de aprendizaje de refuerzo, había hecho recientemente ganancias significativas al jugar juegos de Atari basados ​​en puntuación sencilla como Space Invaders y Breakout. Pero incluso los juegos ligeramente más complejos como Super Mario Bros., que requieren navegar hacia un objetivo distante en el tiempo y el espacio sin recompensas constantes, sin mencionar la capacidad de aprender y ejecutar con éxito movimientos compuestos como correr y saltar al mismo tiempo más allá del alcance de una IA.
Pathak y Agrawal, trabajando con Darrell y Efros, equiparon a su agente de aprendizaje con lo que ellos llaman un módulo de curiosidad intrínseca (ICM) diseñado para atraerlo hacia adelante sin perder el rumbo. El agente, después de todo, no tiene absolutamente ninguna comprensión previa de cómo jugar Super Mario Bros. - de hecho, es menos como un jugador novato y más como un recién nacido.
De hecho, Agrawal y Pathak se inspiraron en el trabajo de Alison Gopnik y Laura Schulz , psicólogos del desarrollo en Berkeley y en el Massachusetts Institute of Technology, respectivamente, quienes mostraron que los bebés y los niños pequeños son naturalmente atraídos por los objetos que más les sorprenden, más que con objetos que son útiles para lograr alguna meta extrínseca. "Una manera de explicar este tipo de curiosidad en los niños es que construyen un modelo de lo que saben sobre el mundo y luego realizan experimentos para aprender más sobre lo que no saben", dijo Agrawal. Estos "experimentos" pueden ser cualquier cosa que genere un resultado que el agente (en este caso, un infante) encuentre inusual o inesperado. El niño puede comenzar con movimientos aleatorios de las extremidades que causan nuevas sensaciones (conocidas como "balbuceos motores") y luego progresan hasta comportamientos más coordinados como masticar un juguete o golpear una pila de bloques para ver qué sucede.
En la versión de máquina-aprendizaje de Pathak y Agrawal de esta curiosidad sorpresa-conducida, la IA matemáticamente representa lo que el marco video actual de Super Mario Bros. parece. Entonces predice lo que el juego se verá como varios marcos por lo tanto. Esta hazaña está dentro de los poderes de los actuales sistemas de aprendizaje profundo. Pero entonces la ICM de Pathak y Agrawal hace algo más. Genera una señal de recompensa intrínseca definida por lo erróneo que resulta ser este modelo de predicción. Cuanto mayor es la tasa de error - es decir, más sorprendido está - más alto es el valor de su función de recompensa intrínseca. En otras palabras, si una sorpresa es equivalente a notar cuando algo no sale como se esperaba - es decir, a estar equivocado - entonces el sistema de Pathak y Agrawal es recompensado por ser sorprendido.
Esta señal generada internamente atrae al agente hacia estados inexplorados en el juego: informalmente hablando, se pone curioso acerca de lo que aún no sabe. Y a medida que el agente aprende - es decir, a medida que su modelo de predicción se vuelve cada vez menos incorrecto - su señal de recompensa del ICM disminuye, liberando al agente para maximizar la señal de recompensa explorando otras situaciones más sorprendentes. "Es una manera de hacer que la exploración sea más rápida", dijo Pathak.
Este bucle de retroalimentación también permite a la IA arrancarse rápidamente de un estado de ignorancia casi en blanco. Al principio, el agente es curioso acerca de cualquier movimiento básico disponible para su cuerpo en pantalla: presionando a la derecha empuja a Mario a la derecha, y luego se detiene; presionar varias veces seguidas en una fila hace que Mario se mueva sin detenerse inmediatamente; presionando hacia arriba lo hace saltar en el aire, y luego bajar de nuevo; presionar hacia abajo no tiene efecto. Este balbuceo motor simulado converge rápidamente en acciones útiles que mueven al agente hacia adelante en el juego, aunque el agente no lo sepa.
Por ejemplo, puesto que presionar siempre tiene el mismo efecto - nada - el agente aprende rápidamente a predecir perfectamente el efecto de esa acción, que cancela la señal de recompensa proporcionada por la curiosidad asociada con ella. Presionar para arriba, sin embargo, tiene todas las clases de efectos imprevisibles: A veces Mario va derecho para arriba, a veces en un arco; a veces toma un salto corto, otras veces un salto largo; a veces no vuelve a bajar (si, digamos, llega a aterrizar encima de un obstáculo). Todos estos resultados se registran como errores en el modelo de predicción del agente, resultando en una señal de recompensa de la ICM, lo que hace que el agente siga experimentando con esa acción. El movimiento a la derecha (que casi siempre revela más mundo del juego) tiene efectos similares de la curiosidad-acoplamiento. El impulso de moverse hacia arriba y hacia la derecha se puede ver claramente en el video de demostración de Agrawal : En cuestión de segundos, el Mario controlado por la IA empieza a saltar hacia la derecha como un niño hiperactivo, causando efectos cada vez más impredecibles (como chocar contra un ladrillo, accidentalmente squishing un hongo), todos los cuales impulsar la exploración más.
"Utilizando esta curiosidad, el agente aprende a hacer todas las cosas que necesita para explorar el mundo, como saltar y matar a los enemigos", explicó Agrawal. "Ni siquiera se penaliza por morir. Pero aprende a evitar morir, porque el no-morir maximiza su exploración. Se está reforzando, no consiguiendo refuerzos del juego ".

Evitar la trampa de la novedad

La curiosidad artificial ha sido un tema de investigación de la IA desde al menos la década de 1990. Una forma de formalizar la curiosidad en los centros de software en busca de novedad: El agente está programado para explorar estados desconocidos en su entorno. Esta amplia definición parece capturar una comprensión intuitiva de la experiencia de la curiosidad, pero en la práctica puede hacer que el agente se vuelva atrapado en estados que satisfacen su incentivo incorporado, pero evitan cualquier exploración adicional.
Por ejemplo, imagine una televisión que no muestre nada sino estática en su pantalla. Tal cosa atraería rápidamente la curiosidad de un agente puramente novedoso, porque un cuadrado de ruido visual que parpadea aleatoriamente es, por definición, totalmente impredecible de un momento a otro. Dado que todo patrón de estática parece completamente nuevo para el agente, su función de recompensa intrínseca garantizará que nunca puede dejar de prestar atención a esta característica única e inútil del medio ambiente y queda atrapada.
Resulta que este tipo de novedad sin sentido es omnipresente en el tipo de entornos ricamente presentados - virtuales o físicos - que AI debe aprender a hacer frente a ser verdaderamente útil. Por ejemplo, un vehículo de entrega autodidacta equipado con una función de recompensa intrínseca de búsqueda de novedad nunca podría llegar más allá del final del bloque. -Diga que se está moviendo por una calle y el viento sopla y las hojas de un árbol se mueven -dijo Agrawal-. "Es muy, muy difícil de predecir donde cada hoja va a ir. Si estás prediciendo píxeles, este tipo de interacciones te hará tener altos errores de predicción, y te hará muy curioso. Queremos evitar eso.
Agrawal y Pathak tuvieron que encontrar una manera de mantener a su agente curioso, pero no demasiado curioso. Predecir los píxeles - es decir, usar el aprendizaje profundo y la visión por ordenador para modelar el campo visual de un agente en su totalidad de momento en momento - hace que sea difícil de filtrar posibles distracciones. Es computacionalmente caro, también.
Así que en su lugar, los investigadores de Berkeley ingeniaron a su agente de Mario-playing para traducir su entrada visual de píxeles crudos en una versión abstracta de la realidad. Esta abstracción incorpora sólo las características del entorno que tienen el potencial de afectar al agente (o que el agente puede influir). En esencia, si el agente no puede interactuar con una cosa, ni siquiera se percibirá en primer lugar.
El uso de este "espacio de función" simplificado (en comparación con el "espacio de píxeles" no procesado) no sólo simplifica el proceso de aprendizaje del agente, sino que evita también la trampa de novedad. "El agente no puede obtener ningún beneficio de modelado, por ejemplo, las nubes que se mueven por encima de la cabeza, para predecir los efectos de sus acciones", explicó Darrell. "Así que simplemente no va a prestar atención a las nubes cuando es curioso. Las versiones anteriores de la curiosidad -al menos algunas de ellas- sólo estaban considerando la predicción a nivel de píxeles. Lo cual es genial, excepto cuando de repente pasas una cosa muy impredecible pero muy aburrida.

Los Límites de la Curiosidad Artificial

Darrell admitió que este modelo de curiosidad no es perfecto. "El sistema aprende lo que es relevante, pero no hay garantía de que siempre lo haga bien", dijo. De hecho, el agente lo hace sólo a mitad del primer nivel de Super Mario Bros. antes de quedar atrapado en su propio óptimo local peculiar. "Hay una gran brecha que el agente tiene que saltar, lo que requiere ejecutar 15 o 16 acciones continuas en un orden muy, muy específico", dijo Agrawal. "Porque nunca es capaz de saltar esta brecha, muere cada vez por ir allí. Y cuando aprende a predecir perfectamente este resultado, deja de ser curioso acerca de ir más lejos en el juego. "(En la defensa del agente, Agrawal señala que este defecto surge porque la IA puede presionar sus controles direccionales simulados sólo en intervalos discretos, lo que hace ciertos movimientos imposibles.)
En última instancia, el problema de la curiosidad artificial es que incluso los investigadores que han estudiado la motivación intrínseca durante años todavía no pueden definir con precisión lo que es la curiosidad. Paul Schrater , un neurocientífico que dirige el Laboratorio de Percepción y Acción Computacional de la Universidad de Minnesota, dijo que el modelo de Berkeley "es lo más inteligente que se puede hacer en el corto plazo para que un agente automáticamente aprenda un nuevo ambiente", pero él piensa que tiene menos que ver con "el concepto intuitivo de la curiosidad" que con el aprendizaje y el control motores. "Es controlar las cosas que están por debajo de la cognición, y más en los detalles de lo que hace el cuerpo", dijo.
Para Schrater, la idea novedosa del equipo de Berkeley viene de unir su intrínseco módulo de curiosidad a un agente que percibe a Super Mario Bros. como un espacio de características en vez de como marcos secuenciales de píxeles. Sostiene que este enfoque puede aproximarse aproximadamente a la manera en que nuestro propio cerebro "extrae características visuales que son relevantes para un tipo particular de tarea".
La curiosidad también puede requerir que un agente esté al menos parcialmente encarnado (virtualmente o físicamente) dentro de un entorno para tener un significado real, dijo Pierre-Yves Oudeyer , director de investigación de Inria en Burdeos, Francia. Oudeyer ha estado creando modelos computacionales de curiosidad por más de una década. Señaló que el mundo es tan grande y rico que un agente puede encontrar sorpresas por todas partes. Pero esto no es suficiente. "Si usted tiene un agente desencarnado usando curiosidad para explorar un espacio grande, su comportamiento va a acabar mirando como exploración aleatoria porque no tiene ninguna limitación en sus acciones", dijo Oudeyer. "Las limitaciones de, por ejemplo, un cuerpo permiten una simplificación del mundo". Ellos enfocan la atención y ayudan a guiar la exploración.
Pero no todos los agentes encarnados necesitan motivación intrínseca, tampoco - como lo demuestra la historia de la robótica industrial. Para tareas que son más sencillas de especificar - por ejemplo, trasladar carga de un lugar a otro usando un robot que sigue una línea amarilla pintada en el suelo - agregar curiosidad a la mezcla sería un exceso de maquinado.
"Podrías darle a ese tipo de agente una función de recompensa perfecta - todo lo que necesita saber de antemano", explicó Darrell. "Podríamos resolver ese problema hace 10 años. Pero si usted está poniendo un robot en una situación que no se puede modelar de antemano, como la búsqueda y rescate de desastres, tiene que salir y aprender a explorar por su cuenta. Eso es más que una simple cartografía - tiene que aprender los efectos de sus propias acciones en el medio ambiente. Definitivamente quieres que un agente tenga curiosidad cuando está aprendiendo a hacer su trabajo ".
AI es a menudo informalmente definido como "lo que los ordenadores no pueden hacer todavía." Si la motivación intrínseca y la curiosidad artificial son métodos para conseguir agentes para averiguar las tareas que no sabemos ya automatizar, entonces "eso es algo que soy bastante seguro que queremos que cualquier AI tenga ", dijo Houthooft, el investigador de OpenAI. "La dificultad está en afinarla." Agrawal y el agente Mario-jugando de Pathak pueden no poder conseguir pasado Mundo 1-1 en sus los propios. Pero eso es probablemente lo que la curiosidad de ajuste - artificial o de otro tipo - se verá así: una serie de pasos de bebé.