Aparición de nueva regulación y expresión de genes de cefalópodos a través de grandes
Nature Communications volumen 13, Número de artículo: 2172 (2022) Citar este artículo
8354 Accesos
9 citas
284 Altmetric
Detalles de métricas
Los cefalópodos coleoides (calamares, sepias, pulpos) tienen el sistema nervioso más grande entre los invertebrados que, junto con muchos rasgos morfológicos específicos del linaje, permite comportamientos complejos. La base genómica que subyace a estas innovaciones sigue siendo desconocida. Usando genómica comparativa y funcional en el modelo de calamar Euprymna scolopes, revelamos la organización genómica, topológica y reguladora única de los genomas de cefalópodos. Mostramos que los genomas de cefalópodos coleoides se han reestructurado ampliamente en comparación con otros animales, lo que lleva a la aparición de cientos de grupos de genes únicos estrechamente vinculados y evolutivos (microsyntenies). Estas microsíntesis novedosas corresponden a compartimentos topológicos con una estructura reguladora distinta y contribuyen a patrones de expresión complejos. En particular, identificamos un conjunto de microsyntenies asociados con innovaciones de cefalópodos (MACI) ampliamente enriquecidos en la expresión del sistema nervioso de cefalópodos. Postulamos que la aparición de MACI fue fundamental para la evolución del sistema nervioso de los cefalópodos y proponemos que el perfilado microsintético será fundamental para comprender las innovaciones de los cefalópodos.
Los cefalópodos tienen los sistemas nerviosos de invertebrados más grandes y poseen muchas adaptaciones específicas de linaje, como camuflaje de adaptación rápida, brazos con ventosas y ojos tipo cámara. Muchas características de los cefalópodos evolucionaron de manera convergente con las de los vertebrados, lo que los convierte en un sistema atractivo para estudiar la base genética de las innovaciones de organismos a gran escala y las vías detrás de su evolución.
A nivel genómico, se ha descrito la aparición de nuevos genes, extensas duplicaciones de genes y una amplia edición de ARN en genomas de cefalópodos1. Las expansiones de familias de genes como C2H2, protocadherinas y GPCR, y la edición extensa de ARN permitieron la diversificación de las transcripciones de codificación de proteínas en el sistema nervioso y se propone que jugaron un papel importante en su evolución. Si bien se conocen innovaciones similares de los genomas de vertebrados, los mecanismos que impulsan la evolución de estas características son diferentes: los vertebrados pasaron por varias rondas de duplicaciones del genoma completo que produjeron grandes conjuntos de genes de múltiples copias y la diversificación de sus funciones, no hay indicios. para eventos similares en cefalópodos1,2,3. Por el contrario, se ha sugerido que el linaje de los cefalópodos coleoides (calamares, sepias, pulpos) pasó por una reorganización del genoma a gran escala2,3.
Una propiedad de los genomas de los metazoos es que el orden de los genes locales o la microsíntesis se conserva incluso entre especies relacionadas de forma distante4,5,6. Esta conservación está respaldada por estudios funcionales de restricciones reguladoras, que se muestran en bloques reguladores genómicos (GRB)4,5,7, así como la coexpresión de genes vecinos en tejidos o tipos de células8. Los primeros ensamblajes del genoma en varios coleoides indican que el orden de los genes locales se ha alterado en gran medida, lo que ha roto las microsíntesis antiguas y ha unido genes previamente desvinculados2,3. Este evento, potencialmente a escala de todo el genoma, podría haber afectado a cientos de familias de genes, interrumpiendo el orden de los genes en comparación con el último ancestro común de los cefalópodos coleoides y otros moluscos. El alcance de este evento es difícil de estimar debido a la falta de ensamblajes a escala cromosómica en los cefalópodos. Para comenzar a comprender el alcance de la reorganización del genoma y su impacto en la biología y evolución del genoma de los cefalópodos, estudiamos la especie modelo emergente Euprymna scolopes (calamar bobtail hawaiano). Esta especie ha estado en el centro de la investigación sobre simbiosis durante más de 30 años9,10, pero también es un sistema modelo atractivo para la investigación sobre evolución y desarrollo debido a su tamaño adulto pequeño, puestas de huevos grandes y relativa facilidad de cultivo.
Para reconstruir el panorama regulatorio en el genoma de E. scolopes, aplicamos captura de conformación cromosómica (Hi-C) y técnicas de perfilado de cromatina abierta (ATAC-seq), además de recopilar datos de expresión adicionales. Hi-C nos permitió mejorar el ensamblaje del genoma de E. scolopes publicado anteriormente, así como capturar la organización tridimensional del genoma. Usando enfoques genómicos comparativos, describimos la naturaleza global de la reorganización del genoma en los cefalópodos coleoides y demostramos la aparición de muchas regiones microsintéticas que previamente no estaban vinculadas en otras especies. Nuestros datos también revelan interacciones entre loci genómicos distantes (la organización topológica del genoma) que arrojan luz sobre la organización tridimensional del genoma de E. scolopes, además de identificar genes ubicados en bucles reguladores y dominios de asociación topológica (TAD). Nuestros datos abiertos de cromatina revelan regiones accesibles a los factores de transcripción y, por lo tanto, que constituyen potencialmente elementos reguladores. Juntos, estos datos nos permiten obtener información sobre el impacto de los cambios evolutivos en los enlaces de genes y la aparición de nuevas regulaciones de genes. Este estudio proporciona la base para la comprensión de la evolución de los genomas de los cefalópodos y las posibles implicaciones sobre las novedades morfológicas en este clado.
La información de enlace de la captura de conformación cromosómica nos permitió reconstruir 46 andamios cromosómicos en E. scolopes ("Métodos", Notas complementarias 1 y 2, Figura complementaria 1a, b) en función del ensamblaje publicado3. Luego comparamos el orden de los genes con los ortólogos encontrados en otras 24 especies animales que van desde esponjas hasta vertebrados, lo que nos permitió reconstruir bloques microsintéticos compartidos entre diferentes clados ("Métodos", Nota complementaria 3, Figura complementaria 2a, Datos complementarios 1) . Brevemente, definimos bloques microsintéticos como al menos tres o más genes ortólogos concurrentes con hasta cinco genes intermedios sin restricciones en su colinealidad. Esta definición de microsynteny produce la menor cantidad de bloques de falsos positivos (en comparación con solo pares de genes) al tiempo que proporciona suficiente flexibilidad para detectar regiones sinténicas que sufrieron una reorganización y expansión locales. Recuperamos 505 microsyntenies exclusivos de los cefalópodos, que representan bloques de genes que solo se encuentran muy cerca unos de otros en E. scolopes y al menos una especie de pulpo. Para el muestreo de la misma especie y los mismos parámetros de detección de microsintesis, solo se habrían esperado 2 bloques por casualidad (mediana de 3 rondas de aleatorización, como se describe en 6). Cinco de estos 505 bloques eran parálogos. En total, solo 48 de los 2290 genes en estos 505 bloques se identificaron como genes huérfanos sin homología fuera de los cefalópodos, mientras que todos los demás tienen ortólogos en otros animales, lo que sugiere que el origen de la microsintencia se debió a cambios en las ubicaciones de los genes en lugar de nuevos genes. aparición de genes. Estas microsíntesis se han conservado en cefalópodos coleoides a pesar de su largo tiempo de divergencia (Fig. 1b, c), lo que sugiere una restricción evolutiva que mantuvo juntos esos bloques de genes. De manera similar, una comparación en otros moluscos, como la vieira Mizuhopecten yessoensis11 y el bivalvo Crassostrea gigas, mostró que estas especies comparten un número mucho menor de microsintencias específicas de bivalvos (152). Para inferir el conjunto de bloques microsintéticos altamente conservados, reconstruimos microsyntenies compartidos entre E. scolopes y al menos seis especies más distantes relacionadas de un conjunto de 23 especies (Fig. 2 complementaria). Recuperamos 275 microsyntenies de metazoos de este tipo, que se conservan en el linaje de E. scolopes y se infiere que se remontan al menos al último ancestro bilateral común (Fig. 1c, Fig. 2a complementaria, "Métodos"). En comparación, el bivalvo M. yessoensis retiene un número similar de microsintencias de metazoos (216). Estos resultados proporcionan evidencia de una ganancia microsintética a gran escala en los cefalópodos coleoides.
una fotografía de una cría de Euprymna scolopes. b Árbol esquemático con tiempos de divergencia de los principales linajes de cefalópodos de deuterostomes y otros protostomes53,54. c Gráfica de Circos que muestra la pérdida de sintenias conservadas en otros metazoos y la aparición de una gran cantidad de nuevas microsintencias específicas de cefalópodos dentro de los cefalópodos. Cada línea representa un grupo sinténico compartido entre diferentes especies. Las líneas naranjas indican grupos sinténicos compartidos entre al menos siete de estas 24 especies (grupos de metazoos ancestrales); las líneas verdes representan nuevas sintenias de moluscos, compartidas entre cinco o más moluscos pero que no están presentes en ninguna especie que no sea de moluscos. Las líneas azules representan las sintenías específicas de los cefalópodos compartidas entre las tres especies de cefalópodos (azul oscuro) o dos de las tres especies de cefalópodos (azul claro), pero no presentes en ninguna especie que no sea cefalópodo; las líneas grises representan otras sintonías que no pertenecen a ninguna de las categorías anteriores. Abreviaturas: Aca - Acanthaster planci, Aqu - Amphimedon queenslandica, Bfl - Branchiostoma floridae, Cel - Caenorhabditis elegans, Cgi - Crassostrea gigas, Cmi - Callistoctopus minor, Cte - Capitella teleta, Dme - Drosophila melanogaster, Esc - Euprymna scolopes, Lgi - Lottia gigantea, Mle - Mnemiopsis leidyi, Mye - Mizuhopecten yessoensis, Nve - Nematostella vectensis, Obi – Octopus bimaculoides, Sko - Saccoglossus kowalevskii d Ejemplo de un armazón completo de escala cromosómica (derecha) de E. scolopes que muestra la distribución de la densidad genética, cefalópodo -sintencias de metazoos (naranja) específicas (azul) y conservadas. Recuadro (izquierda) con ubicaciones de genes dentro de dos bloques sinténicos específicos.
Tanto los bloques microsintéticos específicos de cefalópodos como los metazoarios conservados están presentes en 44 de los 46 andamios cromosómicos (con dos cromosomas que son demasiado pequeños para contener microsintéticos). Si bien algunos cromosomas tienen una mayor proporción de nuevos microsintéticos de cefalópodos (Fig. 1b, c complementaria), ambos tipos de microsintéticos se entremezclan en el genoma (Fig. 1d). Este resultado sugiere un mecanismo de todo el genoma para la aparición de nuevas microsyntenies. La gran mayoría de los genes de una sola copia (71 %) que comprenden 232 nuevas microsíntesis de cefalópodos se encuentran en diferentes cromosomas en la vieira M. yessoensis. Dado que la organización del genoma de Nautilus publicado recientemente12 es similar a la de otros moluscos, estos resultados sugieren que ocurrieron muchas translocaciones o fusiones a nivel cromosómico en el ancestro coleoide.
La microsíntesis de nuevos cefalópodos y metazoos conservados muestra diferentes propiedades genómicas. Las nuevas microsintencias de cefalópodos son, en promedio, más pequeñas que las microsintencias de metazoos que todavía están presentes en los genomas de cefalópodos (Fig. 2b complementaria), a pesar de tener un número similar de genes (Fig. 2c complementaria). Si bien los intrones de los genes en microsyntenies específicos de cefalópodos son más pequeños que los de los microsyntenies de metazoos, la mayoría de las diferencias de tamaño provienen de regiones intergénicas (~ 0,2 kb en comparación con ~ 7 kb de diferencia, respectivamente).
También encontramos evidencia de enriquecimiento diferencial de categorías funcionales entre los dos tipos de microsintenias. Las microsíntesis de metazoos6 están enriquecidas en componentes de la vía de señalización de la vía de señalización Wnt, transporte de neurotransmisores y exocitosis de vesículas sinápticas, señalización del receptor acoplado a proteína G, regulación negativa de la transcripción y vías de señalización de BMP, entre otras. Los genes en la nueva microsíntesis específica de cefalópodos, por otro lado, desempeñan un papel en la traducción, los procesos redox, la regulación de la entrada de calcio operada por el almacenamiento, la escisión del ARNm, el transporte y la organización de la cromatina (valores p <0.05) (Fig. 3).
La estructura tridimensional de la cromatina, incluidos los dominios topológicamente asociados (TAD), facilita las interacciones reguladoras distantes involucradas en la regulación génica13,14. Si bien hasta la fecha existen muy pocos datos sobre la organización topológica del genoma de los invertebrados, descubrimos que, en comparación con los datos conocidos para los tamaños de TAD de vertebrados, las distancias de interacción eran generalmente mayores en el calamar (Fig. 2a, b, Nota complementaria 4). Las herramientas de predicción de TAD (consulte "Métodos") revelan un tamaño medio de TAD de E. scolopes de 2,5 Mb, en comparación con un promedio de 1,2 Mb en humanos15. Además, la distribución de tamaños de TAD en E. scolopes fue considerablemente más amplia que en humanos, lo que sugiere una mayor variabilidad.
a Arriba: matriz de interacción normalizada Hi-C a una resolución de 100 kb para el andamio cromosómico 10. Abajo: recuento relativo de Hi-C y puntajes de límite TAD según lo predicho por tadbit (1 = más bajo, 10 = más alto). b Gráfica de violín de distribuciones de tamaño TAD para escolopes humanos y de Euprymna calculadas a una resolución de 100 kb, trazadas en contenedores de 100 kb. c Motivo de unión a CTCF identificado mediante la búsqueda de motivos homer en 100 kpb de los límites TAD predichos. d Exposición de la superficie del área del solvente (SASA) por pb para andamios cromosómicos individuales (observados y aleatorios). Sintenia metazoaria conservada en el eje x, microsintena específica de cefalópodo en el eje y. e Modelo tridimensional del andamio cromosómico 10 con ubicaciones de microsintencia novedosas (azul) y conservadas (amarillas) etiquetadas. Los modelos izquierdo y derecho son iguales, desplazados 90°.
En los vertebrados, la formación de TAD está mediada por proteínas, como CTCF y cohesina16,17. Inferimos que los mismos mecanismos, incluidos CTCF y las proteínas Smc1 y Smc3 del complejo de cohesina, están presentes en el genoma de E. scolopes y se conservan con otros animales, lo que sugiere que se pueden implementar mecanismos similares en los cefalópodos (Figura complementaria 4). También encontramos que los límites de TAD se enriquecen para un motivo similar a CCCTC 18,19,20 que recuerda a un sitio de unión de CTCF (Fig. 2c, p = 1e-12, "Métodos", Nota complementaria 4).
Varios estudios sugirieron la posibilidad de correspondencia entre la microsintencia y los dominios reguladores en los genomas de los metazoos4,5,7,8,21,22,23. Para comprender la relación de microsyntenies y TAD, comparamos la localización de bloques microsyntenic calculados aleatoriamente, que siguen las mismas propiedades que nuestros bloques observados pero se distribuyen aleatoriamente en todo el genoma con los microsyntenies observados ("Métodos"). Encontramos una tendencia de las microsintencias de metazoos conservadas a localizarse hacia el centro de los TAD predichos, mientras que las nuevas microsintencias de cefalópodos parecen estar distribuidas de manera más uniforme (Fig. 3a).
a Relación entre las densidades del centro de ubicaciones microsintéticas observadas y aleatorias dentro de TAD normalizados. La relación aumenta hacia el centro de los TAD para las sintenias de metazoos y disminuye para las sintenias de cefalópodos. b Compacidad de la microsíntesis de nuevos y metazoos, en comparación con simulaciones aleatorias. Los grupos microsintéticos deben contener al menos 3 genes; si se anotaron menos genes en el árbol, estos grupos se excluyeron. Se representan gráficamente las proporciones entre el número de contenedores (a una resolución Hi-C de 40 kb, contenedores de microsintencia de cefalópodos n = 143 969, contenedores de microsintencia de metazoos n = 82 417, contenedores de microsintencia de cefalópodos aleatorios n = 3 499 849, contenedores de microsintencia de metazoos aleatorios n = 1 889 687) en microsintético clústeres (dentro de 7 y 25 contenedores, microsyntenies válidos: cefalópodo n = 265, metazoo n = 125, cefalópodo aleatorio n = 4265, metazoo aleatorio n = 2180) y el número de contenedores "descendientes" del último ancestro común de esos contenedores microsintéticos ("Métodos", cefalópodo n = 143 969, metazoo n = 82 417, cefalópodo aleatorio n = 3 499 849, metazoo aleatorio n = 1 889 687). La relación (n = 6835) del número de contenedores en un grupo y el número de contenedores en el subárbol se compararon mediante la prueba de suma de rangos de Wilcoxon de dos colas comparando los grupos vinculados (****p < 0.0001, * < 0,05, ns: no significativo). Cuanto más se acerque la relación a 1, menor será la diferencia entre el tamaño del bloque sinténico y el número de contenedores en un árbol extraído. Gráficos de violín: distribución, cajas: rango intercuartílico (cefalópodo = 0,06 inferior, 0,56 superior, metazoario = 0,01 inferior, 0,58 superior, cefalópodo aleatorio = 0,01 inferior, 0,49 superior, metazoario aleatorio = 0,01 inferior, 0,46 superior), barras: mediana (cefalópodo = 0,31, metazoo = 0,28, cefalópodo aleatorio = 0,18, metazoo aleatorio = 0,17), bigotes: muestra más alejada dentro de un rango intercuartílico de 1,5x (cefalópodo = mín 0,002, máx 0,94, metazoo = mín 0,002, máx 0,95, cefalópodo aleatorio = mín 0,002, max 0,96, metazoario aleatorio = min 0,002, max 0,96), proporciones máximas y mínimas: cefalópodo = min 0,00189, max = 0,941, metazoan = min 0,00217, max = 0,952, cefalópodo aleatorio = min 0,00151, max 0,962, metazoan aleatorio = min 0,00150 , máx. 0,96. c Correlación de coexpresión de genes en grupos microsintéticos (cefalópodo n = 476, metazoo n = 236, cefalópodo aleatorio n = 6925, metazoo aleatorio n = 4038). La correlación de coexpresión de las sintenias de metazoos es mayor que la de las sintenias específicas de cefalópodo o los grupos aleatorios (****p < 0,0001, ***p < 0,001, * < 0,05). Gráficos de violín—distribución, cajas—muestra más alejada dentro de un rango intercuartílico de 1,5x (cefalópodo = min −0,69, max 0,87, metazoo = min −0,63, max 1,0, cefalópodo aleatorio = min −0,72, max 0,95, metazoo aleatorio min −0,66, max 0,9), barras: mediana (cefalópodo = 0,05, metazoo = 0,15, cefalópodo aleatorio = 0,07670835, metazoo aleatorio = 0,07) se excluyeron los valores atípicos de estos números. Valores máximos y mínimos: −1 y 1 en todos los casos. d Agrupamiento de la expresión media por grupo de sintenia, codificado por colores por tipo de sintenia, expresión entre tejidos adultos de Euprymna scolopes. Los grupos sinténicos forman ocho módulos de expresión con patrones de expresión específicos. La matriz de expresión está normalizada con puntuación z. Órgano de luz—E. Órgano específico de los escólopes que alberga simbiontes, glándula nidamental accesoria: órgano reproductivo específico de la hembra de algunas especies de calamar. e Anotación de la ubicación del pico de ATAC en la organogénesis tardía. Los picos anotados como asociados con microsyntenies específicos de cefalópodos se encuentran con mayor frecuencia en regiones intrónicas. Promotor definido como sitio de inicio de transcripción predicho de +10 kb y -10 kb.
Para estudiar más a fondo las relaciones de las regiones genómicas y sus interacciones independientemente de las predicciones de TAD, calculamos una estructura de árbol que refleja la organización de cada andamio cromosómico ("Métodos", Nota complementaria 4). Cada rama bifurcada refleja las relaciones de las regiones genómicas en la intensidad de la señal Hi-C, lo que nos permite rastrear las intensidades de interacción en microsyntenies (Fig. 3b). Sorprendentemente, descubrimos que es más probable que las nuevas microsintencias formen regiones de interacción estrecha, reflejadas por subárboles con pocas ramas, en comparación con las sintenias muestreadas al azar (Fig. 3b). Este resultado indica niveles significativamente más altos de compartimentación tanto en cefalópodos como en microsintencias ancestrales.
Motivado por la importancia de la arquitectura del genoma tridimensional y la colocalización microsintética en los escolopes de Euprymna, se realizó un modelado tridimensional basado en matrices de interacción Hi-C ("Métodos", Fig. 5 complementaria, Nota complementaria 5) para proporcionar un análisis más profundo. comprensión de las propiedades espaciales y co-localización de regiones microsintéticas nuevas y antiguas dentro de andamios cromosómicos modelados. Los modelos tridimensionales revelaron que las nuevas microsintencias de cefalópodos tienen propiedades espaciales distintas de las antiguas microsintencias. En particular, ambos tipos de synteny mostraron una accesibilidad diferencial a los solventes en algunos cromosomas en comparación con las distribuciones aleatorias (Fig. 2d). Además, las nuevas microsíntesis de cefalópodos estaban, en promedio, menos enterradas, cubriendo así una mayor proporción de la superficie cromosómica (Fig. 6 complementaria). Este resultado contrastó con las microsíntesis de metazoos conservadas, que tienden a participar en la formación del núcleo cromosómico (Fig. 2e, Fig. 6 complementaria). Dado que los nuevos microsyntenies son transcripcionalmente activos (Fig. 3, ver más abajo), su ubicación en la superficie cromosómica puede reflejar una regulación intercromosómica altamente dinámica, además de ser más accesible a los factores de transcripción.
El contenido de GC de la microsíntesis específica de metazoos y cefalópodos se evaluó junto con las predicciones de los compartimentos A/B basados en la matriz de interacción Hi-C ("Métodos"). El análisis no proporcionó pruebas suficientes de que uno de los tipos microsintéticos fuera más frecuente en ninguno de los compartimentos. Hasta que no haya más datos experimentales disponibles (como perfiles de metilación y acetilación) para los scolopes de Euprymna, no podemos inferir con precisión la distribución de la microsíntesis específica de cefalópodos y metazoos dentro de los compartimentos A/B.
En conjunto, la fuerte conservación genómica entre los cefalópodos secuenciados, el empaquetamiento comparablemente ajustado (distancias cortas entre genes) de los grupos microsintéticos y su asociación frecuente con subcompartimentos definidos dentro de los TAD detectados sugiere una fuerte presión selectiva para mantener las propiedades reguladoras de las nuevas unidades microsintéticas en el cefalópodo. genomas
La coexpresión de genes sinténicos es una propiedad importante que puede reflejar su regulación. Los genes en microsyntenies específicos de cefalópodos no tienden a coexpresarse, a pesar de su estrecha coubicación ("Métodos", Nota complementaria 7). Cuando se compara con grupos de genes muestreados aleatoriamente que siguen una distribución similar a las nuevas microsíntesis observadas, el coeficiente medio de coexpresión es incluso ligeramente más bajo en los datos observados (prueba de Wilcoxon, p ≤ 0.05, Fig. 3c). Por el contrario, las microsintencias de metazoos conservadas muestran una coexpresión significativa (prueba de Wilcoxon, p ≤ 0.001) en comparación con las microsintencias simuladas (Fig. 3c). Este resultado indica que los genes en la microsintencia de metazoos tienden a coexpresarse en un conjunto definido de tejidos, similar a hallazgos previos para la microsintencia de metazoos antiguos8. También se observó un patrón similar para la coexpresión de microsyntenies de metazoos nuevos y conservados en O. bimaculoides (Fig. 7a complementaria). Ningún tipo de microsintencia mostró enriquecimiento de expresión-especificidad en un tejido particular24.
Para categorizar aún más los perfiles de expresión, investigamos la expresión promedio de las regiones sinténicas. Este análisis mostró patrones complejos que se dividieron en ocho módulos de expresión distintos en tejidos adultos de E. scolopes (Fig. 3d, "Métodos", Nota complementaria 7). Aunque la mayoría de los módulos tenían proporciones similares de ambos tipos de microsintencia, algunos grupos formaron valores atípicos. Por ejemplo, el módulo 8 mostró una expresión específica del ojo y estuvo dominado principalmente por la microsíntesis de metazoos. Curiosamente, los grupos que abarcan múltiples tejidos nerviosos, en particular los módulos 2 y 4, se enriquecieron en nuevos microsyntenies de cefalópodos (valores p de la prueba exacta de Fisher ≤0.02 y ≤1e−07, respectivamente). Sus ortólogos se expresaron de manera similar en los tejidos nerviosos de O. bimaculoides, con nuevas microsíntesis que dominan en los módulos asociados con la expresión cerebral más fuerte (Fig. 7b complementaria). Sin embargo, la correspondencia general del módulo se vio afectada por la diferencia en el muestreo de tejido (Fig. 7c complementaria).
A continuación, queríamos investigar si estos patrones de expresión están sesgados debido a un solo gen altamente expresado por bloque sinténico. La gran mayoría de los bloques microsintéticos (76 %, Fig. 8b complementaria) tienen un gen que contribuye a más del 50 % de la expresión acumulada. Luego calculamos los niveles de expresión relativos en los tejidos por gen y los promediamos para cada bloque, lo que demuestra que se conservan las identidades generales del módulo de expresión (Fig. 8a complementaria). En general, la variación de la expresión se correlaciona con la expresión absoluta de genes (Fig. 8c complementaria). Sin embargo, en algunas sintenias de metazoos, especialmente en los tejidos que definen un módulo, la varianza fue baja, lo que indica mayores restricciones de coexpresión (Fig. 8c complementaria).
Juntos, estos resultados resaltan la contribución del dominio de expresión complejo de las regiones microsintéticas e identifican una discrepancia en la dinámica de coexpresión entre microsyntenies nuevos de cefalópodos y metazoos. Esta escasez de coexpresión en microsyntenies de cefalópodos indica un modo potencialmente diferente de su regulación génica.
Los módulos de expresión mostraron firmas específicas de motivos reguladores asociados con ellos. Predijimos las regiones reguladoras utilizando el ensayo de datos de cromatina accesible por transposasa (ATAC-seq25) de un curso de tiempo de desarrollo ("Métodos", Nota complementaria 9). Los picos predichos asociados con cada grupo de expresión se analizaron más a fondo para determinar el enriquecimiento del motivo del factor de transcripción conocido, por separado para los cefalópodos y la microsíntesis antigua ("Métodos", Datos complementarios 2). Encontramos que el módulo 2 de microsíntesis de cefalópodos, que está asociado con múltiples tejidos nerviosos, se enriqueció con los motivos de unión de factores de transcripción Chop26, E2F127, NeuroG228, COUP-TFII29, Atf430 involucrados en la diferenciación del sistema nervioso y los factores de transcripción del desarrollo ZBTB18, Esrrb, Tcf21 , Pitx1, GATA en las tres etapas de desarrollo (p < 1e−3). El módulo 4 se enriqueció de manera similar en motivos de unión a factores de transcripción involucrados en el sistema nervioso y el desarrollo general, como Tcf3, TCFL2, GATA, Tcf21 y Pitx1 en las tres etapas de desarrollo (p < 1e−3). Esto sugiere un esquema regulador común responsable de la expresión génica en cada uno de los módulos de expresión y una asociación de esos motivos con la nueva microsíntesis de cefalópodos.
Para complementar nuestros datos de ATAC-seq, realizamos alineaciones del genoma completo entre los genomas de cefalópodos disponibles utilizando diferentes umbrales de similitud y longitud de alineación ("Métodos", Nota complementaria 8, Tabla complementaria 5 y Figura complementaria 9). Esto ayudó a identificar elementos no codificantes (CNE) conservados potenciales y su asociación con cuerpos genéticos y topología del genoma ("Métodos", Fig. 10 complementaria, Nota complementaria 8). Debido a la distancia evolutiva entre los linajes de calamares y pulpos, nuestro enfoque arrojó solo 1187 candidatos CNE de cefalópodos coleoides con un umbral de similitud de 0,95 y un tamaño mínimo de 100 pb (Tabla complementaria 5), de los cuales 613 podrían localizarse en características genéticas ( Figura complementaria 10a-c). 139 se asociaron con nuevas microsintencias de cefalópodos (dentro o dentro de 1 kb de microsintencia), 73 con metazoos dentro o dentro de 1 kb de microsintencia) y 401 se ubicaron fuera de cualquier sintenía (Fig. 10b complementaria). Solo 12 de los 1187 candidatos se superpusieron con los picos de ATAC-seq (Tabla complementaria 5). Para los CNE compartidos entre los genomas de calamar, encontramos 42920 CNE putativos con un umbral de similitud de 0.95 y un tamaño mínimo de 100 pb (Tabla complementaria 5), de los cuales 13889 podrían localizarse en características genéticas (Figura complementaria 10a-c). 2444 se asociaron con una nueva microsíntesis de cefalópodos (dentro o dentro de 1 kb de microsíntesis), 3255 con metazoan synteny y 8190 se ubicaron alrededor de genes fuera de cualquier synteny (Figura complementaria 10c). De manera similar, muy pocos se superpusieron con los picos de ATAC (14). Por lo tanto, el papel regulador de estas regiones sigue sin estar claro.
Una contribución potencial a esta observación podría ser la alta rotación evolutiva de las regiones reguladoras dentro del linaje del calamar, lo que disminuye la información obtenida de las inferencias basadas en la conservación/alineación del genoma. Los genomas de los cefalópodos son grandes y más del 50 % de la longitud del genoma se atribuye a elementos repetitivos2,3. Por lo tanto, evaluamos la composición de elementos transponibles de los picos ATAC-seq asociados con grupos microsintéticos. Ambos tipos de microsintencia mostraron un contenido de repetición promedio del 40%. Las secuencias máximas de ATAC-seq en microsyntenies de cefalópodos en E. scolopes mostraron un contenido elevado de elementos repetitivos del 82 % y se asociaron más frecuentemente con elementos LINE/CR1-Zenon (44 %, en comparación con 35 % en picos microsyntenic de metazoos). La expansión LINE/CR1 se identificó como la clase de elemento repetido más común y específicamente expandida en el linaje del calamar (E. scolopes)3.
La colocalización de genes conservados puede explicarse por regiones reguladoras dentro de un gen vecino, aunque la función del gen puede no estar relacionada (el escenario del espectador), formando juntos un bloque regulador genómico (GRB)4,5, o mediante elementos reguladores compartidos controlando la expresión de todos los genes sinténicos, lo que resulta en una mayor coexpresión8. Nuestro enfoque de microsintencia es agnóstico a esta distinción, centrándose en cualquier colocalización conservada de tres o más genes. Por lo tanto, podemos utilizar nuestros datos para perfilar de forma independiente la propensión de las microsíntesis de metazoos o cefalópodos para corresponder a modelos microsintéticos funcionales conocidos. La ubicación de los picos de ATAC-seq dentro de los grupos microsintéticos revela que las regiones de cromatina abierta asociadas con la microsintética específica de los cefalópodos se encontraron con más frecuencia en los intrones que los picos encontrados en la microsintética metazoaria conservada u otros genes no sintéticos (Fig. 3e, prueba exacta de Fisher p < 1e−5). Curiosamente, si bien comparte poca superposición, la distribución de CNE, en particular de los CNE compartidos entre los calamares, mostró una localización significativa hacia las regiones distales en las sintenias de metazoos (prueba exacta de Fisher p < 2.2e-16) (Fig. 10 complementaria). Este resultado indica que, a diferencia de las microsintéticas más conservadas, las microsintéticas de cefalópodos novedosas son más similares al escenario GRB, en particular el modelo espectador, en el que los potenciadores putativos se encuentran dentro de genes (espectadores) ubicados de cerca dentro del mismo grupo microsintético y pueden carecer potencialmente de distal dominios regulatorios. Esta observación también puede complementar el hallazgo de una coexpresión más débil de genes microsintéticos en microsintéticos específicos de cefolópodos, en comparación con microsintéticos conservados más antiguos.
Dada esta información, buscamos investigar más la función potencial de microsyntenies de cefalópodo novedosos en los módulos de expresión 2 y 4 que mostraron la mayor contribución a los dominios de expresión de tejido neuronal. Estas microsintencias pueden considerarse un conjunto de prueba útil de microsintencias funcionales que estuvieron involucradas en la evolución del sistema nervioso de los cefalópodos. Por lo tanto, examinamos el reordenamiento genómico, el panorama regulatorio y la expresión de genes dentro de una de las microsíntesis representativas específicas de cefalópodo del módulo de expresión 2. Fue uno de los grupos con el mayor número de genes, que codifican la proteína de transferencia de fosfato de ceramida-1. , fenilalanina-tRNA ligasa, subunidad 3B del factor de empalme, subunidad del complejo integrador y proteína de unión a proteína amiloide. Los ortólogos de esta microsintonia estaban ampliamente distribuidos en dos cromosomas en la vieira (Fig. 4a), pero estaban densamente empaquetados en el genoma de E. scolopes casi sin espacio intergénico y algunos picos ATAC dominantes hacia un extremo del grupo en el intrón de fenilalanina -tRNA ligasa (Fig. 4b). Similar a la tendencia general, este agrupamiento en cefalópodos implica varias translocaciones locales o una fusión cromosómica a gran escala, seguida de reordenamientos. El grupo se localizó hacia el centro del TAD predicho (Fig. 4b), cerca de otra unidad microsintética novedosa (del mismo módulo de expresión). Juntas, estas dos unidades forman un compartimento de alta densidad de interacción Hi-C, separado del compartimento microsintético de metazoos más cercano y sus picos ATAC asociados (Fig. 4b). En nuestro modelo cromosómico tridimensional, esta microsíntesis también se encontró en la superficie del andamio cromosómico 2 (Fig. 4c). Curiosamente, los genes en este grupo muestran expresión del sistema nervioso tanto en vieiras como en E. scolopes (Fig. 5a, Nota complementaria 10). A pesar de que algunos de estos genes se consideran genes puramente metabólicos o domésticos, en los vertebrados se sabe que desempeñan un papel importante en el desarrollo y la actividad del sistema nervioso31,32,33,34,35. Realizamos hibridación in situ para visualizar la expresión génica durante el desarrollo en embriones de E. scolopes y confirmamos la expresión en todas las principales regiones centrales del cerebro (Fig. 5b, c, Nota complementaria 11). Sin embargo, también revelamos expresión en otros tejidos y órganos de cefalópodos novedosos, como los cordones nerviosos axiales, así como el corazón y las branquias (Fig. 5b, c, Fig. 11 complementaria). Este resultado proporciona evidencia de que este grupo de microsintéticos y sus hermanos del módulo de expresión 2 podrían comprender microsintéticos funcionales del tipo de modelo espectador que contribuyeron de manera crucial a la aparición de nuevos dominios de expresión de cefalópodos. De manera más general, la observación de microsyntenies asociados con las innovaciones de cefalópodos (MACI) y su investigación adicional podría ayudar a diseccionar la evolución de patrones complejos de expresión de tejidos de cefalópodos.
a Ubicación de genes ortólogos de uno de los MACI en Mizuhopecten yessoensis. Los genes están ubicados en dos cromosomas separados (arriba: cromosoma completo, abajo: zoom, negro: densidad de genes, azul: ubicación de genes ortólogos) con muchos genes intermedios en el medio. Los ortólogos festoneados de genes en el grupo microsintético se trazan en la parte inferior resaltados en azul. b Genes del mismo grupo en Euprymna scolopes. Los genes (resaltados en azul) están estrechamente empaquetados en un andamio cromosómico con un solo gen intermedio (arriba: andamio cromosómico completo, abajo: ampliar, naranja: grupos microsintéticos de metazoos conservados, azul: grupos microsintéticos específicos de cefalópodos). El clúster se encuentra dentro de un TAD. Dos picos principales de ATAC-seq están presentes en las regiones intrónicas del último gen del grupo en tres etapas de desarrollo (eje y: valor de la señal). El recuento de lecturas de RNA-seq de tres etapas de desarrollo muestra varios picos pequeños en la región del grupo (eje y: recuento de lecturas). Etapa temprana: organogénesis temprana, etapa 20, etapa intermedia: organogénesis tardía, etapa 24/25, etapa tardía: cerca de la eclosión, etapa 28/29. c Reconstrucción tridimensional del andamio cromosómico 2. El grupo sinténico específico de cefalópodo se encuentra en la superficie. Las vistas izquierda y derecha se desplazan 90°.
un mapa de calor que muestra la expresión de genes ortólogos del grupo específico de cefalópodos en vieiras adultas y tejidos de E. scolopes que muestran expresión neuronal en ambas especies. La barra de escala muestra los niveles de expresión normalizados de puntuación z por fila. b Esquema de la etapa tardía (etapa 27–29) E. anatomía del scolopes y sección de la cría. c Expresión de genes MACI en tejidos nerviosos y órganos internos de las últimas etapas de desarrollo de E. scolopes. Todos los genes muestran expresión en diferentes lóbulos del cerebro, más predominantemente ASM y PSM. Los patrones de expresión de luz están presentes en los lóbulos ópticos, la glándula digestiva y los intestinos en la mayoría de los genes. Los patrones de expresión difieren de la beta-tubulina, que se eligió como control para su dominio de expresión panneuronal, en su intensidad y distribución. Barras de escala = 100 μm. Masa subesofágica anterior ASM, glándula digestiva DG, esófago ES, órgano embudo FT, branquias GI, intestino INT, saco de tinta IS, yema interna IYO, lóbulo óptico OL, masa subesofágica posterior PSM, estatocisto ST. Círculos punteados: reventado de colores.
En resumen, presentamos un estudio completo de la organización topológica y reguladora del genoma en un cefalópodo coleoide. Caracterizados por interacciones de rango de megabase, los genomas de cefalópodos se han visto afectados por una reorganización sinténica de todo el genoma, en un grado que es raro entre los genomas animales. Esta reorganización condujo a la obtención de cientos de microsíntesis específicas de cefalópodos que están asociadas con regiones topológicas compactas y un modo distinto de regulación génica. Sus supuestas secuencias reguladoras a menudo se ubicaban dentro de los intrones de genes dentro del mismo grupo microsintético, como se ha propuesto para el enlace de genes funcionales en el modelo espectador. Nuestro análisis de los datos de expresión microsinténicos reveló patrones de expresión complejos de microsintéticos novedosos asociados con un conjunto específico de tejidos neurales de cefalópodos y otros órganos novedosos. Identificamos dos de estos módulos de expresión más afectados por la aparición de nuevos microsyntenies de cefalópodos, cada uno asociado con una firma reguladora específica. Proponemos que este "bloqueo" sinténico, es decir, alta compacidad y racionalización regulatoria, fue responsable de la aparición y extensión de dominios de expresión de tejido neural de moluscos ancestrales. Dado que gran parte de la biología molecular de los cefalópodos sigue siendo esquiva, nuestro estudio propone el uso de estas microsíntesis asociadas con las innovaciones de los cefalópodos (MACI) para comenzar a desentrañar los cambios moleculares asociados con las innovaciones del desarrollo y del organismo de los cefalópodos. Este estudio sienta las bases para una mayor investigación de los MACI y sus funciones en la aparición de nuevos dominios de expresión e innovaciones orgánicas en los cefalópodos.
Los huevos de E. scolopes se obtuvieron de cultivos y se mantuvieron en el zoológico de Viena o en el Laboratorio de Biología Marina. Todo el trabajo se realizó de conformidad con la Directiva de la UE 2010/63/UE sobre el uso de cefalópodos y las directrices de la AAALAC sobre el cuidado y el bienestar de los cefalópodos36. Los adultos de E. scolopes desovaron naturalmente en sus tanques, y los embriones se recolectaron poco después del desove y se mantuvieron en un sistema de acuario cerrado lleno de agua de mar artificial. Los embriones se desarrollaron hasta la etapa adecuada y se anestesiaron con etanol al 2 % antes de su uso37,38,39.
La preparación de la muestra Hi-C se realizó como se describe en la Nota complementaria 2. Brevemente, las muestras Hi-C se generaron en la etapa de desarrollo 2740 con 30 embriones combinados usando la enzima de restricción de seis bases Hind3. La secuenciación de extremos emparejados de 50 pb se realizó en un Illumina HiSeq2500. Las lecturas Hi-C se alinearon con el genoma de referencia (excluyendo los andamios <50k), lo que resultó en más de 106 millones de pares de interacción válidos (tasa de alineación ~71%). Se usaron lecturas alineadas para montar el genoma en andamios cromosómicos. Las estadísticas de ensamblaje se resumen en la Nota complementaria 2. Las lecturas de Hi-C sin procesar se asignaron nuevamente a los nuevos andamios cromosómicos, recuperando más de 106 millones de pares de interacción válidos (tasa de alineación ~ 71%). El modelado tridimensional de andamios cromosómicos se describe en la Nota complementaria 3. Para muestras humanas, las muestras Hi-C de linfoblastoides B se descargaron de NCBI (ref. 41, SRR1658570, HIC001) y se alinearon con el genoma de referencia humano (GRCh38.p12 ) obteniendo más de 144 millones de pares de interacción válidos (~73 % de tasa de alineación).
La ortología de genes se reconstruyó utilizando 27 especies que abarcan todos los principales clados de metazoos. La microsintencia se calculó utilizando herramientas internas como se describe en detalle en la Nota complementaria 3. La sintenía de metazoos se definió como todos los bloques sinténicos compartidos entre al menos otras siete especies. La nueva sintenía específica de los cefalópodos se definió como la sintenía compartida entre E. scolopes y al menos una especie de pulpo. Las microsintencias aleatorias se modelaron según la distribución de las sintenías observadas como se describe en la ref. 8 para 20 iteraciones. Los detalles adicionales de los scripts y los pasos se encuentran en la Nota complementaria 3.
Los TAD para E. scolopes y Human se llamaron con Tadbit42 con el algoritmo Tadbit y con HiCExplorer43. Se promediaron los TAD de E. scolopes y se cartografió la ubicación de la mitad de cada grupo sinténico para analizar la distribución de syntenies dentro de los TAD. Si las sintenias abarcaban varios TAD, solo se consideraba el TAD que mapeaba la mitad de esa sintenia. Para analizar aún más la topología de los grupos microsintéticos, se utilizó la matriz de interacción Hi-C normalizada para agrupar cada contenedor con su vecino más cercano por la fuerza de interacción del contenedor. De esa manera se reconstruyó un cladograma de interacción para cada cromosoma. Para comprender qué tan bien se define una región sinténica por sus interacciones, extrajimos el último ancestro común de esa región (es decir, los contenedores en esa región) del árbol completo que forma el cromosoma. Luego, se calculó la proporción entre esos subárboles y el número de contenedores en un grupo sinténico y se probaron las diferencias entre los grupos mediante la prueba de Wilcoxon.
El centro de cada grupo sinténico se localizó dentro de los límites TAD previstos. Luego, las ubicaciones se normalizaron y trazaron para microsyntenies observados y aleatorios. Para visualizar las diferencias entre lo observado y lo aleatorio, se calculó y representó la relación entre las densidades de cada uno en ubicaciones TAD normalizadas (Fig. 3a). Una densidad superior a uno significa un enriquecimiento de la sintenía observada en comparación con los grupos aleatorios. Una densidad inferior a uno significa una señal agotada de synteny observada en comparación con los grupos aleatorios. Random synteny representa grupos muestreados de la distribución de bloques observados de ubicaciones aleatorias en el genoma.
Los coeficientes de coexpresión para tejidos adultos de E. scolopes y O. bimaculoides se calcularon como se describe en la ref. 8. En la Nota complementaria 7 se proporciona una descripción detallada de los pasos.
Los genomas de E. scolopes y O. bimaculoides y de E. scolopes y A. dux se alinearon con megablasto, utilizando E. scolopes como secuencia de consulta. Se usaron cinco configuraciones diferentes para las puntuaciones de similitud de BLAST44 (-perc_identity): 0 %, 70 %, 80 %, 95 % y 98 % (Figuras complementarias 9, 10, Tabla complementaria 5, ver refs. 4, 7, 45, 46). Para obtener más configuraciones, consulte la Nota complementaria 8. Las regiones de mapeo múltiple se excluyeron si se superponían en más del 50% y ocurrían más de 3 veces usando el mapa de cama BEDOPS47. bedmap --count --echo --fraction-both 0.5 --delim '\t' prefiltered_megablast.bed | awk '$1<4' | cut -f2- |clasificar-cama - | único Las regiones superpuestas restantes se fusionaron con bedops –merge. Se excluyó cualquier región que se superpusiera con un exón en 1 pb o más mediante la sustracción de bedtools48. Para excluir regiones repetitivas, se extrajeron secuencias fasta de las supuestas ubicaciones CNE filtradas y se usó la función de polvo (corte 10) de meme's49 para enmascarar las repeticiones. Además, se crearon dos conjuntos de datos para cada puntaje de similitud con un tamaño mínimo de 100 pb o 50 pb, respectivamente. Para puntajes de similitud de 0%, solo se mantuvieron regiones de 100 pb. Se excluyó cualquier región con más del 25% de Ns. Para eliminar las secuencias de codificación restantes, las supuestas secuencias CNE restantes se contrastaron con la base de datos NCBI50 NR y se eliminaron las regiones que se solapaban con una coincidencia BLAST.
La preparación y el análisis de las muestras de ATAC-seq se describen en la Nota complementaria 9. Se generó ATAC-seq para las etapas 20, 25 y 28/2940 con dos réplicas biológicas cada una, como se describe en las refs. 25,51,52 con ligeras modificaciones. Cada biblioteca ATAC-seq se generó con dos réplicas de muestras biológicas. Las muestras se secuenciaron en Illumina HiSeqV4 utilizando lecturas de extremos emparejados de 125 pb. Las lecturas se recortaron con BBDuk (https://jgi.doe.gov/data-and-tools/bbtools/bb-tools-user-guide/bbduk-guide/) y se asignaron a los andamios cromosómicos. Los picos se llamaron con Genrich (https://github.com/jsh58/Genrich). Después de recortar, quedaron entre 72 y 143 millones de lecturas que se mapearon entre el 79 y el 83 % y se llamaron entre 22 443 y 36 933 picos para cada muestra.
Los embriones de E. scolopes extraídos de los huevos y las capas de gelatina y las crías se anestesiaron en EtOH al 4 % en agua de mar o EtOH al 4 % y MgCl2 (solución 2 M añadida lentamente al agua de mar) y posteriormente se fijaron en paraformaldehído al 4 %38. Las secuencias de interés se identificaron a partir de los transcriptomas adultos de E. scolopes. El ADNc de las etapas de desarrollo agrupadas se usó para PCR con polimerasa Q5. Los productos se clonaron en vectores pjet y se aislaron con un kit innuPREP Plasmid Mini (Analytik jena (Jena, Alemania)) y se secuenciaron. Las ribosondas se generaron a partir de minipreparaciones amplificadas y se transcribieron inversamente con nucleótidos marcados con DIG. Los detalles sobre el protocolo FISH e ISH se pueden encontrar en la Nota complementaria 11. Se tomaron imágenes de embriones y crías en un microscopio de barrido láser confocal multifotónico Zeiss (Oberkochen, Alemania) LSM 780 invertido.
Más información sobre el diseño de la investigación está disponible en el Resumen de informes de investigación de Nature vinculado a este artículo.
Los datos que respaldan este estudio están disponibles de los autores correspondientes previa solicitud razonable. Los datos de Hi-C y ATAC-seq se han depositado en la base de datos NCBI bajo Bioproject PRJNA661684. Todos los datos de expresión, ATAC-seq y CNE que se asignan al genoma de referencia están disponibles en un navegador de genomas (actualmente, http://metazoa.csb.univie.ac.at:8000/euprymna/jbrowse o previa solicitud). Todos los demás datos genómicos y transcriptómicos utilizados se descargaron de NCBI (GCA_002113885.2, GCA_000002075.2, GRCh38.p12, GCA_001949145.1 OLI-Apl_1.0, GCA_000003605.1, GCA_000224145.2, GCA_0000038 15.1 Versión 2, GCA_004765925.1 , Spur_3.1, GRCm38.p6, SAMN00691532, SAMN00152410), ENSEMBL (BDGP6.28 http://www.ensembl.org/Drosophila_melanogaster/Info/Index, WBcel235 http://m.ensembl.org/Caenorhabditis_elegans/Info/ Anotación, Capitella_teleta_v1.0 http://metazoa.ensembl.org/Capitella_teleta/Info/Index, ASM23792v2 http://metazoa.ensembl.org/Schistosoma_mansoni/Info/Index, oyster_v9 http://metazoa.ensembl.org/Crassostrea_gigas /Info/Index, Helro1 http://metazoa.ensembl.org/Helobdella_robusta/Info/Index, Lotgi1 http://metazoa.ensembl.org/Lottia_gigantea/Info/Index, PRJNA270931 https://metazoa.ensembl.org/ Octopus_bimaculoides/Info/Index, Stegodyphus_mimosarum_v1 [https://metazoa.ensembl.org/Stegodyphus_mimosarum/Info/Index], Tcas5.2 [http://metazoa.ensembl.org/Tribolium_castaneum/Info/Index, AMS_PRJEB1171_v1 [https:/ /metazoa.ensembl.org/Adineta_vaga/Info/Index, GRCh37.p13 https://grch37.ensembl.org/Homo_sapiens/Info/Index, ASM20922v1 https://metazoa.ensembl.org/Nematostella_vectensis/Info/Index, Aqu1 https://metazoa.ensembl.org/Amphimedon_queenslandica/Info/Index, MneLei_Aug2011 http://metazoa.ensembl.org/Mnemiopsis_leidyi/Info/Index) o GIGA (PRJNA421033 https://www.ebi.ac.uk/ena /navegador/vista/PRJNA421033). Los datos humanos de Hi-C se descargaron de NCBI (SRR1658570, HIC001). Se puede acceder a los archivos y tablas procesados necesarios para recrear las figuras a través de un repositorio de bitbucket: https://bitbucket.org/hannahschm/ceph_regulation_microsynteny/. Los datos de origen se proporcionan con este documento.
Todos los protocolos bioinformáticos estarán disponibles en https://bitbucket.org/hannahschm/ceph_regulation_microsynteny/ con configuraciones detalladas para cada programa y scripts de ejemplo. Se puede acceder al script C++ para estructuras 3D de cromosomas individuales previa solicitud a T. Clarence ([email protected]).
Ritschard, EA et al. Historias evolutivas genómicas acopladas como firmas de innovaciones orgánicas en cefalópodos: las firmas coevolutivas en todos los niveles de organización del genoma pueden arrojar luz sobre el vínculo funcional y el origen de las novedades de cefalópodos. BioEssays N. Rev. Mol. Celúla. desarrollo Biol. 41, e1900073 (2019).
Google Académico
Albertín, CB et al. El genoma del pulpo y la evolución de las novedades neurales y morfológicas de los cefalópodos. Naturaleza 524, 220–224 (2015).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Belcaid, M. et al. Órganos simbióticos formados por distintos modos de evolución del genoma en cefalópodos. proc. Academia Nacional. ciencia EE. UU. 116, 3030–3035 (2019).
Artículo CAS PubMed PubMed Central Google Scholar
Engström, PG, Ho Sui, SJ, Drivenes, O., Becker, TS y Lenhard, B. Los bloques reguladores genómicos subyacen a la conservación extensiva de microsintesis en insectos. Genoma Res. 17, 1898-1908 (2007).
Artículo CAS PubMed PubMed Central Google Scholar
Irimia, M. et al. Conservación extensiva de la microsintética antigua a través de los metazoos debido a restricciones regulatorias en cis. Genoma Res. 22, 2356–2367 (2012).
Artículo CAS PubMed PubMed Central Google Scholar
Simakov, O. et al. Información sobre la evolución bilateral a partir de tres genomas espiralianos. Naturaleza 493, 526–531 (2013).
Artículo ADS CAS PubMed Google Scholar
Kikuta, H. et al. Los bloques reguladores genómicos abarcan múltiples genes vecinos y mantienen la sintenía conservada en los vertebrados. Genoma Res. 17, 545–555 (2007).
Artículo CAS PubMed PubMed Central Google Scholar
Zimmermann, B., Robert, NSM, Technau, U. y Simakov, O. La arquitectura del genoma animal antiguo refleja las identidades de los tipos de células. Nat. Ecol. Evol. 3, 1289–1293 (2019).
Artículo PubMed Google Académico
McFall-Ngai, MJ & Ruby, EG Reconocimiento de simbiontes y posterior morfogénesis como eventos tempranos en un mutualismo animal-bacteriano. Ciencia 254, 1491–1494 (1991).
Artículo ADS CAS PubMed Google Scholar
Nyholm, SV & McFall-Ngai, MJ Una simbiosis duradera: cómo el calamar hawaiano encuentra y mantiene a su pareja bacteriana bioluminiscente. Nat. Rev. Microbiol. https://doi.org/10.1038/s41579-021-00567-y (2021).
Wang, S. et al. El genoma de la vieira proporciona información sobre la evolución del cariotipo bilateral y el desarrollo. Nat. Ecol. Evol. 1, s41559-017–0120–017 (2017).
Artículo Google Académico
Zhang, Y. et al. El genoma de Nautilus pompilius ilumina la evolución y la biomineralización del ojo. Nat. Ecol. Evol. 5, 927–938 (2021).
Artículo PubMed PubMed Central Google Académico
van Berkum, NL et al. Hi-C: un método para estudiar la arquitectura tridimensional de los genomas. J. Vis. Exp. JoVE https://doi.org/10.3791/1869 (2010).
Friedman, N. & Rando, OJ Epigenómica y la estructura del genoma vivo. Genoma Res. 25, 1482–1490 (2015).
Artículo CAS PubMed PubMed Central Google Scholar
Dali, R. & Blanchette, M. Una evaluación crítica de las herramientas de predicción de dominio de asociación topológica. Ácidos Nucleicos Res. 45, 2994–3005 (2017).
Artículo CAS PubMed PubMed Central Google Scholar
Cubeñas-Potts, C. & Corces, VG Proteínas arquitectónicas, transcripción y organización tridimensional del genoma. FEBS Lett. 589, 2923–2930 (2015).
Artículo CAS PubMed PubMed Central Google Scholar
Symmons, O. et al. Características funcionales y topológicas de los dominios reguladores de los mamíferos. Genoma Res. 24, 390–400 (2014).
Artículo CAS PubMed PubMed Central Google Scholar
Heger, P., Marin, B., Bartkuhn, M., Schierenberg, E. y Wiehe, T. El aislante de cromatina CTCF y la aparición de la diversidad de metazoos. proc. Academia Nacional. ciencia EE. UU. 109, 17507–17512 (2012).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Rubio, ED et al. CTCF une físicamente la cohesina a la cromatina. proc. Academia Nacional. ciencia EE. UU. 105, 8309–8314 (2008).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Filippova, GN et al. Un represor transcripcional excepcionalmente conservado, CTCF, emplea diferentes combinaciones de dedos de zinc para unirse a secuencias promotoras divergentes de oncogenes c-myc de aves y mamíferos. mol. Celúla. Biol. 16, 2802–2813 (1996).
Artículo CAS PubMed PubMed Central Google Scholar
Acemel, RD, Maeso, I. & Gómez-Skarmeta, JL Dominios asociados topológicamente: un andamio exitoso para la evolución de la regulación génica en animales. Wiley Interdiscip. Rev. Dev. Biol. 6, e265 (2017).
Lazar, NH et al. Mantenimiento epigenético de dominios topológicos en el genoma del gibón altamente reorganizado. Genoma Res. 28, 983–997 (2018).
Artículo CAS PubMed PubMed Central Google Scholar
Touceda-Suárez, M. et al. Los bloques reguladores genómicos antiguos son una fuente de desiertos de genes reguladores en vertebrados después de las duplicaciones del genoma completo. mol. Biol. Evol. 37, 2857–2864 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Kryuchkova-Mostacci, N. & Robinson-Rechavi, M. La especificidad de tejido de la expresión génica diverge lentamente entre ortólogos y rápidamente entre parálogos. Cómputo PLOS. Biol. 12, e1005274 (2016).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Buenrostro, JD, Giresi, PG, Zaba, LC, Chang, HY & Greenleaf, WJ Transposición de cromatina nativa para perfiles epigenómicos rápidos y sensibles de cromatina abierta, proteínas de unión a ADN y posición de nucleosomas. Nat. Métodos 10, 1213 (2013).
Artículo CAS PubMed PubMed Central Google Scholar
Hood, KN et al. El estrés del retículo endoplásmico contribuye a la pérdida de neuronas hipocampales recién nacidas después de una lesión cerebral traumática. J. Neurosci. 38, 2372–2384 (2018).
Artículo CAS PubMed PubMed Central Google Scholar
Wang, Y. et al. El papel de la señalización de E2F1-topoIIβ en la regulación de la salida del ciclo celular y la diferenciación neuronal de las células SH-SY5Y humanas. Diferir de. Res. Biol. Divers 104, 1–12 (2018).
CAS Google Académico
Lu, C. et al. La sobreexpresión de NEUROG2 y NEUROG1 en células madre embrionarias humanas produce una red de neuronas excitadoras e inhibidoras. FASEB J. 33, 5287–5299 (2019).
Artículo CAS PubMed PubMed Central Google Scholar
Kanatani, S. et al. El COUP-TFII/Neuropilin-2 es un interruptor molecular que dirige las neuronas GABAérgicas derivadas del diencéfalo en el cerebro del ratón en desarrollo. proc. Academia Nacional. ciencia EE. UU. 112, E4985–E4994 (2015).
Artículo CAS PubMed PubMed Central Google Scholar
Corona, C. et al. La activación del factor de transcripción 4 (ATF4) regula la actividad neuronal al controlar el tráfico de GABABR. J. Neurosci. 38, 6102–6113 (2018).
Artículo CAS PubMed PubMed Central Google Scholar
Shinghal, R., Scheller, RH & Bajjalieh, SM Actividad de ceramida 1-fosfato fosfatasa en el cerebro. J. Neuroquímica. 61, 2279–2285 (1993).
Artículo CAS PubMed Google Académico
Oegema, R. et al. Las mutaciones humanas en las subunidades del complejo integrador vinculan la integridad del transcriptoma con el desarrollo del cerebro. PLoS Genet. 13, e1006809 (2017).
Artículo CAS PubMed PubMed Central Google Scholar
Hamley, IW El péptido beta amiloide: la perspectiva de un químico. Papel en el Alzheimer y la fibrilación. química Rev. 112, 5147–5192 (2012).
Artículo CAS PubMed Google Académico
Wang, Q., Moore, MJ, Adelmant, G., Marto, JA y Silver, PA PQBP1, un factor relacionado con la discapacidad intelectual, afecta el empalme alternativo asociado con el crecimiento de neuritas. Genes Dev. 27, 615–626 (2013).
Artículo CAS PubMed PubMed Central Google Scholar
Zadjali, F. et al. La homocigosidad para la mutación FARSB conduce a la enfermedad relacionada con la Phe-tRNA sintetasa de restricción del crecimiento, calcificación cerebral y enfermedad pulmonar intersticial. Tararear. Mutat. 39, 1355–1359 (2018).
Artículo CAS PubMed Google Académico
Fiorito, G. et al. Pautas para el cuidado y bienestar de los cefalópodos en investigación: un consenso basado en una iniciativa de CephRes, FELASA y Boyd Group. Laboratorio. Animación 49, 1–90 (2015).
Artículo PubMed Google Académico
Butler-Struben, HM, Brophy, SM, Johnson, NA y Crook, RJ Registro in vivo de correlatos neuronales y conductuales de la inducción, reversión y eutanasia de la anestesia en moluscos cefalópodos. Frente. Fisiol. 9, 109 (2018).
Shigeno, S., Parnaik, R., Albertin, CB & Ragsdale, CW Evidencia de un patrón cordal, no ganglionar, de neurogénesis cerebral cefalópoda. Lett zoológico. https://doi.org/10.1186/s40851-015-0026-z (2015).
Collins, AJ & Nyholm, SV Obtención de hemocitos del calamar bobtail hawaiano Euprymna scolopes y observación de su adherencia a bacterias simbióticas y no simbióticas. J. Vis. Exp. JoVE 1714, https://doi.org/10.3791/1714 (2010).
Lee, PN, Callaerts, P. & de Couet, HG El desarrollo embrionario del calamar bobtail hawaiano (Euprymna scolopes). Harb de primavera fría. Protocolo 2009, pdb.ip77 (2009).
Artículo CAS PubMed Google Académico
Rao, SSP et al. Un mapa 3D del genoma humano con una resolución de kilobases revela los principios de los bucles de cromatina. Celda 159, 1665-1680 (2014).
Artículo CAS PubMed PubMed Central Google Scholar
Serra, F. et al. El análisis automático y el modelado 3D de los datos de Hi-C mediante TADbit revelan las características estructurales de los colores de la cromatina de la mosca. Cómputo PLOS. Biol. 13, e1005665 (2017).
Artículo CAS PubMed PubMed Central Google Scholar
Wolff, J. et al. Galaxy HiCExplorer 3: un servidor web para análisis, control de calidad y visualización de datos Hi-C reproducibles, de captura Hi-C y de una sola célula. Ácidos Nucleicos Res. https://doi.org/10.1093/nar/gkaa220 (2020).
Camacho, C. et al. BLAST+: arquitectura y aplicaciones. BMC Bioinforma. 10, 421 (2009).
Artículo CAS Google Académico
Engström, PG, Fredman, D. & Lenhard, B. Ancora: un recurso web para explorar elementos no codificantes altamente conservados y su asociación con genes reguladores del desarrollo. Genoma Biol. 9, R34 (2008).
Artículo CAS PubMed PubMed Central Google Scholar
Bejerano, G. et al. Elementos ultraconservados en el genoma humano. Ciencia 304, 1321–1325 (2004).
Artículo ADS CAS PubMed Google Scholar
Neph, S. et al. BEDOPS: operaciones de características genómicas de alto rendimiento. Bioinformática 28, 1919–1920 (2012).
Artículo CAS PubMed PubMed Central Google Scholar
Quinlan, AR & Hall, IM BEDTools: un conjunto flexible de utilidades para comparar características genómicas. Bioinformática 26, 841–842 (2010).
Artículo CAS PubMed PubMed Central Google Scholar
Bailey, TL, Johnson, J., Grant, CE y Noble, WS La suite MEME. Ácidos Nucleicos Res. 43, W39–W49 (2015).
Artículo CAS PubMed PubMed Central Google Scholar
Sayers, EW et al. Base de datos de recursos del centro nacional de información biotecnológica. Ácidos Nucleicos Res. 50, D20–D26 (2022).
Artículo CAS PubMed Google Académico
Corcés, MR et al. Un protocolo ATAC-seq mejorado reduce el fondo y permite el interrogatorio de tejidos congelados. Nat. Métodos 14, 959–962 (2017).
Artículo CAS PubMed PubMed Central Google Scholar
Buenrostro et al. ATAC-seq: un método para analizar la accesibilidad de la cromatina en todo el genoma. actual Protocolo mol. Biol. ed. Frederick M Ausubel Al 109, 21.29.1–21.29.9 (2015).
Google Académico
Tanner, AR et al. Los relojes moleculares indican el recambio y la diversificación de los cefalópodos coleoides modernos durante la Revolución Marina Mesozoica. proc. R. Soc. B Biol. ciencia 284, 20162818 (2017).
Artículo Google Académico
Kröger, B., Vinther, J. & Fuchs, D. Origen y evolución de los cefalópodos: una imagen congruente que surge de los fósiles, el desarrollo y las moléculas. BioEssays 33, 602–613 (2011).
Artículo CAS PubMed Google Académico
Descargar referencias
HS, OPH, ER y OS recibieron el apoyo de la subvención P30686-B29 del Austrian Science Fund (FWF). OS recibió el apoyo de la Beca de Carrera Temprana del Centro Whitman (Frank R. Lillie Quasi-Endowment Fund, L. & A. Colwin Summer Research Fellowship, Bell Research Award in Tissue Engineering). HS fue apoyado por la subvención a corto plazo en el extranjero (KWA) de la Universidad de Viena. HS y OS recibieron el apoyo de la Beca de Movilidad del Programa de Asociación Estratégica de la Universidad de Chicago/Viena. AK recibió el apoyo del programa JSPS Postdoctoral Fellowship for Overseas Researchers de Japón. CBA recibió el apoyo de Hibbitt Early Career Fellowship. Los huevos y las paralarvas de E. scolopes se generaron en parte gracias al apoyo de la NASA Space Biology 80NSSC18K1465 otorgado a JSFSVN con el apoyo de la National Science Foundation IOS-1557914. Este trabajo fue apoyado por el Instituto Francis Crick, que recibe su financiación principal de Cancer Research UK (FC0001003), el Consejo de Investigación Médica del Reino Unido (FC001003) y Wellcome Trust (FC001003). Los autores desean agradecer al Zoológico de Viena (Tiergarten Schönbrunn), en particular, a Roland Halbauer y al equipo de acuarística para la cría de animales, así como al Programa de Cefalópodos de MBL, su equipo, Emily García, y la Instalación Central de Microscopía de MBL (MBL, Woods Hole) . Los autores agradecen al Departamento de Neurociencia y Biología del Desarrollo de la Universidad de Viena, especialmente a Andreas Denner. El cálculo se realizó utilizando el Clúster de Ciencias de la Vida de la Universidad de Viena. El corte se realizó en las instalaciones centrales CIUS (Universidad de Viena). Los autores desean agradecer a Daniel Rokhsar y Clifton Ragsdale por su orientación y asesoramiento.
Estos autores contribuyeron igualmente: Hannah Schmidbaur, Akane Kawaguchi.
Departamento de Neurociencias y Biología del Desarrollo, Universidad de Viena, Viena, Austria
Hannah Schmidbaur, Oi Pui Hoang, Bob Zimmermann, Elena A. Ritschard y Oleg Simakov
Instituto de Patología Molecular, Viena, Austria
Akane Kawaguchi y Elly Tanaka
Laboratorio de Modelado Biomolecular, Instituto Francis Crick, Londres, Reino Unido
Tereza Clarence, Xiao Fu y Paul A. Bates
Departamento de Biología y Evolución de Organismos Marinos, Stazione Zoologica Anton Dohrn, Nápoles, Italia
Elena A. Ritschard
Zoológico de Viena, Maxingstraße 13b, 1130, Viena, Austria
Antón Weissenbacher
Departamento de Microbiología y Ciencias Celulares, Universidad de Florida, Laboratorio de Ciencias de la Vida Espacial, Merritt Island, FL, EE. UU.
Jaime S. Foster
Departamento de Biología Molecular y Celular, Universidad de Connecticut, Storrs, CT, EE. UU.
Spencer V Nyholm
Centro Bell de Biología Regenerativa e Ingeniería de Tejidos, Laboratorio de Biología Marina, Woods Hole, MA, EE. UU.
de Caroline B. Albert
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
HS realizó un análisis genómico comparativo con el apoyo de OS, AK realizó experimentos Hi-C, HS y AK realizaron la recopilación de datos ATAC-seq. HS y CA realizaron hibridación in situ. TG, XF y PB realizaron reconstrucción y análisis 3D. HS y OPH realizaron la cuantificación ATAC-seq. HS y BZ realizaron análisis de coexpresión y aleatorización sinténica, EAR, HS y CA realizaron extracción de RNA-seq. JF y SN suministraron animales. AW y el zoológico de Viena alojaron animales. HS, CA, ET y OS diseñaron la investigación. HS y OS escribieron el manuscrito con aportes de todos los demás autores.
Correspondencia a Caroline B. Albertin, Elly Tanaka u Oleg Simakov.
Los autores declaran no tener conflictos de intereses.
Nature Communications agradece a José Martín-Durán y a los demás revisores anónimos por su contribución a la revisión por pares de este trabajo. Los informes de los revisores están disponibles
Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Schmidbaur, H., Kawaguchi, A., Clarence, T. et al. Aparición de nueva regulación y expresión de genes de cefalópodos a través de la reorganización del genoma a gran escala. Nat Comun 13, 2172 (2022). https://doi.org/10.1038/s41467-022-29694-7
Descargar cita
Recibido: 19 Agosto 2020
Aceptado: 28 de marzo de 2022
Publicado: 21 abril 2022
DOI: https://doi.org/10.1038/s41467-022-29694-7
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.
Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt
Biología BMC (2022)
Biología BMC (2022)
Comunicaciones de la naturaleza (2022)
Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.