Amélioration du génome de l’épinette de l’intérieur (PG29)

Nous continuons d’améliorer la représentation de la séquence du génome du génotype PG29 d’épinette blanche de l’intérieur de la Colombie-Britannique (Picea engelmannii x glauca x sitchensis). La 5ème version de ce génome est maintenant disponible [ALWZ000000000]. L’assemblage amélioré provient de l’échafaudage de la 4e version de l’assemblage utilisant des données de lectures de séquences liées Genomics avec une couverture de 10x du génome, obtenues à partir d’un échantillon d’ADN haploïde (tissu du mégagamétophyte) de PG29. Les informations sur de longues distances fournies par le séquençage 10x avec la plate-forme Genomics ont été corrigées avec Tigmint et ont été utilisées pour générer un échafaudage avec ARCS, deux outils développés par l’équipe du projet Spruce-Up (Jackman et al 2018, Yeo et al 2018, outils disponibles au https://github.com/bcgsc/). Pour citer la séquence actuelle du génome PG29 d’épinette blanche de l’intérieur de la C.-B., veuillez référer à Birol et al 2013 et Warren et al 2015. Les séquences des génomes d’organelles de PG29 sont également publiées et décrites dans l’article suivant: Jackman et al 2016. Les assemblages du génome de PG29 sont disponibles en téléchargement par le biais du Centre national d’information sur la biotechnologie (NCBI): [Bioproject PRJNA83435].

Amélioration du génome de l’épinette blanche (WS77111)

Une seconde version de la séquence du génome du génotype WS77111 de l’épinette blanche de l’Est du Canada (Picea glauca) a été produite à partir de données de lectures de séquences liées Genomics avec une couverture de 10x du génome, en utilisant la source d’ADN diploïde originale. Les séquences ont été corrigées par Tigmint et leur échafaudage effectué avec ARCS (Jackman et al 2018, Yeo et al 2018, outils disponibles à https://github.com/bcgsc/). La mise à jour de l’annotation de l’assemblage a été soumise à NCBI. Pour citer la séquence actuelle du génome de WS77111, veuillez référer à l’article suivant: Warren et al 2015. La séquence du génome est disponible au téléchargement via NCBI: [Bioproject PRJNA242552, JZKD000000000]. Nous présentons également la séquence complète du génome chloroplastique de l’épinette blanche Picea glauca, génotype WS77111 (Lin et al 2019). En plus des lectures liées, nous avons récemment généré des lectures longues (Oxford Nanopore Technologies, Inc.) pour l’épinette blanche et nous travaillons à un assemblage amélioré en utilisant ce type de données de séquençage.

Assemblage du génome de l’épinette de Sitka (Q903)

Nous avons récemment séquencé le génotype Q903 de l’épinette de Sitka (Picea sitchensis) sur la plate-forme de lectures de séquence liées 10x Genomics. Ce premier assemblage a été généré sur un serveur unique avec ABySS v2.0 (Jackman et al 2017, SNQJ000000000). Cette approche constitue une avancée majeure pour l’assemblage de grands génomes, par rapport à l’utilisation précédente d’une interface de transmission de messages de calcul en parallèle qui était onéreuse en utilisation de capacité informatique, et maintenant remplacée par des structures de données de filtres Bloom plus légères avec un encombrement informatique globalement moindre. Cette amélioration de logiciel facilite la détermination des grands génomes de conifères, car elle permet une optimisation nécessaire des paramètres d’assemblage sur une infrastructure de calcul plus facile à opérer. En plus de la technologie de lecture liée, nous avons généré des lectures nanopore longues à faible couvertures pour améliorer encore l’ébauche du génome. Nous avons raffiné l’assemblage initial de la séquence du génome nucléaire de Q903 en appliquant diverses méthodologies d’échafaudage développées par l’équipe Spruce-Up (Warren et al 2015, Yeo et al 2017) pour utiliser les informations à longue portée fournies par les données liées et les données de lectures longues. Ce premier assemblage du génome nucléaire de l’épinette de Sitka est disponible auprès du NCBI sous l’accession SNQJ000000000. Précédemment, nous avions rapporté l’un des premiers cas d’utilisation des lectures liées à la génomique 10x exclusivement dans un projet de séquençage du génome entier, celui du génome chloroplastique de l’épinette de Sitka Q903. Pour se référer au manuscrit décrivant ce travail, veuillez citer: Coombe et al 2016. De plus, nous avons récemment assemblé et annoté le génome mitochondrial de l’épinette de Sitka et rapporté sa structure physique complexe (Jackman et al 2020). Les génomes chloroplastiques et mitochondriaux sont disponibles pour téléchargement auprès du NCBI: [KU215903, MK697696–MK697708].

Ébauche de l’assemblage de l’épinette d’Engelmann (Se404-851)

Nous présentons le séquençage du génome d’une épinette d’Engelmann de l’Ouest canadien (Picea engelmannii) du génotype Se404-851 avec une couverture de séquence de 94X en utilisant une combinaison de types de données de séquençage comprenant des séquences pairées et MPET (Illumina), des séquences liées (10x Genomics Chromium) et des séquences longues de type Nanopore (Oxford Nanopore Technologies Ltd). Ce premier assemblage a été généré avec ABySS v2.0 (Jackman et al 2017) et des outils d’échafaudage de séquences liées (Jackman et al 2018; Yeo et al 2017). Des séquences longues (Nanopore) ont également été utilisées pour rendre plus contigu l’assemblage final, le plus long à ce jour pour un génome d’épinette (longueur NG50 = 0,56 Mbp). L’assemblage peut être téléchargé depuis NCBI [WSFP000000000]. L’assemblage du génome chloroplastique de l’épinette d’Engelmann est disponible en téléchargement sur NCBI [MK241981] et a récemment été décrit (Lin et al 2019).

Assemblage du génome du chloroplaste de l’épinette noire (40-10-1)

Nous présentons la séquence du chloroplaste de l’épinette noire (Picea mariana), un conifère largement distribué à travers les forêts boréales de l’Amérique du Nord (génotype 40-10-1, échantillonné à Thunder Bay en Ontario). Cette séquence chloroplastique complète et annotée de 123 961 paires de bases contribuera aux futures études sur les bases génétiques des changements au niveau de l’évolution et de l’adaptation chez les épinettes et les conifères (Lo et al 2020). Cette séquence du génome chloroplastique du génotype 40-10-1 de Picea mariana est disponible dans GenBank sous le numéro d’accession MT261462, et les données brutes sont disponibles SRX7890468 et SRR11284755.