Amélioration du génome de l’épinette de l’intérieur (PG29)

Nous continuons d’améliorer la représentation de la séquence du génome du génotype PG29 d’épinette blanche de l’intérieur de la Colombie-Britannique (Picea engelmannii x glauca) et rendrons bientôt disponible la 5ème version de ce génome. L’assemblage amélioré proviendra de l’échafaudage de la 3e version de l’assemblage en rajoutant des données de lectures de séquence liées Genomics avec une couverture de 10x du génome, obtenues à partir d’un échantillon d’ADN PG29 haploïde (tissu du mégagamétophyte). Les informations sur de longues distances fournies par le séquençage 10x avec la plate-forme Genomics seront utilisées pour générer un échafaudage avec ARCS, un logiciel récemment développé par l’équipe du projet Spruce-Up (Yeo et al 2018). Pour citer la séquence actuelle du génome PG29 d’épinette blanche de l’intérieur de la C.-B., veuillez référer à Birol et al 2013 et Warren et al 2015. Les séquences des génomes d’organelles de PG29 sont également publiées et décrites dans l’article suivant: Jackman et al 2016. Les assemblages du génome de PG29 sont disponibles en téléchargement par le biais du Centre national d’information sur la biotechnologie (NCBI): [Bioproject PRJNA83435].

Amélioration du génome de l’épinette blanche (WS77111)

Une seconde version de la séquence du génome du génotype WS77111 de l’épinette blanche de l’Est du Canada (Picea glauca) a été produite à partir de l’échafaudage effectué avec ARCS et les données de lectures de séquences liées Genomics avec une couverture de 10x du génome, en utilisant la source d’ADN diploïde originale. La soumission au NCBI est en attente de l’annotation des gènes, qui a déjà été amorcée (automne 2017). Pour citer la séquence actuelle du génome de WS77111, veuillez référer à l’article suivant: Warren et al 2015. La séquence du génome est disponible au téléchargement via NCBI: [Bioproject PRJNA242552].

Assemblage du génome de l’épinette de Sitka (Q903)

Nous avons récemment séquencé le génotype Q903 de l’épinette de Sitka (Picea sitchensis) sur la plate-forme de lectures de séquence liées 10x Genomics. Un premier assemblage a été généré sur un serveur unique avec ABySS v2.0 (Jackman et al 2017). Cette approche constitue une avancée majeure pour l’assemblage de grands génomes, par rapport à l’utilisation précédente d’une interface de transmission de messages de calcul en parallèle qui était onéreuse en utilisation de capacité informatique, et maintenant remplacée par des structures de données de filtres Bloom plus légères avec un encombrement informatique globalement moindre. Cette amélioration de logiciel facilite la détermination des grands génomes de conifères, car elle permet une optimisation nécessaire des paramètres d’assemblage sur une infrastructure de calcul plus facile à opérer. Nous sommes en train d’affiner l’assemblage initial de la séquence du génome nucléaire de Q903 en appliquant diverses méthodologies d’échafaudage développées par l’équipe Spruce-Up (Warren et al 2015, Yeo et al 2017). Un nouveau logiciel d’assemblage du génome prenant en compte les lectures de séquence liées est en développement accéléré. Nous sommes également en train de générer de longues lectures de séquence par la technologie nanopore (Oxford Nanopore Technologies), ce qui devrait améliorer à la fois la précision et la contiguïté de la séquence du génome nucléaire de l’épinette de Sitka. Auparavant, nous avons rapporté l’un des premiers cas d’utilisation de lectures de séquence liées de type 10x Genomics se rapportant exclusivement au séquençage d’un génome entier, celui du génome chloroplastique Q903 d’épinette de Sitka. Pour se référer au manuscrit décrivant ce travail, veuillez citer: Coombe et al 2016. Le génome chloroplastique est disponible au téléchargement auprès du NCBI: [KU215903].