Tigmint

Tigmint est un outil logiciel permettant de corriger les erreurs d’assemblage au sein des lectures de grandes molécules telles que celles générées par la plate-forme Chromium Genomics 10X. L’utilité de Tigmint est de corriger les assemblages provenant d’outils d’assemblage multiples, ainsi que d’utiliser des lectures Chromium pour corriger et échafauder les assemblages de séquençage de longues molécules uniques. Pour plus d’informations, consultez Jackman et al 2018. Pour accéder à Tigmint: https://github.com/bcgsc/tigmint.

ARKS

Les informations de séquençage à longue distance générées par les lectures de séquences liées, telles que celles provenant de 10× Genomics (10xG), aident à résoudre les répétitions de séquences génomiques et permettent d’obtenir des assemblages intérimaires de génomes précis et contigus. Nous présentons ARKS, une méthodologie sans alignement d’échafaudage du génome à l’aide de lectures de séquences liées, qui utilise les lectures liées pour organiser les assemblages du génome en des versions intérimaires contigües. Notre approche se démarque des autres échafaudeurs à lectures de séquences liées, y compris le nôtre (ARCS), car il utilise une approche de cartographie se basant sur les  kmers. La stratégie de cartographie de kmers présente un certain nombre d’avantages par rapport aux méthodes d’alignement de lectures, notamment une meilleure convivialité et un traitement plus rapide, car elle évite le formatage des séquences d’entrée et l’indexation des assemblages intérimaires de séquences. Le recours à des kmers au lieu d’alignements de lectures pour les séquences appariées assouplit les exigences en matière de flux de calcul et réduit considérablement le temps d’exécution. Pour plus d’informations, consultez Coombe et al 2018. Pour accéder à ARKS: https://github.com/bcgsc/arks.

ARCS

Un nouvel outil a été développé, qui utilise les informations des codes à barres contenues dans les lectures de séquences liées pour améliorer la contigüité des assemblages intérimaires de génomes. Par exemple, l’outil a permis d’améliorer par un facteur de six la contiguïté d’un assemblage de génome d’Homo sapiens obtenu par ABySS, en se basant sur des données de séquençage Chromium avec couverture modérée (25X). Nous nous attendons à ce qu’ARCS ait une grande utilité dans l’exploitation des informations de codes à barres contenues dans les données de lecture de séquences liées pour intégrer les séquences de haute qualité dans les assemblages intérimaires de génomes. Pour plus d’informations, consultez Yeo et al 2018. Pour accéder à ARCS: https://github.com/bcgsc/ARCS/.

ChopStitch

Une nouvel algorithme a été mis au point pour identifier de novo les limites d’exons présumés et inférer les patrons d’épissage en utilisant un transcriptome assemblé et des données de séquençage du génome entier par méthode shotgun (WGSS). ChopStitch identifie les limites exon-exon dans les données d’ARN-Seq assemblées de novo à l’aide d’un filtre Bloom qui représente le spectre k-mer des lectures de WGSS. L’algorithme prend également en compte les substitutions de bases dans les séquences de transcription qui peuvent être dérivées d’erreurs de séquençage ou d’assemblage, de variations d’haplotypes ou d’événements présumés d’édition d’ARN. Pour plus d’informations, consultez Khan et al 2018. Pour accéder à ChopStitch: https://github.com/bcgsc/ChopStitch.

ABySS 2.0

ABySS 2.0 est la deuxième version de notre algorithme d’assemblage de séquences phares. Il améliore l’efficacité des ressources d’ABySS et fournit un support pour les technologies émergentes de séquençage, y compris celles de 10x Genomics (Pleasanton, CA), Pacific Biosciences (PacBio, Menlo Park, CA) et Oxford Nanopore Technologies (ONT, Oxford, Royaume-Uni). Nous avons démontré que ABySS 2.0 et ses algorithmes associés peuvent assembler des génomes humains à des échafaudages à l’échelle des chromosomes, en utilisant des ressources de calcul facilement disponibles sur des serveurs modernes. Pour plus d’informations, consultez Jackman, Vandevalk et al 2017. Pour accéder à ABySS 2.0: https://github.com/bcgsc/abyss.

Kollector

Kollector est une approche d’algorithme d’assemblage ciblé sans alignement permettant d’effectuer l’assemblage de séquences d’intérêt localement. Un cas d’utilisation typique de l’algorithme est l’assemblage de locus géniques d’organismes non-modèles en utilisant un ensemble de séquences de transcrits. Les séquences résultantes peuvent être facilement utilisées pour des recherches biologiques plus ciblées, par exemple pour étudier des éléments cis-régulateurs. Pour plus d’informations, consultez Kucuk et al 2017. Pour accéder à Kollector: https://github.com/bcgsc/kollector.

ntCard

ntCard permet une fonction bioinformatique fondamentale d’analyse du contenu en séquences de grands volumes de données brutes de séquençage. Il fournit des statistiques pour estimer la fréquence d’erreur de séquençage, la taille du génome et le contenu de répétitions en profilant le spectre k-mer des données d’entrée. ntCard implique un algorithme de calcul efficace qui peut traiter 90 fois la couverture du giga-génome de l’épinette en 30 minutes en utilisant 500 Mo de RAM. Pour plus d’informations, consultez Mohamadi, Khan et Birol, 2017. Pour accéder à ntCard: https://github.com/bcgsc/ntCard.