outils de simulation pour créer des lectures de séquençage synthétiques de nouvelle génération
ART est un ensemble d'outils de simulation pour créer des lectures de
séquençage synthétiques de nouvelle génération. ART simule les lectures de
séquençages en imitant le vrai processus de séquençage avec des modèles
d'erreur empiriques ou des profils de qualité établis à partir de grandes
données de séquençage recalibrées. ART peut également simuler les lectures
grâce à un modèle d'erreur de lecture ou des profils de qualité fournis par
l'utilisateur. ART prend en charge la simulation de lecture « single end »,
« paired-end » ou « mate-pair » des trois principales plateformes
commerciales de séquençage de nouvelle génération : Solexa d'Illumina, 454
de Roche et SOLiD d'Applied Biosystems. Art peut servir à tester ou évaluer
diverses méthodes ou outils pour l'analyse de données de séquençage de
nouvelle génération, dont l'alignement de lectures, l'assemblage de novo et
la découverte de variations SNP et de structures. ART a servi en tant
qu'outil principal pour l'étude de simulation du projet « 1000 Genomes ».
ART est implémenté en C++ avec des algorithmes optimisés et est très
efficace dans la simulation de lecture. ART produit des lectures au format
FASTQ et des alignements au format ALN. ART peut aussi créer des
alignements au format d'alignement SAM ou au format UCSC BED. ART peut être
utilisé conjointement avec des simulateurs de variantes de génome comme
VarSim pour évaluer les outils ou méthodes d'appel de variante.