strumenti di simulazione per generare letture sintetiche di sequenziamento di prossima generazione
ART è un insieme di strumenti di simulazione per generare letture
sintetiche di sequenziamento di prossima generazione. ART simula letture di
sequenziamento imitando il procedimento reale di sequenziamento con modelli
empirici di errore o profili di qualità riassunti da grandi dati di
sequenziamento ricalibrati. ART può anche simulare letture usando modelli
di errore o profili di qualità dell'utente. ART gestisce la simulazione di
letture a estremità singole, estremità accoppiate/mate-pair delle tre
principali piattaforme commerciali di sequenziamento di prossima
generazione: Solexa di Illumina, 454 di Roche e SOLiD di Applied
Biosystems. ART può essere usato per test o benchmark di svariati metodi o
strumenti per analisi di dati di sequenziamento di prossima generazione,
inclusi allineamento di letture, assemblaggio de novo, SNP e scoperta di
variazioni di struttura.
ART è stato usato come strumento principale per lo studio di simulazione
del 1000 Genomes Project. ART è implementato in C++ con algoritmi
ottimizzati ed è molto efficiente nella simulazione delle letture. ART fa
l'output delle letture nel formato FASTQ e degli allineamenti nel formato
ALN. ART può anche generare allineamenti nel formato di file SAM per
allineamenti o UCSC BED. ART può esser usato insieme ai simulatori di
varianti del genoma (es. VarSim) per valutare strumenti o metodi di
identificazione di varianti.