produce in output file FASTQ artificiali derivati da un genoma di riferimento
ArtificialFastqGenerator prende come input un genoma di riferimento (in
formato FASTA) e produce in output file FASTQ artificiali nel formato
Sanger. Può accettare punteggi di qualità delle basi Phred da file FASTQ
esistenti e usarli per simulare errori di sequenza. Dato che i file FASTQ
artificiali sono derivati dal genoma di riferimento, quest'ultimo fornisce
un gold standard per l'identificazione delle varianti (SNP, polimorfismi a
singolo nucleotide, e indel, inserzioni e delezioni). Questo permette la
valutazione di una catena di elaborazione dati per l'analisi di NGS (Next
Generation Sequencing, sequenziamento di prossima generazione) che allinea
letture al genoma di riferimento e poi identifica le varianti.