allineamento basato su grafi di letture corte di nucleotidi verso molti genomi
HISAT2 è un programma di allineamento veloce e sensibile per mappare le
letture di sequenziamento della prossima generazione (sia DNA che RNA) su
una popolazione di genomi umani (e anche su un singolo genoma di
riferimento). Sulla base di un'estensione di BWT per i grafi, è stato
progettato e implementato un indice GFM (graph FM). Oltre a usare un indice
GFM globale che rappresenta una popolazione di genomi umani, HISAT2 usa un
grande insieme di piccoli indici GFM che collettivamente coprono l'intero
genoma (ciascun indice rappresenta una regione genomica di 56 kbp, con
55000 indici necessari per coprire la popolazione umana). Questi piccoli
indici (chiamati indici locali), combinati con diverse strategie di
allineamento, permettono un allineamento rapido e accurato delle letture di
sequenziamento. Questo nuovo schema di indicizzazione è chiamato indice
HGFM (Hierarchical Graph FM).