Grafbaseret sammenligning af korte nukleoide læsninger for mange genomer
HISAT2 er et hurtigt og sensitivt sammenligningsprogram for oversættelse af
sekvenslæsning i næste generation (både DNA og RNA) til en population af
genomer fra mennesker (samt mod et enkelt referencegenom). Baseret på en
udvidelse af BWT for grafer blev et graf FM-indeks designet og
implementeret. Udover at bruge et globalt GFM-indeks, som repræsenterer en
population af genomer for mennesker, så bruger HISAT2 et stort sæt af små
GFM-indeks, som kollektivt dækker hele genomet (hvert indeks repræsenterer
et genomområde på 56 Kbp, med 55.000 indeks krævet for at dække
menneskepopulationen). Disse små indeks (kaldt lokale indeks), kombineret
med flere sammenligningsstrategier muliggør hurtig og præcis sammenligning
af sekvenslæsninger. Dette nye indeksskema kaldes et Hierarchical Graph
FM-indeks (HGFM).