Ultrahurtig univerel RNA-seq-sammenligningsprogram
Programmet Spliced Transcripts Alignment to a Reference (STAR) baseret på
en tidligere ubeskrevet RNA-seq-sammenligningsalgoritme, som bruger
sekventiel maksimal kortlægningsparat seed-søgning i suffikstabeller uden
komprimering efterfulgt af seed-klyngeopbygning og syning. STAR er bedre
end andre sammenligningsprogrammer med en faktor >50 i
kortlægningshastighed, sammenligning med menneskets genom 550 million 2 ×
76 bp parret-slut læsninger per time på en moderat server med 12-kerner,
mens der på samme tid er en forbedring af sammenligningssensitivitet og
præcision. Udover fordomsfri de novo-registrering af kanoniske bindinger
kan STAR registrere ikkekanoniske dele og chimeric (fusion)
transkriptioner, og kan også oversætte RNA-sekvenser i fuld længde. Via
Rocke 454-sekvensering af »reverse transcription polymerase chain reaction
amplicons« validerede forfatterne eksperimentelt 1960 novel mellemgenom
delbindinger med 80-90 % succes, underbyggende den høje præcision i
START-kortlægningsstrategien.