allineatore universale e ultraveloce di sequenziamento di RNA
Software STAR (Spliced Transcripts Alignment to a Reference) basato su un
algoritmo di allineamento per RNA-seq mai descritto prima, che usa la
ricerca di seed mappabili sequenziali massimi in array di suffissi non
compressi seguita da raggruppamento in cluster dei seed e procedure di
cucitura. STAR supera in prestazioni altri strumenti di allineamento di un
fattore maggiore di 50 in velocità di mappatura, facendo l'allineamento con
il genoma umano di 550 milioni di letture a terminali accoppiati 2 x 76 pb
all'ora su un modesto server con 12 core, al contempo migliorando la
sensibilità e la precisione dell'allineamento. In aggiunta a rilevazioni de
novo senza bias di giunzioni canoniche, STAR può anche scoprire trascritti
chimerici (fusione) e splice non canonici, ed è anche in grado di mappare
sequenze di RNA a sequenza intera. Usando il sequenziamento Roche 454 di
ampliconi PCR di trascrizione inversa, gli autori hanno validato
sperimentalmente 1960 nuove giunzioni di splice intergeniche con un tasso
di successo dell'80-90%, confermando l'elevata precisione della strategia
di mappatura di STAR.