Hurtig og præcis klyngeopsætning af genomsekvenser
Med udviklingen af den næste generation af sekventering skal effektive
værktøjer håndterer millioner af sekvenser på en fornuftig tid. Sumaclust
er et program udviklet af LECA. Sumaclust forsøger at klyngeopsætte
sekvenser på en måde som er hurtig og præcis på samme tid. Dette værktøj
er blevet udviklet som en tilpasning til den type af data som oprettes af
DNA-metastregkodere, dvs. fuldt ud sekventeret, korte markører. Sumaclust
klyngeopsætter via de samme klyngealgoritmer som UCLUST og CD-HIT. Denne
algoritme er hovedsagelig nyttig til at registrere de »fejlramte«
sekvenser opretter under amplifikation og sekvensprotokoller, afledt fra
»true« sekvenser.