Justeringsfri sekvenssammenligning ved hjælp af afskårne ord
Spaced (Words) er en ny tilgang til justeringsfri sekvenssammenligning.
Mens de fleste justeringsfrie algoritmer sammenligner ord-sammensætning af
sekvenser bruger Spaced et mønster af gælder og gælder ikke stillinger.
Forekomsten af et mellemrum i en sekvens defineres derefter kun af tegnene
i matchpositionerne, mens tegnene på positionerne gælder ikke ignoreres. I
stedet for sammenligning af frekvenserne af sammenhængende ord i
indgangssekvenserne, denne nye fremgangsmåde sammenligner frekvenserne af
de adskilte ord i overensstemmelse med det foruddefinerede mønster. En
informations-teoretisk afstandsmåling bruges til at definere parvise
afstande på sæt af indgangssekvenser baseret på deres
mellemrumsordfrekvenser. Systematisk test kørt på ægte og simulerede
sekvenssæt har vist, at for fylogenirekonstruktion, er denne fremgangsmåde
med flere mellemrum-ord langt bedre end den klassiske justeringsfri tilgang
baseret på sammenhængende ordfrekvenser.