Package: uctodata (0.8-2)
Links for uctodata
Debian Resources:
Download Source Package uctodata:
Maintainers:
External Resources:
- Homepage [languagemachines.github.io]
Similar packages:
file dei dati per Ucto
Ucto può suddividere in token file di testo in codifica UTF-8 (cioè separare parole dalla punteggiatura, suddividere frasi, generare n-grammi) e offre svariati altri passi di preelaborazione di base che rendono il testo adatto ad un'ulteriore elaborazione come indicizzazione, etichettatura di parti del discorso o traduzione automatica.
Questo pacchetto fornisce file dei dati specifici di lingua per eseguire Ucto.
Ucto è stato scritto da Maarten van Gompel e Ko van der Sloot. Il lavoro su Ucto è stato finanziato dalla NWO, la Netherlands Organisation for Scientific Research, come parte del progetto Implicit Linguistics, del programma CLARIN-NL e del progetto CLARIAH.
Ucto è un prodotto del Centre of Language and Speech Technology (Radboud University Nijmegen), e in precedenza dell'ILK Research Group (Tilburg University, Paesi Bassi).
Download uctodata
Architecture | Package Size | Installed Size | Files |
---|---|---|---|
all | 20.3 kB | 112.0 kB | [list of files] |