Package: libucto-dev (0.14-2)
Links for libucto-dev
Debian Resources:
Download Source Package ucto:
Maintainers:
External Resources:
- Homepage [languagemachines.github.io]
Similar packages:
suddivisione in token per Unicode - sviluppo
Ucto può suddividere in token file di testo in codifica UTF-8 (cioè separare parole dalla punteggiatura, suddividere frasi, generare n-grammi) e offre svariati altri passi di preelaborazione di base che rendono il testo adatto ad un'ulteriore elaborazione come indicizzazione, etichettatura di parti del discorso o traduzione automatica.
Questo pacchetto fornisce gli header C++ per la libreria di programmazione.
Ucto è stato scritto da Maarten van Gompel e Ko van der Sloot. Il lavoro su Ucto è stato finanziato dalla NWO, la Netherlands Organisation for Scientific Research, come parte del progetto Implicit Linguistics, del programma CLARIN-NL e del progetto CLARIAH.
Ucto è un prodotto del Centre of Language and Speech Technology (Radboud University Nijmegen), e in precedenza dell'ILK Research Group (Tilburg University, Paesi Bassi).
Se si è interessati nell'analisi automatica di file di testo in codifica UTF-8, ad esempio per fare ricerca scientifica nel campo dell'elaborazione del linguaggio naturale, ucto sarà probabilmente utile.
Other Packages Related to libucto-dev
|
|
|
|
-
- dep: libucto3 (= 0.14-2)
- suddivisione in token per Unicode - runtime
Download libucto-dev
Architecture | Package Size | Installed Size | Files |
---|---|---|---|
amd64 | 135.2 kB | 877.0 kB | [list of files] |