Package: ucto (0.35-2 and others)
Links for ucto
Debian Resources:
Download Source Package ucto:
Maintainers:
External Resources:
- Homepage [languagemachines.github.io]
Similar packages:
tokenizador Unicode
Ucto pode tokenizar arquivos de texto codificados em UTF-8 (ou seja, separar as palavras da pontuação, dividir sentenças, gerar n-gramas) e oferece vários outros passos básicos de pré-processamento que deixam seu texto pronto para processamento posterior, como indexação, etiquetagem de partes de fala ou tradução de máquina.
Este pacote fornece a ferramenta de linha de comando em si.
Ucto foi escrito por Maarten van Gompel e Ko van der Sloot. O trabalho no Ucto foi financiado pela NWO, a Organização Holandesa para Pesquisa Científica, sob o projeto Implicit Linguistics, o programa CLARIN-NL e o projeto CLARIAH.
Ucto é um produto do Centro de Tecnologia de Linguagem e Fala (Universidade Radboud Nijmegen) e anteriormente pelo Grupo de Pesquisa ILK (Universidade Tilburg, Holanda).
Se você tiver interesse em análise de máquina de arquivos texto codificados em UTF-8, por exemplo para fazer pesquisa científica em processamento de língua natural, o ucto vai ser útil para você.
Other Packages Related to ucto
|
|
|
|
-
- dep: libc6 (>= 2.34) [not alpha, ia64, sh4]
- GNU Biblioteca C: Bibliotecas compartilhadas
also a virtual package provided by libc6-udeb
- dep: libc6 (>= 2.40) [sh4]
-
- dep: libc6.1 (>= 2.34) [alpha]
- GNU Biblioteca C: Bibliotecas compartilhadas
also a virtual package provided by libc6.1-udeb
- dep: libc6.1 (>= 2.37) [ia64]
-
- dep: libfolia14 (>= 2.4) [ia64]
- Implementation of the FoLiA document format
-
- dep: libfolia22 (>= 2.21) [m68k]
- Implementation of the FoLiA document format
- dep: libfolia22 (>= 2.21.1) [not ia64, m68k]
-
- dep: libgcc-s1 (>= 3.0) [not armel, armhf, hppa, ia64, m68k]
- Biblioteca de suporte GCC
- dep: libgcc-s1 (>= 3.5) [armel, armhf]
-
- dep: libgcc-s2 (>= 4.2.1) [m68k]
- Biblioteca de suporte GCC
-
- dep: libgcc-s4 (>= 4.1.1) [hppa]
- Biblioteca de suporte GCC
-
- dep: libicu72 (>= 72.1~rc-1~)
- componentes internacionais para Unicode
-
- dep: libstdc++6 (>= 13.1)
- Biblioteca C++ padrão da GNU v3
-
- dep: libticcutils10 (>= 0.36) [not ia64]
- utility functions used in the context of Natural Language Processing (library)
-
- dep: libticcutils8t64 (>= 0.24) [ia64]
- utility functions used in the context of Natural Language Processing (library)
-
- dep: libucto5t64 (>= 0.21.1) [ia64]
- Unicode Tokenizer - runtime
-
- dep: libucto6 (>= 0.35) [not ia64]
- Unicode Tokenizer - runtime
-
- dep: libunwind8 [ia64]
- biblioteca para determinar a cadeia de chamadas de um programa - execução
-
- dep: uctodata
- Data files for Ucto
Download ucto
Architecture | Version | Package Size | Installed Size | Files |
---|---|---|---|---|
alpha (unofficial port) | 0.35-2 | 29.4 kB | 155.0 kB | [list of files] |
amd64 | 0.35-2 | 32.5 kB | 111.0 kB | [list of files] |
arm64 | 0.35-2 | 28.5 kB | 155.0 kB | [list of files] |
armel | 0.35-2 | 29.5 kB | 153.0 kB | [list of files] |
armhf | 0.35-2 | 29.9 kB | 90.0 kB | [list of files] |
hppa (unofficial port) | 0.35-2 | 29.2 kB | 91.0 kB | [list of files] |
i386 | 0.35-2 | 33.9 kB | 109.0 kB | [list of files] |
ia64 (unofficial port) | 0.21.1-2.1+b1 | 57.0 kB | 144.0 kB | [list of files] |
m68k (unofficial port) | 0.35-2 | 29.8 kB | 105.0 kB | [list of files] |
mips64el | 0.35-2 | 29.1 kB | 156.0 kB | [list of files] |
ppc64 (unofficial port) | 0.35-2 | 30.2 kB | 156.0 kB | [list of files] |
ppc64el | 0.35-2 | 30.2 kB | 154.0 kB | [list of files] |
riscv64 | 0.35-2 | 29.7 kB | 87.0 kB | [list of files] |
s390x | 0.35-2 | 31.2 kB | 102.0 kB | [list of files] |
sh4 (unofficial port) | 0.35-2 | 32.0 kB | 89.0 kB | [list of files] |
sparc64 (unofficial port) | 0.35-2 | 26.5 kB | 1,053.0 kB | [list of files] |
x32 (unofficial port) | 0.35-2 | 32.1 kB | 102.0 kB | [list of files] |