all options
buster  ] [  bullseye  ] [  bookworm  ] [  trixie  ] [  sid  ]
[ Source: ucto  ]

Package: ucto (0.35-2 and others)

Links for ucto

Screenshot

Debian Resources:

Download Source Package ucto:

Maintainers:

External Resources:

Similar packages:

tokenizador Unicode

Ucto pode tokenizar arquivos de texto codificados em UTF-8 (ou seja, separar as palavras da pontuação, dividir sentenças, gerar n-gramas) e oferece vários outros passos básicos de pré-processamento que deixam seu texto pronto para processamento posterior, como indexação, etiquetagem de partes de fala ou tradução de máquina.

Este pacote fornece a ferramenta de linha de comando em si.

Ucto foi escrito por Maarten van Gompel e Ko van der Sloot. O trabalho no Ucto foi financiado pela NWO, a Organização Holandesa para Pesquisa Científica, sob o projeto Implicit Linguistics, o programa CLARIN-NL e o projeto CLARIAH.

Ucto é um produto do Centro de Tecnologia de Linguagem e Fala (Universidade Radboud Nijmegen) e anteriormente pelo Grupo de Pesquisa ILK (Universidade Tilburg, Holanda).

Se você tiver interesse em análise de máquina de arquivos texto codificados em UTF-8, por exemplo para fazer pesquisa científica em processamento de língua natural, o ucto vai ser útil para você.

Tags: Implemented in: C++, Role: Program

Other Packages Related to ucto

  • depends
  • recommends
  • suggests
  • enhances

Download ucto

Download for all available architectures
Architecture Version Package Size Installed Size Files
alpha (unofficial port) 0.35-2 29.4 kB155.0 kB [list of files]
amd64 0.35-2 32.5 kB111.0 kB [list of files]
arm64 0.35-2 28.5 kB155.0 kB [list of files]
armel 0.35-2 29.5 kB153.0 kB [list of files]
armhf 0.35-2 29.9 kB90.0 kB [list of files]
hppa (unofficial port) 0.35-2 29.2 kB91.0 kB [list of files]
i386 0.35-2 33.9 kB109.0 kB [list of files]
ia64 (unofficial port) 0.21.1-2.1+b1 57.0 kB144.0 kB [list of files]
m68k (unofficial port) 0.35-2 29.8 kB105.0 kB [list of files]
mips64el 0.35-2 29.1 kB156.0 kB [list of files]
ppc64 (unofficial port) 0.35-2 30.2 kB156.0 kB [list of files]
ppc64el 0.35-2 30.2 kB154.0 kB [list of files]
riscv64 0.35-2 29.7 kB87.0 kB [list of files]
s390x 0.35-2 31.2 kB102.0 kB [list of files]
sh4 (unofficial port) 0.35-2 32.0 kB89.0 kB [list of files]
sparc64 (unofficial port) 0.35-2 26.5 kB1,053.0 kB [list of files]
x32 (unofficial port) 0.35-2 32.1 kB102.0 kB [list of files]