Paquet : ucto (0.30-3 et autres)
Liens pour ucto
Ressources Debian :
- Rapports de bogues
- Developer Information
- Journal des modifications Debian
- Fichier de licence
- Suivis des correctifs pour Debian
Télécharger le paquet source ucto :
Responsables :
- Debian Science Team (Page QA, Archive du courrier électronique)
- Maarten van Gompel (Page QA)
- Ko van der Sloot (Page QA)
Ressources externes :
- Page d'accueil [languagemachines.github.io]
Paquets similaires :
analyseur lexical pour Unicode
Ucto produit des unités lexicales à partir d’un fichier texte encodé en UTF-8 (c'est-à-dire, séparer les mots de la ponctuation, scinder les phrases, créer des n-grammes…) et offre plusieurs dispositions de prétraitement basiques pouvant adapter le texte pour un traitement ultérieur tel que l’indexation, le marquage de partie de discours ou une traduction automatique.
Ce paquet fournit l’outil en ligne de commande.
Ucto a été écrit par Maarten van Gompel et Ko van der Sloot. Le travail sur Ucto a été financé par NWO, l’organisation néerlandaise pour la recherche scientifique, sous la conduite du projet « Implicit Linguistics », du programme CLARIN-NL et du projet CLARIAH.
Ucto est un produit du « Centre of Language and Speech Technology » (université Radboud de Nimègue), et antérieurement du « ILK Research Group » (université de Tilbourg, Pays-Bas).
En cas d’intérêt pour une machine analysant des fichiers de texte encodé en UTF-8, par exemple pour faire de la recherche scientifique dans le traitement du langage naturel, Ucto est probablement à utiliser.
Autres paquets associés à ucto
|
|
|
|
-
- dep: libc6 (>= 2.34) [non alpha, ia64, sh4]
- bibliothèque C GNU : bibliothèques partagées
un paquet virtuel est également fourni par libc6-udeb
- dep: libc6 (>= 2.37) [sh4]
-
- dep: libc6.1 (>= 2.34) [alpha]
- bibliothèque C GNU : bibliothèques partagées
un paquet virtuel est également fourni par libc6.1-udeb
- dep: libc6.1 (>= 2.37) [ia64]
-
- dep: libfolia14 (>= 2.4) [ia64]
- Implementation of the FoLiA document format
-
- dep: libfolia19 (>= 2.17) [non ia64]
- Implementation of the FoLiA document format
-
- dep: libgcc-s1 (>= 3.0) [non armel, armhf, hppa, ia64, m68k]
- bibliothèque de prise en charge de GCC
- dep: libgcc-s1 (>= 3.5) [armel, armhf]
-
- dep: libgcc-s2 (>= 4.2.1) [m68k]
- bibliothèque de prise en charge de GCC
-
- dep: libgcc-s4 (>= 4.1.1) [hppa]
- bibliothèque de prise en charge de GCC
-
- dep: libicu72 (>= 72.1~rc-1~)
- composants internationaux pour Unicode
-
- dep: libstdc++6 (>= 13.1)
- bibliothèque standard C++ de GNU v3
-
- dep: libticcutils8t64 (>= 0.24) [ia64]
- utility functions used in the context of Natural Language Processing (library)
-
- dep: libticcutils9 (>= 0.34) [non ia64]
- utility functions used in the context of Natural Language Processing (library)
-
- dep: libucto5t64 (>= 0.21.1) [ia64]
- Unicode Tokenizer - runtime
-
- dep: libucto6 (>= 0.30) [non ia64]
- Unicode Tokenizer - runtime
-
- dep: libunwind8 [ia64]
- bibliothèque pour déterminer la chaîne d'appel d'un programme –⋅exécutable
-
- dep: uctodata
- fichiers de données pour Ucto
Télécharger ucto
Architecture | Version | Taille du paquet | Espace occupé une fois installé | Fichiers |
---|---|---|---|---|
alpha (portage non officiel) | 0.30-3 | 23,5 ko | 90,0 ko | [liste des fichiers] |
amd64 | 0.30-3+b1 | 25,3 ko | 87,0 ko | [liste des fichiers] |
arm64 | 0.30-3+b1 | 23,1 ko | 91,0 ko | [liste des fichiers] |
armel | 0.30-3+b1 | 23,4 ko | 82,0 ko | [liste des fichiers] |
armhf | 0.30-3+b1 | 23,2 ko | 70,0 ko | [liste des fichiers] |
hppa (portage non officiel) | 0.30-3+b1 | 23,2 ko | 75,0 ko | [liste des fichiers] |
i386 | 0.30-3+b1 | 25,8 ko | 86,0 ko | [liste des fichiers] |
ia64 (portage non officiel) | 0.21.1-2.1+b1 | 57,0 ko | 144,0 ko | [liste des fichiers] |
m68k (portage non officiel) | 0.30-3+b1 | 23,0 ko | 82,0 ko | [liste des fichiers] |
mips64el | 0.30-3+b1 | 23,2 ko | 93,0 ko | [liste des fichiers] |
ppc64 (portage non officiel) | 0.30-3+b1 | 24,1 ko | 93,0 ko | [liste des fichiers] |
ppc64el | 0.30-3+b1 | 24,2 ko | 91,0 ko | [liste des fichiers] |
riscv64 | 0.30-3+b1 | 23,8 ko | 75,0 ko | [liste des fichiers] |
s390x | 0.30-3+b1 | 24,6 ko | 83,0 ko | [liste des fichiers] |
sh4 (portage non officiel) | 0.30-3 | 25,2 ko | 89,0 ko | [liste des fichiers] |
sparc64 (portage non officiel) | 0.30-3+b1 | 22,0 ko | 1 054,0 ko | [liste des fichiers] |
x32 (portage non officiel) | 0.30-3+b1 | 24,7 ko | 83,0 ko | [liste des fichiers] |