toutes les options
buster  ] [  bullseye  ] [  bookworm  ] [  trixie  ] [  sid  ]
[ Paquet source : uctodata  ]

Paquet : uctodata (0.8-2)

Liens pour uctodata

Screenshot

Ressources Debian :

Télécharger le paquet source uctodata :

Responsables :

Ressources externes :

Paquets similaires :

fichiers de données pour Ucto

Ucto produit des unités lexicales à partir d’un fichier texte encodé en UTF-8 (c'est-à-dire, séparer les mots de la ponctuation, scinder les phrases, créer des n-grammes…) et offre plusieurs dispositions de prétraitement basiques pouvant adapter le texte pour un traitement ultérieur tel que l’indexation, le marquage de partie de discours ou une traduction automatique.

Ce paquet fournit les fichiers de données nécessaires et spécifiques aux langues pour utiliser Ucto.

Ucto a été écrit par Maarten van Gompel et Ko van der Sloot. Le travail sur Ucto a été financé par NWO, l’organisation néerlandaise pour la recherche scientifique, sous la conduite du projet « Implicit Linguistics », du programme CLARIN-NL et du projet CLARIAH.

Ucto est un produit du « Centre of Language and Speech Technology » (université Radboud de Nimègue), et antérieurement du « ILK Research Group » (université de Tilbourg, Pays-Bas).

Télécharger uctodata

Télécharger pour toutes les architectures proposées
Architecture Taille du paquet Espace occupé une fois installé Fichiers
all 20,3 ko112,0 ko [liste des fichiers]