all options
buster  ] [  bullseye  ] [  bookworm  ] [  trixie  ] [  sid  ]
[ Source:  ]

Package: ucto (0.30-3 and others) [debports]

Links for ucto

Screenshot

Debian Resources:

Download Source Package :

Not found

Maintainers:

External Resources:

Similar packages:

유니코드 토크나이저

Ucto는 UTF-8로 인코드된 텍스트 파일을 토큰화 (예, 구두점과 단어 구분, 문장 분할, n-gram 생성) 할 수 있으며, 인덱싱, 품사 태깅, 또는 기계 번역 같은 추 가 처리에 적합한 텍스트를 만들기 위한 몇가지 기본 전처리 단계를 제공합니다.

이 패키지는 명령행 도구 자체를 제공합니다.

Ucto는 Maarten van Gompel 과 Ko van der Sloot이 개발하였습니다. Ucto에서의 작업은 NWO, 네덜란드 과학 연구 기관, 암묵적 언어학 프로젝트, CLARIN-NL 프로 그램, 및 CLARIAH 프로젝트에 의해 지원되었습니다.

Ucto는 언어 및 음성 기술 센터 (Radboud University Nijmegen) 및 이전 ILK 연 구 그룹 (Tilburg University, The Netherlands)의 제품입니다.

자연어 처리에 대한 과학적 연구처럼, UTF-8로 인코드된 파일의 기계 구문 분석 에 관심이 있다면, ucto는 당신에게 유용할 것입니다.

Other Packages Related to ucto

  • depends
  • recommends
  • suggests
  • enhances

Download ucto

Download for all available architectures
Architecture Version Package Size Installed Size Files
sh4 (unofficial port) 0.30-3+b1 25.2 kB90.0 kB [list of files]