Package: ucto (0.30-3 and others) [debports]
Links for ucto
Debian Resources:
Download Source Package :
Not foundMaintainers:
External Resources:
- Homepage [languagemachines.github.io]
Similar packages:
유니코드 토크나이저
Ucto는 UTF-8로 인코드된 텍스트 파일을 토큰화 (예, 구두점과 단어 구분, 문장 분할, n-gram 생성) 할 수 있으며, 인덱싱, 품사 태깅, 또는 기계 번역 같은 추 가 처리에 적합한 텍스트를 만들기 위한 몇가지 기본 전처리 단계를 제공합니다.
이 패키지는 명령행 도구 자체를 제공합니다.
Ucto는 Maarten van Gompel 과 Ko van der Sloot이 개발하였습니다. Ucto에서의 작업은 NWO, 네덜란드 과학 연구 기관, 암묵적 언어학 프로젝트, CLARIN-NL 프로 그램, 및 CLARIAH 프로젝트에 의해 지원되었습니다.
Ucto는 언어 및 음성 기술 센터 (Radboud University Nijmegen) 및 이전 ILK 연 구 그룹 (Tilburg University, The Netherlands)의 제품입니다.
자연어 처리에 대한 과학적 연구처럼, UTF-8로 인코드된 파일의 기계 구문 분석 에 관심이 있다면, ucto는 당신에게 유용할 것입니다.
Other Packages Related to ucto
|
|
|
|
-
- dep: libc6 (>= 2.40)
- GNU C 라이브러리: 공유 라이브러리
also a virtual package provided by libc6-udeb
-
- dep: libfolia19 (>= 2.17)
- Implementation of the FoLiA document format
-
- dep: libgcc-s1 (>= 3.0)
- GCC 기능 지원 라이브러리
-
- dep: libicu72 (>= 72.1~rc-1~)
- 유니코드에 대한 국제적 구성 요소
-
- dep: libstdc++6 (>= 13.1)
- GNU 표준 C++ 라이브러리 v3
-
- dep: libticcutils9 (>= 0.34)
- utility functions used in the context of Natural Language Processing (library)
-
- dep: libucto6 (>= 0.30)
- Unicode Tokenizer - runtime
-
- dep: uctodata
- Data files for Ucto
Download ucto
Architecture | Version | Package Size | Installed Size | Files |
---|---|---|---|---|
sh4 (unofficial port) | 0.30-3+b1 | 25.2 kB | 90.0 kB | [list of files] |