converte file OOXML di Microsoft in testo semplice
Questo strumento cerca di generare file di testo semplice equivalenti a
partire da documenti .docx di Microsoft, preservando parte della
formattazione e delle informazioni sul documento (che la conversione in
testo di MS elimina) insieme con conversioni di carattere appropriate per
una buona esperienza testuale (ASCII o UTF-8). È una soluzione indipendente
dalla piattaforma che consiste di script di shell Perl (il cuore) e
Unix/Windows (wrapper) e di un file di configurazione per controllare in
buona misura l'aspetto del testo di output. Può essere usato molto
comodamente per creare un servizio di conversione di documenti docx basato
sul web. Sono forniti alcuni Makefile e file batch di Windows per una
facile installazione degli script. Con strumenti per decompressione come
CakeCmd che possono lavorare con archivi Zip corrotti, questo strumento può
estrarre testo da documenti docx corrotti in molti casi in cui il programma
di videoscrittura di MS non riesce nemmeno ad aprirli.