convierte archivos Microsoft OOXML a texto plano
Esta herramienta intenta generar archivos equivalentes de texto plano a
partir de Documentos.docx de Microsoft, conservando cierta información del
formato y del documento (que se pierde con la conversión de texto de MS) junto
con conversiones apropiadas del carácter (ascii o utf-8) para una buena
experiencia del texto. Es una solución independiente de la plataforma que
consiste en (núcleo) Perl, (envoltura) scripts de línea de órdenes
Unix/Windows y un
archivo de configuración para controlar en buena medida la apariencia de la
salida de texto. Se puede utilizar cómodamente para construir un
servicio de conversión de documentos docx basado en Web. Se proporcionan
algunos Makefiles y archivos por lotes de Windows para facilitar la
instalación de los scripts. Con descompresores como CakeCmd, que pueden
tratar con archivos Zip corruptos, en muchos casos esta herramienta puede
extraer texto de
documentos docx corruptos que incluso con MS Word no pueden ser abiertos.