konvertuje súbory Microsoft OOXML na čistý text
Tento nástroj sa pokúša zo súboru Microsoft .docx vytvoriť ekvivalentný
textový súbor, pričom čiastočne zachová formátovanie a informácie o
dokumente (ktoré konverzia MS textu zahadzuje) spolu s príslušnými
konverziami znakov. Je to platformovo nezávislé riešenie, ktoré sa skladá z
jadra (v jazyku Perl) a shell skriptov (ktoré jadro volajú) pre unixové
systémy alebo Windows a konfiguračného súboru, ktorý do značnej miery riadi
vzhľad výstupného textu.
Je možné ho veľmi pohodlne použiť na vytvorenie webovej služby na konverziu
dokumentov .docx. Na jednoduchú inštaláciu skriptov poskytuje súbory
Makefile a dávkové súbory Windows. S rozbaľovacími programami ako CakeCmd,
ktoré si poradia s poškodenými archívmi ZIP tento nástroj dokáže v mnohých
prípadoch extrahovať text aj z poškodených dokumentov docx, ktoré MS Word
ani len neotvorí.