Открыть в МSOffice => Сохранить в формате *mht. Затем расширение заменить на *txt и можно парсить)
Расскажите пожалуйста, как это сделать?Сегодня doc - это же вообще xml, в чем проблема-то?
искать что то в архиве не есть комильфо. Используйте либуdocx - можно распаковать zip и далее найти все что нужно
вопрос может ли зенка распаковывать файлы
Нужны вытащить с файла цифры, выделенные жирным шрифтом :Что именно в док файле нужно? Таблицы, параграфы