Добрый день
Можно Вам идею подкинуть :) ?
Допустим у меня есть скан текста в Word , я его сохряняю в HTML и отдаю вашей программе . Программа с учетом предварительной разметки в Word и последующим сохранением в HTML ( H1 теги) понимает где заголовок статьи , а где подзаголовки . Программа...