Как спарсить данные с этого сайта

Radzhab

Client
Регистрация
23.05.2014
Сообщения
1 500
Благодарностей
1 263
Баллы
113
Есть сайт http://www.job-mo.ru/res1696608.html .

Нужно вытащить Период работы, должность, компания, обязанности в одну строку. Иногда в резюме несколько мест работы, иногда только одно. Не суть. Вопрос в другом. Как именно спарсить их?

Все теги tr -цепляться не вариант. Регулярки тоже не варик. ЕДинственное - сделать какой нить костыль(это крайний вариант). У кого какие идеи?
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 608
Благодарностей
4 600
Баллы
113
если найду шаб по этому сайту - скажу)
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 608
Благодарностей
4 600
Баллы
113
нашёл. но эти данные не парсил. Почему регулярки не подходят?
 

budora

Client
Регистрация
13.08.2012
Сообщения
831
Благодарностей
554
Баллы
93

Вложения

Последнее редактирование:

kagorec

Client
Регистрация
24.08.2013
Сообщения
924
Благодарностей
478
Баллы
63
В Content Downloader это решается использованием "повторяющиеся границы"
Начало цепляем за "Период работы:"
Конец границы цепляем за "<hr>"

Далее внутри повт.границы использовать внутренние границы.
п.с. в глобальной замене не помешает замена "<td colspan="2"> на <hr><td colspan="2">"
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)