Помогите, пожалуйста в написании парсера.

ZSHab

Client
Регистрация
29.10.2014
Сообщения
220
Благодарностей
22
Баллы
18
Добрый день, уважаемые форумчане, помогите, пожалуйста в вопросе написания парсера.
Уже написал (почти), осталось мелочь, которую никак не могу осуществить.
Суть парсера заключается в вытягивании данных определённых строк из кода страницы.
Есть 2 проблемы:
1- как в зеннопостере перейти к коду страницы?
2- как записать только определённые строки? (которые, к примеру начинаются с "</div><div class="name_pt">" без кавычек и заканчиваются"</a></div>")
Был бы безумно признателен, на всякий случай оставлю свой почтовый ящик: [email protected]
 

KirillOFF

Client
Регистрация
18.12.2010
Сообщения
1 127
Благодарностей
516
Баллы
113
Посмотрите обучающие проекты и видео-уроки.
 

ZSHab

Client
Регистрация
29.10.2014
Сообщения
220
Благодарностей
22
Баллы
18

СТЕПАН

Moderator
Регистрация
17.03.2013
Сообщения
951
Благодарностей
352
Баллы
63
Добрый день, уважаемые форумчане, помогите, пожалуйста в вопросе написания парсера.
Уже написал (почти), осталось мелочь, которую никак не могу осуществить.
Суть парсера заключается в вытягивании данных определённых строк из кода страницы.
Есть 2 проблемы:
1- как в зеннопостере перейти к коду страницы?
2- как записать только определённые строки? (которые, к примеру начинаются с "</div><div class="name_pt">" без кавычек и заканчиваются"</a></div>")
Был бы безумно признателен, на всякий случай оставлю свой почтовый ящик: [email protected]
https://wiki.zennolab.com/doku.php?id=ru:creating-a-regular-expressions
 
  • Спасибо
Реакции: ZSHab

ZSHab

Client
Регистрация
29.10.2014
Сообщения
220
Благодарностей
22
Баллы
18
Большое спасибо, но всё же я не совсем до конца понял, как это осуществить (сам код)
 

ZSHab

Client
Регистрация
29.10.2014
Сообщения
220
Благодарностей
22
Баллы
18
Все эти строки имею примерно такой формат:
Мне нужно, чтобы извлекало строки
</div><div class="name_pt"><a href="Random" id='Random_Name'>Random</a></div>
Словом помечены данные, которые меняются в строках...
 

LexxWork

Client
Регистрация
31.10.2013
Сообщения
1 190
Благодарностей
785
Баллы
113
(?<=<div[^>]*?class="name_pt"[^>]*?><a[^>]+id[^>]*?>).+(?=</a>)
 
  • Спасибо
Реакции: ZSHab

ZSHab

Client
Регистрация
29.10.2014
Сообщения
220
Благодарностей
22
Баллы
18
(?<=<div[^>]*?class="name_pt"[^>]*?><a[^>]+id[^>]*?>).+(?=</a>)
Большое спасибо за код, но ещё один маленький нюанс я не знаю как осуществить, сама операция. Заход на страницу и настройки, вход, это ясно, но вот как в зенке сделать, чтобы она вытягивала из кода страницы именно такие строки и сохраняла их в текстовый файл, к примеру?
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 705
Баллы
113
Операции с текстом - Regex
В качестве текста использовать можно переменную {-Page.Dom-} или {-Page.Source-}
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)