Правильность регулярного выражения...

inotoxic

Client
Регистрация
20.04.2015
Сообщения
354
Благодарностей
162
Баллы
43
Подскажите что не правильно делаю...
Нужно спарсить страницы на сайте по тегу h1.

Код:
<header class="entry-header">
<h1 class="entry-title">
<a title="Риск, вход, стоп-лосс и цель" href="http://foreks-tim.ru/risk-vxod-stop-loss-i-cel/">Риск, вход, стоп-лосс и цель</a>
</h1>
</header>
использую регулярку - вида
(?<=<h1\ class="entry-title">\ <\ href=").*?(?=")
и ничего не находит.

Хотя на этом сайте
Код:
<div class="description">
<h3 class="title">
<a title="Недвижимость (Черногория) в Москве" href="/moskva/nedvizhimost_za_rubezhom/nedvizhimost_chernogoriya_123683741"> Недвижимость (Черногория)</a>
</h3>
регулярка - вида
(?<=<h3\ class="title">\ <a\ href=").*?(?=") - парсит результат

Подскажите, где ошибка в первой регулярке?
Спасибо!
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 167
Благодарностей
2 168
Баллы
113
Код:
<header class="entry-header">
<h1 class="entry-title">
<a title="Риск, вход, стоп-лосс и цель" href="http://foreks-tim.ru/risk-vxod-stop-loss-i-cel/">Риск, вход, стоп-лосс и цель</a>
</h1>
</header>
использую регулярку - вида
(?<=<h1\ class="entry-title">\ <\ href=").*?(?=")
и ничего не находит.
Код:
(?<=<h1\ class="entry-title">[\w\W]*href=").*?(?=">)
найдет:
Код:
http://foreks-tim.ru/risk-vxod-stop-loss-i-cel/
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)