Zenno5 - как спарсить все нужные ссылки со страницы?

TriangleSun

Новичок
Регистрация
08.09.2013
Сообщения
20
Благодарностей
1
Баллы
3
На Ютубе полно видео под 3 версию Zenno, а вот с пятой как-то не густо.
Подскажите пожалуйста как парсить все ссылки по маске, например зная что в нужных ссылках /user/.
Если у кого есть простенький шаблон показывающий парсинг в Zenno5, буду крайне благодарен если выложите в образовательных целях :-)
 

ZennoScript

Moderator
Регистрация
04.03.2011
Сообщения
4 450
Благодарностей
1 880
Баллы
113
Табы - данные - выбираете там ДОМ, ставите парсить результат и в появившееся поле вставляете регулярное выражение. Дальше выбираете все совпадения и вкладываете результат в список.
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113

Acidityrain

Новичок
Регистрация
24.04.2015
Сообщения
1
Благодарностей
0
Баллы
1

Astraport

Client
Регистрация
01.05.2015
Сообщения
4 944
Благодарностей
4 353
Баллы
113
Я пытаюсь спарсить все ссылки выдачи Бинга такой регуляркой:
Код:
(?<=href=").*(?=/">)
но в списке появляется только три десятка пустых строк и пара огромных кусков JS кода.
 

VladZen

Administrator
Команда форума
Регистрация
05.11.2014
Сообщения
22 269
Благодарностей
5 853
Баллы
113
Регулярку нужно взять поточнее - (?<=href=")http.*?(?=")
 

Astraport

Client
Регистрация
01.05.2015
Сообщения
4 944
Благодарностей
4 353
Баллы
113
Ага, работает, такая тоже <a[^>]+href="http:([^ >]+)[^>]*>(.*?)</a>
Теперь мне нужно из списка удалить все строки в которых встречаются части типа microsoft, bing, yandex, google и т. д. Есть под это регулярка? Или может быть другой способ есть исключить ссылки на внутренние страницы поисковика и рекламные ссылки?
 

Astraport

Client
Регистрация
01.05.2015
Сообщения
4 944
Благодарностей
4 353
Баллы
113
Жаль нельзя править посты.
В общем экшен для списков Удалить элементы удовлетворяющие регулярному выражению microsoft.* - работает! Всем спасибо. Способ корявенький, но универсальный и не зависит от смены верстки поисковика. Хотя может лишнего напарсить.
 

CmauJluk

Client
Регистрация
25.12.2017
Сообщения
287
Благодарностей
60
Баллы
28
Не могу подобрать регулярку... В коде выглядит так, а если навести показывает полностью..... как выдрать полную ссылку не могу понять
Ссылка на код страницы
https://yadi.sk/d/6gNC2GDD3SR8u6

Не понимаю почему но кроме фото я не могу не чего загружать
 

Вложения

kapelan28

Client
Регистрация
22.09.2015
Сообщения
469
Благодарностей
185
Баллы
43
Не могу подобрать регулярку... В коде выглядит так, а если навести показывает полностью..... как выдрать полную ссылку не могу понять
Ссылка на код страницы
https://yadi.sk/d/6gNC2GDD3SR8u6

Не понимаю почему но кроме фото я не могу не чего загружать
я такую же проблему решил путем кубика Замена, где к началу спаршенной ссылки добавлял домен, чтобы получался полный url. А у одного человека видел реализацию немного по другому - он сразу сохранял строку в виде - http://site.ru/{переменная с оставшейся частью ссылки}
 
  • Спасибо
Реакции: CmauJluk

CmauJluk

Client
Регистрация
25.12.2017
Сообщения
287
Благодарностей
60
Баллы
28
где к началу спаршенной ссылки добавлял домен
Я так и делаю, но вдруг кто чего посоветует

В моем случае если так делаешь 21 ссылка в начале которая мне не нужна... как убрать тоже не знаю
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 613
Благодарностей
4 601
Баллы
113
полную ссылку формирует зенно. Через парсинг регулярками полную ссылку не получить, только замена
 
  • Спасибо
Реакции: CmauJluk

CmauJluk

Client
Регистрация
25.12.2017
Сообщения
287
Благодарностей
60
Баллы
28

Вложения

doc

Client
Регистрация
30.03.2012
Сообщения
8 613
Благодарностей
4 601
Баллы
113

CmauJluk

Client
Регистрация
25.12.2017
Сообщения
287
Благодарностей
60
Баллы
28

doc

Client
Регистрация
30.03.2012
Сообщения
8 613
Благодарностей
4 601
Баллы
113
если лишнее то, что короткое, то /moskva/[^/"]+/.+?(?=")
 
  • Спасибо
Реакции: CmauJluk

CmauJluk

Client
Регистрация
25.12.2017
Сообщения
287
Благодарностей
60
Баллы
28

kolik

Client
Регистрация
11.12.2017
Сообщения
47
Благодарностей
8
Баллы
8
Всем привет, сильно палками не кидайтесь, я только учусь. Как спарсить ссылки такого формата
Код:
<a data-sid="1785" href="#" style="color:green;" class="surf">Заработок на соцсетях много заданий.</a>
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)