Не могу понять как парсить НЕ через браузер

Регистрация
14.12.2017
Сообщения
32
Благодарностей
4
Баллы
8
Допустим у нас есть страница. Я хочу взять ID пользователя.
Пример:
Тут парсят Номер задания с ютуб на Сеоспринте, взято с конкурса
(?<=№\ ).*(?=\ -\ YouTube)|(?<=№\ ).*?(?=\ -\ Только)
не могу понять как мне спарсить ID на странице, где брать все эти значения? и как их прописать?
 

kapelan28

Client
Регистрация
22.09.2015
Сообщения
469
Благодарностей
185
Баллы
43
Парсинг без браузера - делать get-запрос к нужной странице, получать тело страницы и используя нужную регулярку вытягивать нужную информацию (это если коротко). Каждый сайт индивидуален, могут быть свои нюансы.
 
Регистрация
14.12.2017
Сообщения
32
Благодарностей
4
Баллы
8
Допустим хотят вытянуть цену задания
так это делается - (?<=<span\ class="clickprice"\ style="margin-right:\ 10px;">).*руб
вот это из тела - <span class="clickprice" style="margin-right: 10px;">0.50 руб</span>
для чего ставят лишние "\" и как именно получают "0.5" оставляя пустое место?
 

kapelan28

Client
Регистрация
22.09.2015
Сообщения
469
Благодарностей
185
Баллы
43
Допустим хотят вытянуть цену задания
так это делается - (?<=<span\ class="clickprice"\ style="margin-right:\ 10px;">).*руб
вот это из тела - <span class="clickprice" style="margin-right: 10px;">0.50 руб</span>
для чего ставят лишние "\" и как именно получают "0.5" оставляя пустое место?
вот наглядный вариант http://joxi.ru/J2blxMaFXDV1Yr
Помещаете нужный текст в форму, подбираете условия поиска для нужного результата, а сверху в поле автоматически создается вариант регулярки
 
Регистрация
14.12.2017
Сообщения
32
Благодарностей
4
Баллы
8

kapelan28

Client
Регистрация
22.09.2015
Сообщения
469
Благодарностей
185
Баллы
43
  • Спасибо
Реакции: Jura Menshikov
Регистрация
14.12.2017
Сообщения
32
Благодарностей
4
Баллы
8
ProjectMaker - конструктор шаблонов для ZennoPoster. Если такие вещи не знаете, то стоит начать с самых азов и посмотреть видеоуроки
такие вкладки как на картинке у вас не нашел) но уже разобрался со своим рег выражением) и доделал программу) парсит!) СПАСИБО ВАМ!
 

kapelan28

Client
Регистрация
22.09.2015
Сообщения
469
Благодарностей
185
Баллы
43
такие вкладки как на картинке у вас не нашел) но уже разобрался со своим рег выражением) и доделал программу) парсит!) СПАСИБО ВАМ!
да там искать особо не надо - открыли ПМ, перешли в расширенный редактор и будет нужный интерфейс )
 

smartwisard

Client
Регистрация
17.01.2017
Сообщения
824
Благодарностей
82
Баллы
28
Сделал шаблон, он по очереди открывает объявления сайта, собирает почты и прочее. Как можно ускорить?
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
19 468
Благодарностей
8 689
Баллы
113
Сделал шаблон, он по очереди открывает объявления сайта, собирает почты и прочее. Как можно ускорить?
заменить процедуру сбора, вставив вместо перехода на урл объявления в браузере, GET-запрос на этот урл, забирать в переменную содержимое страницы и парсить нужные данные..
правда, нужно проверять, будут ли данные в том же виде и будут ли вообще, а также может потребоваться правка регулярки..
но это не точно (с) ...
 

smartwisard

Client
Регистрация
17.01.2017
Сообщения
824
Благодарностей
82
Баллы
28

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)