Google.Parser

TwistDanceR

Активный пользователь
Регистрация
30.05.2019
Сообщения
479
Благодарностей
200
Баллы
43
Добрый день.
Ответа на свой вопрос я на форуме не нашёл(/плохо искал?), и на правах неопытного юзверя (Зеннка у меня около двух недель) - создаю тему в этом разделе.

У меня сейчас есть готовый парсер выдачи гугла для n запросов в интересующей меня локации,
Парсит он урлы со страницы гугла через регулярку, так что в отчёт попадают breadcrumbs и сокращения.

Я уже нарисовал "на бумаге" цикл: ["открыть ссылку №0-9 по совпадению", get {-Page.URL-}, закрытие вкладки, увеличение номера совпадения...] ну и так далее, всё хранится в таблице навечно, по совпадению подгружается куда надо в конечный файл.

Собственно вопрос: а можно ли как-нибудь вытащить конечный href этой страницы из Popup окна без переходов по ссылкам, прямо на странице гугла и получить "чистый" URL открываемой ссылки без крошек/сокращений? Если да - с радостью почитаю ссылки и комментарии, идеи и наставления по поводу - как разобрать на куски это действие.

Большое спасибо за внимание и комменты. Юрий, twist.
 

gevolushn

Известная личность
Регистрация
25.03.2019
Сообщения
518
Благодарностей
269
Баллы
63
Я парсил на странице поискового запроса такой регуляркой:
Код:
(?<=class="r"><a\ href=")[\w\W]*?(?=")
Вытягиваются только url'ы.
 
  • Спасибо
Реакции: specialist и TwistDanceR

TwistDanceR

Активный пользователь
Регистрация
30.05.2019
Сообщения
479
Благодарностей
200
Баллы
43
Я парсил на странице поискового запроса такой регуляркой:
Код:
(?<=class="r"><a\ href=")[\w\W]*?(?=")
Вытягиваются только url'ы.
Спасибо, Denomm. У меня как раз моими махинациями другая регулярка была.
Надо по ходу дела побольше теории читать)
 
Последнее редактирование:

evgen2208

Client
Регистрация
12.10.2016
Сообщения
130
Благодарностей
162
Баллы
43
в статье в подписи пример есть парсинга гугла и через ГЕТ и через браузер
 
  • Спасибо
Реакции: TwistDanceR

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)