Парсинг ссылок с определенного блока на странице

timoxa949

Client
Регистрация
16.11.2018
Сообщения
158
Благодарностей
27
Баллы
28
Уважаемые,

Подскажите как спарсить ссылки с определенного блока <DIV> на странице? Собираю все ссылки посредством GET запроса, собирается все подряд. Как отфильтровать регуляркой не пойму.

Мне нужно спарсить ссылки на категории товаров в интернет-магазине, также на этой странице имеется блок контента уже с конкретными товарами (а они мне на этом этапе не нужны!).

Ссылки категорий имеют вид:
site.com/products/category
site.com/products/category1
site.com/products/category2

и т.д.

На странице также выводятся товары с ссылками вида:
site.com/products/category/tovar1
site.com/products/category/tovar2
и т.д.

Мне нужны именно категории. Заранее благодарен.
 

Чешир

Client
Регистрация
27.06.2014
Сообщения
1 546
Благодарностей
906
Баллы
113
ну, просто же)))
Сначала собрать все ссылки, потом из списка удалить ссылки которые не содержат
site.com/products/category ... типо всякие доставки и способы оплаты
Потом удалить те, которые содержат
/category/
 
  • Спасибо
Реакции: timoxa949

timoxa949

Client
Регистрация
16.11.2018
Сообщения
158
Благодарностей
27
Баллы
28
ну, просто же)))
Сначала собрать все ссылки, потом из списка удалить ссылки которые не содержат
site.com/products/category ... типо всякие доставки и способы оплаты
Потом удалить те, которые содержат
/category/
Емае)) действительно просто) спасибо товарищ
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)