Как спарсить ссылки на картинки?

dimeor

Client
Регистрация
23.02.2018
Сообщения
16
Благодарностей
1
Баллы
3
Приветствую, Задача спарсить ссылки на картинки с доски обьявлений. ( Тренируюсь на курсе от rostonix )

Пробую вытягивать регуляркой, но вместо 3х-4х нужных ( нужные в отдельном блоке, как я понял ) получается от 10-16 левых, которые находятся в это время на стр.

Моя регулярка: https://reklamasevproduction\.s3\.amazonaws\.com/advt_photo/.*?(?=")
Screenshot_4.png


Вот пример того, что я хочу спарсить : https://simferopol.reklama-crimea.com/advts/1071479
Screenshot_3.png
 

itserviceinс

Активный пользователь
Регистрация
12.11.2017
Сообщения
108
Благодарностей
30
Баллы
28
сначала этот блок
Код:
<div class="image-holder">(.*?)<p class="price">
достань, а потом в нём ищи картинки.
 

dimeor

Client
Регистрация
23.02.2018
Сообщения
16
Благодарностей
1
Баллы
3
Последнее редактирование:

kapelan28

Client
Регистрация
22.09.2015
Сообщения
469
Благодарностей
185
Баллы
43
Получилось вытащить блок, но там из 3х нужных 3 еще миниатюры ( таких же картинки, но меньше ) что делать?
как вариант - переносить все ссылки в список, а из этого списка брать только те ссылки, которые содержат big и сохранять их уже в другой список (либо из того списка удалять строки, которые не содержат big)
 
  • Спасибо
Реакции: dimeor и Sergodjan

404

Client
Регистрация
23.09.2011
Сообщения
112
Благодарностей
58
Баллы
28
Получилось вытащить блок, но там из 3х нужных 3 еще миниатюры ( таких же картинки, но меньше ) что делать?
1. спарсить все ссылки изображений
2. в спаршенных ссылках удалить thumb_ и big_, получишь ссылки на оригинальные изображения
 
  • Спасибо
Реакции: dimeor и Sergodjan

dimeor

Client
Регистрация
23.02.2018
Сообщения
16
Благодарностей
1
Баллы
3
Решил задачу, просто удалил строку содержащую thumb_ и получил в список только большие и нужные мне фото, спасибо.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)