ok.ru/members-ic-online_* (как спарсить пользователей группы онлайн?)

Aleksey

Client
Регистрация
27.09.2015
Сообщения
3
Благодарностей
1
Баллы
3
Всем здравствуйте! Люди пожалуйста помогите - 3ий день бьюсь - не могу алгоритм выработать -
цель: получить список онлайн участников любой группы ok.ru.

Пробовал реализовывать так - авторизуемся в ok.ru - переходим в любую открытую группу -> ok.ru/name_group/members - на выдаче имеем пользователей группы, часть из которых помечена оранжевым или синим кружком в левом нижнем углу, что обозначает их - как онлайн. (имеет span -> ic-online и ic-online_mob

Пробую вытащить через - DOM - парсить результат - в список - перебрал кучу вариантов регулярок, пробовал получать данные пошагово по разметке - сужая отрезки в коде - результат выходит за пределы пользователей онлайн.

При задании регулярок учитывал и самое короткое совпадение и перенос строк....

Люди, кто сталкивался помогите!
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
19 462
Благодарностей
8 686
Баллы
113
Всем здравствуйте! Люди пожалуйста помогите - 3ий день бьюсь - не могу алгоритм выработать -
цель: получить список онлайн участников любой группы ok.ru.

Пробовал реализовывать так - авторизуемся в ok.ru - переходим в любую открытую группу -> ok.ru/name_group/members - на выдаче имеем пользователей группы, часть из которых помечена оранжевым или синим кружком в левом нижнем углу, что обозначает их - как онлайн. (имеет span -> ic-online и ic-online_mob

Пробую вытащить через - DOM - парсить результат - в список - перебрал кучу вариантов регулярок, пробовал получать данные пошагово по разметке - сужая отрезки в коде - результат выходит за пределы пользователей онлайн.

При задании регулярок учитывал и самое короткое совпадение и перенос строк....

Люди, кто сталкивался помогите!
вот такой шабик наваял сейчас, вроде все путем получается - парсит только онлайновых..
cуть в том, что сначала парсятся html-блоки онлайн юзеров, в список попадают какие то левые блоки, но это не беда, я их потом на след. этапе регуляркой и IF отбрасываю..

upload_2016-9-11_18-6-19.png

вот результат:

upload_2016-9-11_18-6-59.png
 

Вложения

  • Спасибо
Реакции: Aleksey

Aleksey

Client
Регистрация
27.09.2015
Сообщения
3
Благодарностей
1
Баллы
3
вот такой шабик наваял сейчас, вроде все путем получается - парсит только онлайновых..
cуть в том, что сначала парсятся html-блоки онлайн юзеров, в список попадают какие то левые блоки, но это не беда, я их потом на след. этапе регуляркой и IF отбрасываю..

Посмотреть вложение 15300

вот результат:

Посмотреть вложение 15301
Спасибо большое за наводку - чуть подправил под себя и все пошло как по маслу) - еще раз спасибо за интересную подачу - для себя взял использование регулярок и логики при парсе!!! Это как раз то, что нужно было!
 
  • Спасибо
Реакции: Sergodjan

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)