Анонимность в парсер

Alex62

Client
Регистрация
16.10.2015
Сообщения
226
Благодарностей
31
Баллы
28
Добрый день, подскажите, написал парсер olx на post запросах, без браузера. Очень часто возникает ситуация что возвращает телефон вида 000-000-00-00.

Думаю может это из-за того что у меня не уникальный userAgent.

В связи с этим вопрос, нужно ли генерировать разные userAgent для парсинга? Если да, то подскажите как это делать?
 

Dexio

Client
Регистрация
09.05.2014
Сообщения
1 254
Благодарностей
220
Баллы
63
Добрый день, подскажите, написал парсер olx на post запросах, без браузера. Очень часто возникает ситуация что возвращает телефон вида 000-000-00-00.

Думаю может это из-за того что у меня не уникальный userAgent.

В связи с этим вопрос, нужно ли генерировать разные userAgent для парсинга? Если да, то подскажите как это делать?
Скачать список агентов, положить в файл-список и рандомно брать и подставлять
 
  • Спасибо
Реакции: Alex62

Alex62

Client
Регистрация
16.10.2015
Сообщения
226
Благодарностей
31
Баллы
28
Скачать список агентов, положить в файл-список и рандомно брать и подставлять
у меня вот есть несколько c# кубиков, которые генерируют юзерагента, но почему то они не срабатывают в данном шаблоне, выдает ошибку. По ошибке писал здесь http://zennolab.com/discussion/threads/kompiljacija-koda-oshibka-v-dejstvii-cs1002-ozhidalas-stroka-9-ctolbec-16.47542/
 

Dexio

Client
Регистрация
09.05.2014
Сообщения
1 254
Благодарностей
220
Баллы
63
Если хоть в одном из кубиков ошибка-не будут работать все. И зачем такой танец с бубном? Берите готовый список, это же не id компа генерировать. Они плюс минус стандарнтые
 
  • Спасибо
Реакции: Alex62

Alex62

Client
Регистрация
16.10.2015
Сообщения
226
Благодарностей
31
Баллы
28
Если хоть в одном из кубиков ошибка-не будут работать все. И зачем такой танец с бубном? Берите готовый список, это же не id компа генерировать. Они плюс минус стандарнтые
прикол в том, что в отдельном шаблоне он выполняется успешно
 

kagorec

Client
Регистрация
24.08.2013
Сообщения
923
Благодарностей
477
Баллы
63
у меня вот есть несколько c# кубиков, которые генерируют юзерагента, но почему то они не срабатывают в данном шаблоне, выдает ошибку. По ошибке писал здесь http://zennolab.com/discussion/threads/kompiljacija-koda-oshibka-v-dejstvii-cs1002-ozhidalas-stroka-9-ctolbec-16.47542/
Зачем вам этот "бредогенератор", используйте оригинальные useragent-ы. Сайты сейчас на раз вычисляют правильность useragent
 
  • Спасибо
Реакции: Alex62

Dexio

Client
Регистрация
09.05.2014
Сообщения
1 254
Благодарностей
220
Баллы
63
прикол в том, что в отдельном шаблоне он выполняется успешно
Значит один из кубиков в этом шаблоне- бракованый. Не факт что именно этот. У меня была аналогичная проблема.
А вообще, как ниже ответил товарищ kagorec. Не надо генерировать. Используйте уже проверенные+доверенные
 
  • Спасибо
Реакции: Alex62

Alex62

Client
Регистрация
16.10.2015
Сообщения
226
Благодарностей
31
Баллы
28
Достаточно будет одних useragentов для анонимности парсинга? или нужно что то еще менять?
 

alekwuy

Client
Регистрация
06.04.2013
Сообщения
1 631
Благодарностей
461
Баллы
83

Alex62

Client
Регистрация
16.10.2015
Сообщения
226
Благодарностей
31
Баллы
28

ibred

Client
Регистрация
04.04.2015
Сообщения
3 835
Благодарностей
3 544
Баллы
113
Думаю может это из-за того что у меня не уникальный userAgent.
Он не должен быть уникальным, иначе Вы будете выделяться в общем потоке.
Useragent просто должен быть актуальным.

Если Вы получаете не тот результат, который нужен, вероятно какой-то из параметров не досылаете. Самый частый случай.
 
  • Спасибо
Реакции: Alex62

Alex62

Client
Регистрация
16.10.2015
Сообщения
226
Благодарностей
31
Баллы
28
Он не должен быть уникальным, иначе Вы будете выделяться в общем потоке.
Useragent просто должен быть актуальным.
То есть 1 раз установить в начале выполнения скрипта, а потом просто менять прокси, и этого будет достаточно?
Я так понял ОЛХ не дает скачивать массово телефон, да и пагинацию. Для скачивания страниц хватало смены прокси. А с телефонами полагаю сложнее ... может что то еще нужно?

Если Вы получаете не тот результат, который нужен, вероятно какой-то из параметров не досылаете. Самый частый случай.
ИНОГДА, не всегда, приходит в ответ с телефоном 000 000 00 00 (когда достигнут лимит на парсинг телефона) или пустым (тогда, когда не достучался, возможно плохая прокси). А так получаю номера
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)