Как обойти такой бан - ваши варианты

nomarketing

Client
Регистрация
01.11.2013
Сообщения
907
Благодарностей
178
Баллы
43
На сайте как я понял, стоит бан, для тех кто делает частые запросы, или время переходов.
Единственно что приходит в голову это прокси... но дело в том что мне нужна точность, т.е что бы к примеру дапазон страниц был пропашен а не рандомно (где прокатило а где нет) я понимаю что как раз этим и занимается зенно постер - да зенно постер он делает это т.е сможет сделать а вы что думали ? но вот просто я хочу как то сделать по проще - ведь надо где то брать прокси и все - такое.
Может есть какие нибудь другие варианты ? - я думал написать админам письмо мол плохо видно медленно грузится что не могу оценить красоту ихнего сайта так как у меня руки быстрые мыш бывает по два раза за секунду клацаю, что бы просто на часик убрали бан моего айпи, но думаю они давольно таки строгие как и другие админы других сайтов не позволили бы сделать это. Вообщем собираю прокси, зенно чекер вроде есть - попробуем. Ну а вашим вариантам всегда рад
 

sof

Client
Регистрация
15.04.2013
Сообщения
831
Благодарностей
184
Баллы
43
Время лучшее средство от бана. Делай задержки большие и возможно бан сведешь к минимуму
 
  • Спасибо
Реакции: nomarketing

Nick

Client
Регистрация
22.07.2014
Сообщения
1 963
Благодарностей
796
Баллы
113
  • Спасибо
Реакции: nomarketing

nomarketing

Client
Регистрация
01.11.2013
Сообщения
907
Благодарностей
178
Баллы
43
напиши проект так, чтобы этот аспект был под контролем
Время лучшее средство от бана. Делай задержки большие и возможно бан сведешь к минимуму
Да странно, я делаю 2 потока задержка 120 сек, все равно, банит.
Завтра попробую написать проэкт, по "умному" мол если спарсили удаляем линк, нет, идем в баню. ну как то так - просто там около 10к ссылок ! а если посчитать задержки то "пол года" парсить надо :-)
 

zortexx

Client
Регистрация
19.09.2011
Сообщения
2 520
Благодарностей
1 223
Баллы
113
В данном случае лучшее решение - это многопоточный парсинг через прокси. Проблема дублей легко решается общими для всех потоков списками полученных и обработанных урлов.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)