- Регистрация
- 28.05.2014
- Сообщения
- 70
- Благодарностей
- 4
- Баллы
- 8
Задача: нужно быстро спарсить большой сайт.
Дано:
- Блокируют IP через 1000 запросов на некоторое время.
- у меня есть список 200 проксей.
- список урлов этого сайта в 500 000 строк
Вопрос: Как реализовать проект, чтобы запустить 100 потоков и каждый поток работал только со своим прокси и запросом из списка? Главное чтобы не пересекались потоки между собой, а работали как будто 100 разных проектов.
Не могу сообразить, как каждый поток будет работать с одним списком одновременно?
Дано:
- Блокируют IP через 1000 запросов на некоторое время.
- у меня есть список 200 проксей.
- список урлов этого сайта в 500 000 строк
Вопрос: Как реализовать проект, чтобы запустить 100 потоков и каждый поток работал только со своим прокси и запросом из списка? Главное чтобы не пересекались потоки между собой, а работали как будто 100 разных проектов.
Не могу сообразить, как каждый поток будет работать с одним списком одновременно?