Инструменты пользователя

Инструменты сайта


Боковая панель

Перевод этой страницы:

ru:addons:capmonster:learning:create-project

1. Создание проекта и сбор каптч

Откройте программу, нажмите кнопку «Создать новый проект» Введите название - и готово :) Но не все так просто.

Сбор коллекции каптч

Первое что нам нужно, это собрать коллекцию каптч и их решений, на которых мы будем учить и тестировать наш модуль. Это можно сделать несколькими вариантами.

1) Можно собрать просто картинки, без ответов, любым удобным для вас образом, и распознать их уже в самой программе.
Для этого нужно будет в настройках программы указать логин-пароль в одном из сервисов ручного распознавания каптч. И потом, сразу после загрузки каптч, выбрать соответствующий вариант распознавания. Если пользуетесь вариантом распознавания каптч через сервисы ручного распознавания, то лучше распознавать каптчи отдельными группами. Каптчи для сбора символов можно распознать обычным способом, а каптчи для обучения и теста лучше распознать со 100% вероятностью. Это когда каптча отсылается нескольким людям одновременно. У сервисов Antigate и RuCaptcha есть такая настройка распознавания

2) Можно создать простой шаблон в ZennoPoster, пример можно скачать отсюда http://www.zennoexperts.com/downloads/capmonster.xmlz. Наша конечная цель на этом этапе - иметь на жестком диске в отдельной папке собранные капчи и их ответы в следующем формате: попарно должны быть представлены картинка с каптчей + txt файл в котором содержится ответ на каптчу. Имена у файлов должны быть одинаковыми, отличаться должны только расширения.

1237889.jpg











Либо название файлов каптч должно быть текстом, который на них написан. Т.е. если на каптче написано «qwe», то файл каптчи должен быть примерно таким: «qwe.jpg». Такой варинат программа тоже примет.

Сколько их нужно?

Для простых каптч, с малым искажение символов (или вообще без искажений) - 300 штук. Для сложных каптч - 1000 штук. Все эти каптчи должны быть потом распознаны в сервисах ручного распознавания, что будет стоить от нескольких десятков центов до пары долларов. Но можно посчитать точно сколько нужно каптч и сэкономить пару десятков центов :)

Капчи нужны для нескольких целей:

* Для сбора символов. Считайте так - каждого символа нужно от 3 до 150 экземпляров в зависимости от сложности капчи. Посмотрите сколько символов в каптче, сколько всего разновидностей символов, учтите, что иногда некоторые символы в каптче встречаются редко. А экземпляров каждого символа должно быть примерно одинаковое количество.
* Для предотвращения ложных срабатываний (примерно в 10 раз меньше чем каптч для сбора символов)
* Для теста модуля распознавания (примерно 100 каптч)

Разбиение каптч

После добавления каптчи будут разбиты на указанные выше группы автоматически. Но можно задать разбиение вручную. Переразбиение в дальнейшем будет невозможно, поэтому если не знаете, лучше ничего не трогать :)

ru/addons/capmonster/learning/create-project.txt · Последние изменения: 2015/07/14 15:51 (внешнее изменение)