Инструменты пользователя

Инструменты сайта


Боковая панель

Перевод этой страницы:

ru:addons:capmonster:learning

Module Creation Studio

Данный инструмент позволяет вам создавать свои собственные модули, для распознавания каптч, которые уже можно использовать в CapMonster 2.

Технологии, использующиеся в новой версии CapMonster сильно отличаются от прошлой версии, поэтому этапы обучения могут показаться сложными и непонятными на первый взгляд. Мы постараемся в этих статьях объяснить все как можно более подробно все в текстовом виде и более просто, на примерах в видео. Но, если у вас останутся вопросы после прочтения, пожалуйста, задавайте их нам на форуме, мы поможем и обязательно дополним эти статьи исходя из вашей обратной связи. Итак, начнем.

Создание своего модуля распознавания

Создание вашего собственного модуля распознавания делится на несколько шагов.
Здесь я приведу только краткое описание каждого шага и ссылку на более подробное описание.
Если что-то будет не понятно, лучше спросите на форуме в разделе программы. Иначе может получиться, что вы попусту потратите время на бесполезную работу.

Создание проекта

Все как обычно - открываете программу, создаете новый проект, сохраняете его под понятным вам названием.
Далее добавляете в проект каптчи, для которых собираетесь сделать модуль распознавания. Сохраняетесь.
Чтобы дальше работать с этими каптчами, они должны быть распознаны и желательно со 100%-ой достоверностью.
Этап 1. Начало. Инструкция и видео

Сбор символов

Распознавание каптчи - это по сути распознавание символов, которые на ней написаны, т.е. мы обучаем модуль распознавать символы. А чтобы научить модуль распознавать символы, эти символы нужно собрать :)
К сожалению, вручную. К счастью, во второй версии CapMonster это стало проще простого: нужно просто ткнуть мышкой в центр символа.
Этап 2. Сбор символов. Инструкция и видео

Настройка фильтров

Существенно повысить распознавание можно применив к каптче обычные графические фильтры.
Например, можно увеличить контрастность или выделить какой-то один цвет.
Самое полезное - увеличить каптчу с мелкими символами для лучшего распознавания и уменьшить каптчу с крупными символами для более быстрой работы модуля.
Этап 3. Фильтры. Инструкция и видео

Настройка поиска центров масс

Как уже упоминалось выше, распознавание каптчи - это распознавание символов на ней, но прежде чем распознать символ, его еще нужно найти. Искать символ мы будем в специальных точках - потенциальных центрах символов.
В этом же месте выбирается размер окна распознавания символа - прямоугольная область, в которую поместится самый большой представитель символов.
Этап 4. Центры масс. Инструкция и видео

Обучение модуля

Когда все ресурсы подготовлены и основные настройки произведены, можно приступать к обучению модуля.
Сначала нужно настроить сложность ядра в зависимости от того, насколько сильно бывают искажены символы. Сложное ядро - это большой процент распознавания за долгое время работы и наоборот, простое ядро - модуль с меньшим процентом распознавания, но работающий значительно быстрее.
После настройки сложности ядра нужно настроить процесс самого обучения.
Все просто: чем быстрее обучение, тем хуже качество полученного модуля.
Обучение - самая долгая часть создания модуля и может растянуться в особо сложных случаях на сутки. Ваше присутствие при этом не требуется :)
Этап 5. Обучение. Инструкция и видео

Тест распознавания и повышение качества модуля

После обучения можно протестировать готовый модуль.
Во время обучения он тоже будет постоянно тестироваться и % распознавания вы будете видеть сразу во время обучения. Смысл этого шага - подобрать еще пару простых, но важных параметров и проверить не улучшится ли при этом процент распознавания уже готового модуля.
Так же, на этом шаге можно найти основные причины ошибок распознавания и попробовать их устранить.
Этап 6. Тестирование и улучшение. Практические советы.

Импорт готового модуля распознавания

Module Creation Studio только обучает модули и хранит их вместе с каптчами и другой не нужной для непосредственного распознания каптч информацией. Поэтому после того, как модуль обучен, его нужно сохранить в соответствующем формате, который понимает CapMonster 2. Он-то и будет принимать и распознавать ваши каптчи вместо сервисов ручного распознавания.

Когда работа по созданию модуля завершена и вы довольны результатом, в режиме «Тестирование модуля» кликаете на «Сохранить» и указываете путь, куда сохранить ваш собственный готовый модуль, полученный с таким трудом! В итоге вы получите готовый модуль распознавания, который потом можно добавить в ваш CapMonster 2, ну или продать кому-нибудь :)

ru/addons/capmonster/learning.txt · Последние изменения: 2015/07/14 15:51 (внешнее изменение)