Сбор символов

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Благодарностей
1 310
Баллы
113

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с 7make какие-либо сделки.

На этапе сбора символов мы визуально просматриваем много каптч.
Предлагаю добавить на этом этапе возможность маркировки каптч имеющих на первый взгляд минимальные расстояния центров масс. К примеру, через контекстное меню опция => кинуть в приоритетную сортировку.

Потом на этапе 4. Центры масс - поместить их в начале сортировки.
Экономия времени при работе со сложными каптчами и большими коллекциями.

============
Вопрос.
На этом этапе (так понимаю это сегментация)
На шаге добавления выбранных, у нас есть такое превью..


в контекстном меню на символах есть пункт удаление.

Правильно понимаю, что если мы криво выбрали центры масс, то тут увидим в "кадре" соседние символы, и такие символы нужно удалять из коллекции?
В идеале тут должен быть 1 символ, без захвата соседних?

Красным выделил часть тех которые как понимаю стоит удалить.
 
Последнее редактирование:

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
Капчи бывают разные, у некоторых есть соседи очень близко. Наоборот очень хорошо если у нас много разных вариантов что может быть слева или справа от обучаемого символа
 

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Благодарностей
1 310
Баллы
113

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с 7make какие-либо сделки.

Предложение по шагу сбора символов.
Предлагаю оставить этот как есть,и добавить в новой вкладке режим с другой логикой.
"Fast" алгоритм. Очень будет актуальна такая логика для сложных каптч, когда нам нужно под 200 семплов для символа.

Сейчас мы в таблице выбираем символ, потом перебираем каптчи и отмечаем его на них.
Потом будет другой символ, и мы снова увидим эту каптчу, но уже будем отмечать другой символ.


Я предлагаю отмечать центры масс на каптче сразу для всех символов которые мы видим.

Есть каптча, к примеру(на скрине) ВГГГК1 оно парсит текст,и кидает на "табло перебора" все 6 символов. Отдельным цветом (на "табло") выделяет первый символ - 1 клик на центре массы, потом подсвечивает второй -2 клик... выбрали все символы, нажали добавить, и оно в таблице поменяло статистику сбора сразу для всех 6 символов.
Добавить кнопку "пропустить символ" для тех случаев когда по статистике сбора нам "хватит", или указывать кол-во которое мы будем собирать,и автоматом пропускать когда соберем нужный обьем.

Точнее говоря, потом такой алго расширить для всех каптч..Чтобы не добавлять каждую каптчу, а пройтись по центрам масс сразу для 100-200 каптч..и потом нажать добавить.
 
Последнее редактирование:

nuaru

Main Administrator
Команда форума
Регистрация
14.01.2009
Сообщения
3 641
Благодарностей
2 472
Баллы
113
На этапе сбора символов мы визуально просматриваем много каптч.
Предлагаю добавить на этом этапе возможность маркировки каптч имеющих на первый взгляд минимальные расстояния центров масс. К примеру, через контекстное меню опция => кинуть в приоритетную сортировку.
Вообще не понял о чем ты.

Я предлагаю отмечать центры масс на каптче сразу для всех символов которые мы видим.

Есть каптча, к примеру(на скрине) ВГГГК1 оно парсит текст,и кидает на "табло перебора" все 6 символов. Отдельным цветом (на "табло") выделяет первый символ - 1 клик на центре массы, потом подсвечивает второй -2 клик... выбрали все символы, нажали добавить, и оно в таблице поменяло статистику сбора сразу для всех 6 символов.
Добавить кнопку "пропустить символ" для тех случаев когда по статистике сбора нам "хватит", или указывать кол-во которое мы будем собирать,и автоматом пропускать когда соберем нужный обьем.

Точнее говоря, потом такой алго расширить для всех каптч..Чтобы не добавлять каждую каптчу, а пройтись по центрам масс сразу для 100-200 каптч..и потом нажать добавить.
Тот вариант, который сейчас сделан самый быстрый. Вряд ли можно придумать что-то быстрее.
В твоем варианте будут огромные проблемы, в каптчах, которые распознаны с ошибками.
 
  • Спасибо
Реакции: KirillOFF

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Благодарностей
1 310
Баллы
113

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с 7make какие-либо сделки.

В начале идет сортировка каптч которые имеют два вхождения символа, удобно.
Потом сделать сортировку по индексам вхождения.
Сначала показываем каптчи где символ на 1 месте, потом 2...
Меньше ерзания мышью, по одной оси прицелися и промаркировал центры масс.


собирал для сложной каптчи, 0-9А-Я по 150 символов..стер мышь и кисть накачал :-)
 
  • Спасибо
Реакции: KirillOFF

nuaru

Main Administrator
Команда форума
Регистрация
14.01.2009
Сообщения
3 641
Благодарностей
2 472
Баллы
113
Да, возможно такое реализуем.
 

nuaru

Main Administrator
Команда форума
Регистрация
14.01.2009
Сообщения
3 641
Благодарностей
2 472
Баллы
113
Хотя тут одно но.
В этой каптче, как выше на скрине, каждая буква в капче находится всегда примерно на одном месте и можно сделать так, чтобы буквы были одна над другой, а в яндекс капче, например, они могут располагаться в совсем разных местах.
 

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Благодарностей
1 310
Баллы
113

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с 7make какие-либо сделки.

То скрин по другому моменту.
Я говорю за сортировку pictureBox.
Сортировку, когда на каптче только 1 символ и длина текста каптчи всегда константа.
Сначала показываем каптчи где символ на 1 месте, потом 2...

А0000
А0000
А0000

0А000
0А000
0А000

00А00
00А00
00А00
 

nuaru

Main Administrator
Команда форума
Регистрация
14.01.2009
Сообщения
3 641
Благодарностей
2 472
Баллы
113
Ну я про это и говорю, первый символ верхней капче может быть на уровне последнего на нижней
Код:
  А0000
     А0000
А0000
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)