ZennoLab

Automate everything

用户工具

站点工具


侧边栏

本页面的其他翻译:

zh:addons:capmonster:learning:create-project

1. 创建项目并加载验证码图片。

你只需要点击“创建新项目”就能开始你的工作了,像下面这样简单:

加载验证码图片

开始的时候,你需要加载验证码图片,这些图片也会用在后面的训练模块上。这里有两种方式:

1)只加载图片验证码并通过第三方验证码服务识别他们。这样的话,你需要在程序设置里面对相应的第三方验证码服务填写上用户名和密码,并在这之后选择验证结果。这种情况下,我们推荐按组识别验证码。收集的符号可以通过正常方式识别,并且为训练和测试收集的应该达到100%识别。一些第三方服务比如Anti-Gate提供这样的服务,通过发送验证码图片图片到不同的人那去手动打码。

2)创建一个Zennoposter项目,用来下载和识别多个验证码图片。在这里有一个简单的例子提供下载。 在这里下载. 最终的结果是你可以获取到验证码图片和内含识别结果的相同名字的文本文件。

或者获取把图片验证结果最为图片的文件名。比如,验证码的结果是“qwe”,验证码图片应该也是“qwe.jpg”的文件名。程序同样可以接受这种图片。

需要多少图片?

如果你只是为简单的(或者低失真或无失真)验证码图片创建模板,300张图片应该够了。对于复杂的验证码,需要1000张。所有的识别如果通过第三方验证码服务的话,只需要花费你几美分到几美元。

为什么需要验证码图片:

  • 为了收集符号。你可以通过一下方式计算需要多少图片 - 每个符号需要3到150个例子,这个基于验证码的复杂度。可以计算在验证码图片中有多少个符号和他们不同的表现,就知道要多少图片了。
  • 为了防止错误识别 (需要比收集的符号多10倍的图片数).
  • 为了测试识别模块 (约100张图像)

图像排序

验证码图片加载后将会被自动排序。但是你可以手动做这些。重新排序是不可能的,所以,如果你不知道如何排序到组里,可以使用自动排序。

zh/addons/capmonster/learning/create-project.txt · 最后更改: 2015/07/14 15:51 (外部编辑)