一小伙伴突然问我想不想换一种工作方式,我当时有些懵逼。后来听他介绍才知道是让我帮忙标记图片验证码上的文字及其位置,用作训练图像识别系统的素材。
我脑子里面就在想训练识别系统得要多少张图片才行啊,那么多靠人工去打标签根本不是我们两个人能完成的啊。
我有些不愿意,他就问我有什么想法,于是我就思考能不能跳过人工打标签这个过程,而且还能拥有一大堆训练素材呢。
于是,我就想是否可以通过随机生成训练素材,将生成素材时传入的参数记录下来,就可以形成一个素材的标签了。
小伙伴用的python,但是我对其并不是太熟,我最熟悉的还是Java,所以就有了本文中的产物。