【译】Kaggle“快,画吧!”涂鸦识别挑战赛介绍

Nichlas Zhaosier
2个月前 阅读 22 点赞 2

在线手写识别包括识别自由手写输入中的结构化模式。虽然像TranslateKeepHandwrite Input这样的Google产品使用这种技术来识别手写文本,但它适用于任何有足够训练数据的预定义模式。

同样的技术可以让你数字化手写文本,也可以用来提高你的绘画能力和建立虚拟世界,并代表了一个令人兴奋的研究方向,探索手写作为一种人机交互方式的潜力。例如“快,画吧!”游戏产生了一个50M的绘图数据集(从超过1B的绘图中),这本身激发了许多不同的新项目。

为了鼓励在这个令人兴奋的领域进一步研究,我们推出了Kaggle“快,画吧!”涂鸦识别挑战,任务参与者建立一个更好的机器学习分类器为现有的“快,画吧!“数据集。重要的是,由于训练数据来自游戏本身(其中图纸可能不完整或与标签不匹配),因此这一挑战需要开发一种分类器,它能够有效地从噪声数据中学习并在来自不同发行版的手动标记测试集上表现良好。


数据集

在原始数据集“快,画吧!“游戏中,提示玩家画一个特定类别的图像(狗、牛、车等)。然后,玩家有20秒的时间来完成绘图——如果计算机在那段时间内正确地识别了绘图,那么玩家就获得一分。每场比赛由6个随机选择的类别组成。

因为游戏机制,标签在快,画吧!数据集分为以下几类:

  • 正确:用户绘制提示类别,计算机在用户完成绘图后才正确识别。
  • 正确,但不完整:用户绘制了提示类别,计算机在用户完成之前正确地识别了它。不完全性可以从几乎准备好到只占所绘制类别的一小部分而变化。这在被正确识别的图像中可能是相当常见的。
  • 正确,但没有被正确识别:玩家画出正确的类别,但人工智能从未认出它。一些玩家通过添加更多的细节对此做出反应。其他人潦草,再试一次。
  • 不正确:有些玩家看到一个单词时有不同的概念,例如在跷跷板类别中,我们观察了很多种的跷跷板。

除了上述的标签之外,每个绘图被给出为一系列笔画,其中每个笔画是一系列触摸点。虽然这些可以很容易地呈现为图像,但是使用笔画的顺序和方向通常有助于使手写识别器更好。


小结

我们之前已经发布了一个使用该数据集的教程,现在我们邀请社区以这种或其他方法为基础,以实现更高的准确性。


作者:Thomas Deselaers,高级软件工程师

Jake Walker,机器感知产品经理


| 2
登录后可评论,马上登录吧~
评论 ( 1 )
像徐大神学习
回复
2个月前