3981个中文文字图像识别

分享给好友

剩余奖金 ¥ 250

报名参赛

体验云端免费GPU极速训练,还能赢奖⾦!

报名参赛

大赛简介

本数据集为3981个中文文字的图片数据集,图片已经剪裁完成,每个文字有多种不同字体下提取的图片。

1.ASCII码范围,[0x21--0x7e]。

2.汉字标点符号,14个。

3.常用的3981个字汉字。取自《义务教育语文课程标准(2011版)》

参赛须知

参赛时间: 本次竞赛无时间限制,长期有效开放

如何参赛?

  • 方式一:在线提交体验结果。FlyAI已提供了赛题的样例代码,点击【查看样例】可以直接使用样例代码提交到免费GPU进行模型训练体验。
  • 方式二:本地调试模型并提交训练。请在"在线提交页"点击【下载代码】按钮将包含项目样例的资料包下载到本地,并使用本地终端命令提交作品。本地调试和提交指南请查看[文档中心]

参赛选手说明

  • 参赛人员身份信息需保证真实、有效,大赛主办方仅将个人信息用于赛事数据授权及颁奖使用
  • 欢迎海内外的在校学生,算法工程师和所有AI爱好者参与
  • 本次竞赛报名形式:以个人形式本地提交作品线上审核,并且以最终提交算法得分作为唯一有效成绩
  • 在比赛截止日期前,团队中成绩最高费作为本团队的最终成绩
  • 报名成功后请加入FlyAI竞赛交流群,一起学习进步!重要通知也将在群内发布,不要错过哦

比赛作品说明

  • 最终比赛成绩以排行榜显示排名为准
  • 根据作品提交时间先后顺序进行人工审核,审核合格后提交至排行榜
  • 禁止使用外部链接下载代码替换本项目代码
  • 提交的代码具备可解释性并且其它开源框架可复现
  • 所有相似代码将一律不通过审核!!情况多次出现者封号处理
  • 如有发现利用非正常手段作弊行为,奖金一律不发放。之前所获得奖金金额官方有权收回,情节严重者封号处理
  • 提交代码即视为阅读并同意以上比赛作品说明

大赛奖项设置

奖项说明:

奖项设置 获奖人数 奖金额度说明(按最终得分评判)
参与奖(总奖金30%) 所有人 不同得分区间获得相应的竞赛奖金
突破奖(总奖金20%) 所有人 更新排行榜得分,获取相应竞赛奖金
排名奖(总奖金50%) 第一周/月前3名(冠、亚、季军) 项目上线第一周、第一个月; Time_P(周) = 0.5,Time_P(月) = 0.5;K1=0.5,K2=0.3,K3=0.2;
不同框架奖励 所有人 获得60FAI币用于GPU训练资源消耗

备注:

  • 上线时间:2019-04-15
  • 周排行奖结算时间:2019-04-22 15:00:00;月排名奖结算时间:2019-05-15 15:00:00
  • 奖金获取标准:55<Score 按照得分比例获取奖金
  • 获得奖金分为3部分:参与奖、突破奖为审核完毕实时获取的奖金,排名奖需在规定时间结束后根据排名顺序获得
  • Bouns表示为:奖金池总金额;Score表示为:模型得分;
  • 【参与奖】相同得分区间无法再次获得奖励
  • 各项奖金获得计算公式参考如下:
  • 参与奖(Participation Award)
  • R表示:得分的区间系数;T表示为:相同得分区间得分人数;
  • 100-标准分:分为5个区间系数;R1(0.02),R2(0.08),R3(0.15),R4(0.25),R5(0.5)
  • 奖金计算公式1
  • 突破奖(Prizes)
  • N表示:第N次更新排行榜;Prizes_N-1表示:排行榜更新后已发放的突破奖
  • 奖金计算公式2
  • 排名奖(Ranking Award)
  • Time_p表示:相关截止日期的奖金发放系数;K表示:每次发放排行榜前三名的分配系数;
  • 奖金计算公式3

赛事主题和数据说明

赛题描述

数据来源

OCRWords

数据描述

由于需要提交代码作品在云端进行训练,参赛数据集不对外开放。仅提供调试数据,可通过使用本地调试的方式获取调试数据集。本地调试和提交指南请查看[文档中心]

字段说明:

字段名 字段类型 取值区间 字段描述
image_path file_path 不为空 图片的相对路径
name int 不为空 图片中中文的16进制ASCII码
label int 大于等于 0, 小于等于 3980 图片的标注标签

输入字段: image_path,

输出字段: label,

参考文献:

[1]

评审标准

评审指标说明

  • 准确率(Accuracy):对于给定的测试数据集,预测正确的样本数与实际总样本数之比
  • True,表示预测正确的样本数数量
  • Total Number of Samples,表示实际总样本数数量
  • 计算公式如下:

比赛常见问题说明

Q:比赛使用什么框架?

  • 比赛支持常用的机器学习和深度学习框架,比如TensorFlow,PyTorch,Keras,Scikit-learn、MXNet、PaddlePaddle等。

Q:怎么参加比赛,需不需要提交csv文件?

  • FlyAI竞赛平台无需提交csv文件,在网页上点击报名,下载项目,使用你熟练的框架,修改main.py中的网络结构,和processor.py中的数据处理。请仔细阅读右侧提交指南,使用FlyAI命令参与比赛。

Q:比赛排行榜分数怎么得到的?

  • 参加项目竞赛必须实现 model.py 中的predict_all方法。系统通过该方法,调用模型得出评分。

展开

  • 竞赛排行榜
  • 奖金记录
第三名

提供者:gboy

150.46

batch数据为256,循环次数为8000次,损失函数优化完,最终完成评分为99.25。

2019-05-28 15:14:21

150.46

99.25

第三名

提供者:我吃定了这第一

1002.93

batch数据为256,循环次数为9000次,损失函数优化完,最终完成评分为99.16。

2019-04-24 02:33:38

1002.93

99.16

第三名

提供者:malena

636.72

batch数据为256,循环次数为8000次,损失函数优化完,最终完成评分为99.1。

2019-04-23 23:56:39

636.72

99.10

4

提供者:丶人狠话不多

1474.50

batch数据为64,循环次数为8500次,损失函数优化完,最终完成评分为98.63。

2019-04-19 04:55:22

1474.50

98.63

5

提供者:Winteriscoming

batch数据为256,循环次数为250次,损失函数优化完,最终完成评分为97.99。

2019-04-22 15:17:51

97.99

6

提供者:善假于物

38.44

batch数据为512,循环次数为5000次,损失函数优化完,最终完成评分为97.8。

PyTroch

CNN

2019-04-19 22:58:30

38.44

97.80

7

提供者:Daiccccc

224.75

batch数据为50,循环次数为8000次,损失函数优化完,最终完成评分为97.75。

2019-04-19 02:22:28

224.75

97.75

8

提供者:baseline2

16.46

batch数据为256,循环次数为200次,损失函数优化完,最终完成评分为93.63。

2019-04-19 21:41:26

16.46

93.63

9

提供者:bestfitting

batch数据为256,循环次数为300次,损失函数优化完,最终完成评分为93.51。

2019-04-20 03:29:04

93.51

10

提供者:trick_or_treat

346.88

batch数据为64,循环次数为2000次,损失函数优化完,最终完成评分为92.15。

2019-04-16 22:02:37

346.88

92.15

11

提供者:lyming

11.72

batch数据为512,循环次数为10000次,损失函数优化完,最终完成评分为91.46。

2019-04-22 23:29:19

11.72

91.46

12

提供者:你猜猜我是谁

93.75

batch数据为256,循环次数为1000次,损失函数优化完,最终完成评分为89.61。

2019-04-16 16:32:38

93.75

89.61

13

提供者:喵喵

53.44

batch数据为128,循环次数为5000次,损失函数优化完,最终完成评分为85.37。

2019-04-20 10:53:09

53.44

85.37

14

提供者:hhy

5.86

batch数据为128,循环次数为10000次,损失函数优化完,最终完成评分为82.8。

2019-04-25 00:07:57

5.86

82.80

15

提供者:打脸啪啪啪

7.50

batch数据为512,循环次数为10000次,损失函数优化完,最终完成评分为70.31。

2019-04-23 11:00:44

7.50

70.31

16

提供者:tik_boa

60.00

batch数据为64,循环次数为5000次,损失函数优化完,最终完成评分为68.01。

2019-04-20 22:32:58

60.00

68.01

17

提供者:yangsmile

3.75

batch数据为128,循环次数为100次,损失函数优化完,最终完成评分为67.2。

2019-04-28 14:56:35

3.75

67.20

18

提供者:天天向上

batch数据为64,循环次数为5000次,损失函数优化完,最终完成评分为43.03。

2019-04-16 04:19:59

43.03

19

提供者:就是很任性

batch数据为1000,循环次数为70次,损失函数优化完,最终完成评分为37.3。

2019-04-17 09:54:16

37.30

20

提供者:落海的咸鱼

batch数据为3096,循环次数为500次,损失函数优化完,最终完成评分为18.98。

2019-04-19 20:22:51

18.98

21

提供者:poplar

batch数据为256,循环次数为9000次,损失函数优化完,最终完成评分为7.91。

2019-06-11 03:08:24

7.91

22

提供者:玄学上分

batch数据为128,循环次数为10000次,损失函数优化完,最终完成评分为6.86。

2019-04-17 21:29:59

6.86

23

提供者:DDBG

batch数据为64,循环次数为10000次,损失函数优化完,最终完成评分为3.59。

2019-04-18 20:59:03

3.59

24

提供者:kongd

batch数据为256,循环次数为2500次,损失函数优化完,最终完成评分为1.62。

2019-04-15 23:57:00

1.62

25

提供者:懒散小青年

batch数据为100,循环次数为200次,损失函数优化完,最终完成评分为0.83。

2019-04-22 18:01:28

0.83

26

提供者:zhiduanqingchang

batch数据为64,循环次数为3000次,损失函数优化完,最终完成评分为0.45。

2019-04-17 23:11:24

0.45

27

提供者:GodLovesJonny

batch数据为64,循环次数为6000次,损失函数优化完,最终完成评分为0.29。

2019-04-19 20:42:13

0.29

28

提供者:horson

batch数据为128,循环次数为1000次,损失函数优化完,最终完成评分为0.25。

2019-04-15 16:20:00

0.25

29

提供者:Gifford

batch数据为64,循环次数为1000次,损失函数优化完,最终完成评分为0.06。

2019-04-18 22:47:51

0.06

30

提供者:helloworld

batch数据为64,循环次数为10次,损失函数优化完,最终完成评分为0.05。

2019-04-18 18:13:09

0.05

31

提供者:Reluminia

batch数据为32,循环次数为10次,损失函数优化完,最终完成评分为0.04。

2019-04-17 21:15:55

0.04

32

提供者:Silence

batch数据为64,循环次数为1000次,损失函数优化完,最终完成评分为0.04。

2019-04-26 14:51:12

0.04

33

提供者:ChangeBio

batch数据为64,循环次数为3000次,损失函数优化完,最终完成评分为0.03。

2019-04-30 09:41:29

0.03

34

提供者:刘喵兄

batch数据为64,循环次数为10000次,损失函数优化完,最终完成评分为0.02。

2019-04-15 20:30:46

0.02

35

提供者:liyonghong

batch数据为128,循环次数为50次,损失函数优化完,最终完成评分为0.02。

2019-04-16 12:20:16

0.02

36

提供者:MagicCodes

batch数据为32,循环次数为10次,损失函数优化完,最终完成评分为0.02。

2019-04-19 16:11:12

0.02

37

提供者:qqm

batch数据为32,循环次数为1000次,损失函数优化完,最终完成评分为0.02。

2019-04-26 18:35:22

0.02

38

提供者:ROC

batch数据为128,循环次数为100次,损失函数优化完,最终完成评分为0.02。

2019-04-29 12:33:37

0.02

2019-05-29
gboy

模型得分为99.25,本次获得实时奖励奖金为150.46

2019-05-29 14:14:41

2019-05-15
丶人狠话不多

模型得分为98.63,本次获得排名奖奖金为250

2019-05-15 15:00:02

malena

模型得分为99.1,本次获得排名奖奖金为375

2019-05-15 15:00:02

我吃定了这第一

模型得分为99.16,本次获得排名奖奖金为625

2019-05-15 15:00:02

2019-04-29
yangsmile

模型得分为67.2,本次获得实时奖励奖金为3.75

2019-04-29 10:45:01

2019-04-25
hhy

模型得分为82.8,本次获得实时奖励奖金为5.86

2019-04-25 13:45:03

2019-04-24
我吃定了这第一

模型得分为99.16,本次获得排名奖奖金为375

2019-04-24 16:07:49

malena

模型得分为99.1,本次获得排名奖奖金为250

2019-04-24 16:07:49

2019-04-23
打脸啪啪啪

模型得分为67.93,本次获得实时奖励奖金为7.5

2019-04-23 12:52:44

lyming

模型得分为82.75,本次获得实时奖励奖金为11.72

2019-04-23 12:48:32

baseline2

模型得分为93.63,本次获得实时奖励奖金为1.46

2019-04-23 12:48:08

喵喵

模型得分为83.23,本次获得实时奖励奖金为23.44

2019-04-23 12:48:00

baseline2

模型得分为67.25,本次获得实时奖励奖金为15

2019-04-23 12:47:52

喵喵

模型得分为69.88,本次获得实时奖励奖金为30

2019-04-23 12:46:52

我吃定了这第一

模型得分为92.29,本次获得实时奖励奖金为2.93

2019-04-23 12:46:34

malena

模型得分为91.92,本次获得实时奖励奖金为11.72

2019-04-23 12:46:26

善假于物

模型得分为93.55,本次获得实时奖励奖金为23.44

2019-04-23 12:46:21

2019-04-17
Daiccccc

模型得分为97.14,本次获得实时奖励奖金为131

2019-04-17 20:48:47

Daiccccc

模型得分为91.24,本次获得实时奖励奖金为93.75

2019-04-17 20:48:32

善假于物

模型得分为63.3,本次获得实时奖励奖金为15

2019-04-17 20:48:20

trick_or_treat

模型得分为92.15,本次获得实时奖励奖金为187.5

2019-04-17 20:48:10

trick_or_treat

模型得分为87.46,本次获得实时奖励奖金为46.88

2019-04-17 20:47:57

你猜猜我是谁

模型得分为89.61,本次获得实时奖励奖金为93.75

2019-04-17 20:47:52

trick_or_treat

模型得分为73.18,本次获得实时奖励奖金为112.5

2019-04-17 20:47:45

丶人狠话不多

模型得分为94.97,本次获得实时奖励奖金为607

2019-04-17 20:47:37

tik_boa

模型得分为64.21,本次获得实时奖励奖金为60

2019-04-17 20:47:11

丶人狠话不多

模型得分为89.99,本次获得实时奖励奖金为617.5

2019-04-17 20:47:06

挑战者大赛 官方交流群

训练记录

你还没有任何提交记录喔...

使用指南

  • windows客户端
  • windows命令行
  • Mac/Linux
1. 下载项目并解压
2.进入到项目目录下,双击执行flyai.exe程序

第一次使用需要使用微信扫码登录

杀毒软件可能会误报,点击信任该程序即可

3.本地开发调试

运行flyai.exe程序,点击"本地调试"按钮,输入循环次数和数据量,点击运行即可调用main.py

如果使用本地IDE开发,需要执行安装“flyai”依赖并导入项目,运行main.py

4.下载本地测试数据

运行flyai.exe程序,点击"下载数据"按钮,程序会下载100条调试数据

5.提交训练到GPU

运行flyai.exe程序,点击"提交到GPU"按钮,输入循环次数和数据量,点击运行即可提交到GPU训练。

返回sucess状态,代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

1. 下载项目并解压
2. 打开运行,输入cmd,打开终端

Win+R 输入cmd

3. 使用终端进入到项目的根目录下

首先进入到项目对应的磁盘中,然后执行

cd path\to\project

Windows用户使用 flyai.exe

4. 本地开发调试

执行下列命令本地安装环境并调试(第一次使用需要使用微信扫码登录)

flyai.exe test

执行test命令,会自动下载100条测试数据到项目下

安装项目所需依赖,并运行 main.py

如果使用本地IDE开发,可以自行安装 requirements.txt 中的依赖,运行 main.py 即可

5.提交训练到GPU

项目中如有新的引用,需加入到 requirements.txt 文件中

在终端下执行

flyai.exe train

返回sucess状态,代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

完整训练设置执行代码示例:

flyai.exe train -b=32 -e=100

通过执行训练命令,本次训练循环 100 次,每次训练读取的数据量为 32 。

1. 下载项目并解压
2. 使用终端进入到项目的根目录下

cd /path/to/project

Mac和Linux用户使用 ./flyai 脚本文件

3. 初始化环境并登录

授权flyai脚本

chmod +x ./flyai

4. 本地开发调试

执行下列命令本地安装环境并调试(第一次使用需要使用微信扫码登录)

./flyai test 注意:命令前面不要加sudo

执行test命令,会自动下载100条测试数据到项目下

安装项目所需依赖,并运行 main.py

如果使用本地IDE开发,可以自行安装 requirements.txt 中的依赖,运行 main.py 即可

5.提交训练到GPU

项目中如有新的引用,需加入到 requirements.txt 文件中

在终端下执行

./flyai train 注意:命令前面不要加sudo

返回sucess状态,代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

完整训练设置执行代码示例:

./flyai train -b=32 -e=100

通过执行训练命令,本次训练循环 100 次,每次训练读取的数据量为 32 。

$vue{ errorTip }

发送样例至我的邮箱

已发送

已发送成功

请查收FlyAI官方邮件查看详情 根据样例提高算法评分可以获得积分奖励 用来兑换GPU训练时长

确定

$vue{flag?'报名成功!':'参赛温馨提示'}

通过迭代赛题的样例代码提高模型准确率哦~
准确率越高,奖励越丰富!

查看样例代码

⼤神你好!当前能⼒值⽆法参加新⼿手赛

多给新手一些机会哦~

查看样例代码

打开微信,使用扫一扫功能分享给好友

绑定你的微信账号

用于本地环境登录和实时接收训练通知