3981个中文文字图像识别

分享给好友

剩余奖金 ¥ 250

立即报名

立即报名

大赛简介

本数据集为3981个中文文字的图片数据集,图片已经剪裁完成,每个文字有多种不同字体下提取的图片。

1.ASCII码范围,[0x21--0x7e]。

2.汉字标点符号,14个。

3.常用的3981个字汉字。取自《义务教育语文课程标准(2011版)》

参赛须知

参赛时间: 本次竞赛无时间限制,长期有效开放

如何参赛?

  • 请在项目详情页点击【立即报名】按钮,首次需验证手机号、完善报名信息
  • 请点击本页的【资料下载】按钮,下载参赛资料并详细阅读README.md文件

参赛选手说明

  • 参赛人员身份信息需保证真实、有效,大赛主办方仅将个人信息用于赛事数据授权及颁奖使用
  • 欢迎海内外的在校学生,算法工程师和所有AI爱好者参与
  • 本次竞赛报名形式:以个人形式本地提交作品线上审核,并且以最终提交算法得分作为唯一有效成绩
  • 报名成功后请加入FlyAI竞赛交流群,一起学习进步!重要通知也将在群内发布,不要错过哦

比赛作品说明

  • 最终比赛成绩以排行榜显示排名为准
  • 根据作品提交时间先后顺序进行人工审核,审核合格后提交至排行榜
  • 禁止使用外部链接下载代码替换本项目代码
  • 所有相似代码将一律不通过审核!!情况多次出现者封号处理
  • 如有发现利用非正常手段作弊行为,奖金一律不发放。之前所获得奖金金额官方有权收回,情节严重者封号处理
  • 提交代码即视为阅读并同意以上比赛作品说明

大赛奖项设置

奖项说明:

奖项设置 获奖人数 奖金额度说明(按最终得分评判)
参与奖(总奖金30%) 所有人 不同得分区间获得相应的竞赛奖金
突破奖(总奖金20%) 所有人 更新排行榜得分,获取相应竞赛奖金
排名奖(总奖金50%) 第一周/月前3名(冠、亚、季军) 项目上线第一周、第一个月; Time_P(周) = 0.5,Time_P(月) = 0.5;K1=0.5,K2=0.3,K3=0.2;
不同框架奖励 所有人 获得60FAI币用于GPU训练资源消耗

备注:

  • 上线时间:2019-04-15
  • 周排行奖结算时间:2019-04-22 15:00:00;月排名奖结算时间:2019-05-15 15:00:00
  • 奖金获取标准:55<Score 按照得分比例获取奖金
  • 获得奖金分为3部分:参与奖、突破奖为审核完毕实时获取的奖金,排名奖需在规定时间结束后根据排名顺序获得
  • Bouns表示为:奖金池总金额;Score表示为:模型得分;
  • 【参与奖】相同得分区间无法再次获得奖励
  • 各项奖金获得计算公式参考如下:
  • 参与奖(Participation Award)
  • R表示:得分的区间系数;T表示为:相同得分区间得分人数;
  • 100-标准分:分为5个区间系数;R1(0.02),R2(0.08),R3(0.15),R4(0.25),R5(0.5)
  • 奖金计算公式1
  • 突破奖(Prizes)
  • N表示:第N次更新排行榜;Prizes_N-1表示:排行榜更新后已发放的突破奖
  • 奖金计算公式2
  • 排名奖(Ranking Award)
  • Time_p表示:相关截止日期的奖金发放系数;K表示:每次发放排行榜前三名的分配系数;
  • 奖金计算公式3

赛事主题和数据说明

赛题描述

数据来源

OCRWords

数据描述

字段说明:

字段名 字段类型 取值区间 字段描述
image_path file_path 不为空 图片的相对路径
name int 不为空 图片中中文的16进制ASCII码
label int 大于等于 0, 小于等于 3980 图片的标注标签

输入字段: image_path,

输出字段: label,

参考文献:

[1]

评审标准

评审指标说明

  • 准确率(Accuracy):对于给定的测试数据集,预测正确的样本数与实际总样本数之比
  • True,表示预测正确的样本数数量
  • Total Number of Samples,表示实际总样本数数量
  • 计算公式如下:

比赛常见问题说明

Q:比赛使用什么框架?

  • 比赛支持常用的机器学习和深度学习框架,比如TensorFlow,PyTorch,Keras,Scikit-learn、MXNet、PaddlePaddle、FastAI等。

Q:怎么参加比赛,需不需要提交csv文件?

  • FlyAI竞赛平台无需提交csv文件,在网页上点击报名,下载项目,使用你熟练的框架,修改main.py中的网络结构,和processor.py中的数据处理。请仔细阅读右侧提交指南,使用FlyAI命令参与比赛。

Q:比赛排行榜分数怎么得到的?

  • 参加项目竞赛必须实现 model.py 中的predict_all方法。系统通过该方法,调用模型得出评分。

展开

  • 竞赛排行榜
第三名

提供者:digger

150.46

batch数据为256,循环次数为8000次,损失函数优化完,最终完成评分为99.25。

2019-05-28 15:14:21

150.46

99.25

第三名

提供者:你好像很厉害的样子

1002.93

batch数据为256,循环次数为9000次,损失函数优化完,最终完成评分为99.16。

2019-04-24 02:33:38

1002.93

99.16

第三名

提供者:malena

636.72

batch数据为256,循环次数为8000次,损失函数优化完,最终完成评分为99.1。

2019-04-23 23:56:39

636.72

99.10

4

提供者:丶人狠话不多

1474.50

batch数据为64,循环次数为8500次,损失函数优化完,最终完成评分为98.63。

2019-04-19 04:55:22

1474.50

98.63

5

提供者:Winteriscoming

batch数据为256,循环次数为250次,损失函数优化完,最终完成评分为97.99。

2019-04-22 15:17:51

97.99

6

提供者:善假于物

38.44

batch数据为512,循环次数为5000次,损失函数优化完,最终完成评分为97.8。

PyTroch

CNN

2019-04-19 22:58:30

38.44

97.80

7

提供者:Daiccccc

224.75

batch数据为50,循环次数为8000次,损失函数优化完,最终完成评分为97.75。

2019-04-19 02:22:28

224.75

97.75

8

提供者:baseline2

16.46

batch数据为256,循环次数为200次,损失函数优化完,最终完成评分为93.63。

2019-04-19 21:41:26

16.46

93.63

9

提供者:bestfitting

batch数据为256,循环次数为300次,损失函数优化完,最终完成评分为93.51。

2019-04-20 03:29:04

93.51

10

提供者:trick_or_treat

346.88

batch数据为64,循环次数为2000次,损失函数优化完,最终完成评分为92.15。

2019-04-16 22:02:37

346.88

92.15

11

提供者:lyming

11.72

batch数据为512,循环次数为10000次,损失函数优化完,最终完成评分为91.46。

2019-04-22 23:29:19

11.72

91.46

12

提供者:你猜猜我是谁

93.75

batch数据为256,循环次数为1000次,损失函数优化完,最终完成评分为89.61。

2019-04-16 16:32:38

93.75

89.61

13

提供者:喵喵

53.44

batch数据为128,循环次数为5000次,损失函数优化完,最终完成评分为85.37。

2019-04-20 10:53:09

53.44

85.37

14

提供者:hhy

5.86

batch数据为128,循环次数为10000次,损失函数优化完,最终完成评分为82.8。

2019-04-25 00:07:57

5.86

82.80

15

提供者:打脸啪啪啪

7.50

batch数据为512,循环次数为10000次,损失函数优化完,最终完成评分为70.31。

2019-04-23 11:00:44

7.50

70.31

16

提供者:tik_boa

60.00

batch数据为64,循环次数为5000次,损失函数优化完,最终完成评分为68.01。

2019-04-20 22:32:58

60.00

68.01

17

提供者:yangsmile

3.75

batch数据为128,循环次数为100次,损失函数优化完,最终完成评分为67.2。

2019-04-28 14:56:35

3.75

67.20

18

提供者:天天向上

batch数据为64,循环次数为5000次,损失函数优化完,最终完成评分为43.03。

2019-04-16 04:19:59

43.03

19

提供者:就是很任性

batch数据为1000,循环次数为70次,损失函数优化完,最终完成评分为37.3。

2019-04-17 09:54:16

37.30

20

提供者:落海的咸鱼

batch数据为3096,循环次数为500次,损失函数优化完,最终完成评分为18.98。

2019-04-19 20:22:51

18.98

21

提供者:poplar

batch数据为256,循环次数为9000次,损失函数优化完,最终完成评分为7.91。

2019-06-11 03:08:24

7.91

22

提供者:玄学上分

batch数据为128,循环次数为10000次,损失函数优化完,最终完成评分为6.86。

2019-04-17 21:29:59

6.86

23

提供者:DDBG

batch数据为64,循环次数为10000次,损失函数优化完,最终完成评分为3.59。

2019-04-18 20:59:03

3.59

24

提供者:kongd

batch数据为256,循环次数为2500次,损失函数优化完,最终完成评分为1.62。

2019-04-15 23:57:00

1.62

25

提供者:懒散小青年

batch数据为100,循环次数为200次,损失函数优化完,最终完成评分为0.83。

2019-04-22 18:01:28

0.83

26

提供者:zhiduanqingchang

batch数据为64,循环次数为3000次,损失函数优化完,最终完成评分为0.45。

2019-04-17 23:11:24

0.45

27

提供者:GodLovesJonny

batch数据为64,循环次数为6000次,损失函数优化完,最终完成评分为0.29。

2019-04-19 20:42:13

0.29

28

提供者:5555

batch数据为128,循环次数为1000次,损失函数优化完,最终完成评分为0.25。

2019-04-15 16:20:00

0.25

29

提供者:Gifford

batch数据为64,循环次数为1000次,损失函数优化完,最终完成评分为0.06。

2019-04-18 22:47:51

0.06

30

提供者:helloworld

batch数据为64,循环次数为10次,损失函数优化完,最终完成评分为0.05。

2019-04-18 18:13:09

0.05

31

提供者:Reluminia

batch数据为32,循环次数为10次,损失函数优化完,最终完成评分为0.04。

2019-04-17 21:15:55

0.04

32

提供者:Silence

batch数据为64,循环次数为1000次,损失函数优化完,最终完成评分为0.04。

2019-04-26 14:51:12

0.04

33

提供者:ChangeBio

batch数据为64,循环次数为3000次,损失函数优化完,最终完成评分为0.03。

2019-04-30 09:41:29

0.03

34

提供者:刘喵兄

batch数据为64,循环次数为10000次,损失函数优化完,最终完成评分为0.02。

2019-04-15 20:30:46

0.02

35

提供者:liyonghong

batch数据为128,循环次数为50次,损失函数优化完,最终完成评分为0.02。

2019-04-16 12:20:16

0.02

36

提供者:MagicCodes

batch数据为32,循环次数为10次,损失函数优化完,最终完成评分为0.02。

2019-04-19 16:11:12

0.02

37

提供者:qqm

batch数据为32,循环次数为1000次,损失函数优化完,最终完成评分为0.02。

2019-04-26 18:35:22

0.02

38

提供者:ROC

batch数据为128,循环次数为100次,损失函数优化完,最终完成评分为0.02。

2019-04-29 12:33:37

0.02

万元奖金等你拿,挑战者,都在 FlyAI

点击立即报名

下载参赛资料

挑战者大赛 官方交流群

训练记录

你还没有任何提交记录喔...

使用指南

  • windows客户端
  • windows命令行
  • Mac/Linux
1. 下载项目并解压
2.进入到项目目录下,双击执行flyai.exe程序

第一次使用需要使用微信扫码登录

杀毒软件可能会误报,点击信任该程序即可

3.本地开发调试

运行flyai.exe程序,点击"本地调试"按钮,输入循环次数和数据量,点击运行即可调用main.py

如果使用本地IDE开发,需要执行安装“flyai”依赖并导入项目,运行main.py

4.下载本地测试数据

运行flyai.exe程序,点击"下载数据"按钮,程序会下载100条调试数据

5.提交训练到GPU

运行flyai.exe程序,点击"提交到GPU"按钮,输入循环次数和数据量,点击运行即可提交到GPU训练。

返回sucess状态,代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

1. 下载项目并解压
2. 打开运行,输入cmd,打开终端

Win+R 输入cmd

3. 使用终端进入到项目的根目录下

首先进入到项目对应的磁盘中,然后执行

cd path\to\project

Windows用户使用 flyai.exe

4. 本地开发调试

执行下列命令本地安装环境并调试(第一次使用需要使用微信扫码登录)

flyai.exe test

执行test命令,会自动下载100条测试数据到项目下

安装项目所需依赖,并运行 main.py

如果使用本地IDE开发,可以自行安装 requirements.txt 中的依赖,运行 main.py 即可

5.提交训练到GPU

项目中如有新的引用,需加入到 requirements.txt 文件中

在终端下执行

flyai.exe train

返回sucess状态,代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

完整训练设置执行代码示例:

flyai.exe train -b=32 -e=100

通过执行训练命令,本次训练循环 100 次,每次训练读取的数据量为 32 。

1. 下载项目并解压
2. 使用终端进入到项目的根目录下

cd /path/to/project

Mac和Linux用户使用 ./flyai 脚本文件

3. 初始化环境并登录

授权flyai脚本

chmod +x ./flyai

4. 本地开发调试

执行下列命令本地安装环境并调试(第一次使用需要使用微信扫码登录)

./flyai test 注意:命令前面不要加sudo

执行test命令,会自动下载100条测试数据到项目下

安装项目所需依赖,并运行 main.py

如果使用本地IDE开发,可以自行安装 requirements.txt 中的依赖,运行 main.py 即可

5.提交训练到GPU

项目中如有新的引用,需加入到 requirements.txt 文件中

在终端下执行

./flyai train 注意:命令前面不要加sudo

返回sucess状态,代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

完整训练设置执行代码示例:

./flyai train -b=32 -e=100

通过执行训练命令,本次训练循环 100 次,每次训练读取的数据量为 32 。

$vue{ errorTip }

发送样例至我的邮箱

已发送

已发送成功

请查收FlyAI官方邮件查看详情 根据样例提高算法评分可以获得积分奖励 用来兑换GPU训练时长

确定

$vue{flag?'报名成功!':'参赛温馨提示'}

感谢您的参与!点击 下载资料 并及时提交您的作品

您在当前领域能力值未达到参赛标准,
请选择符合能力标准的项目哦!

下载资料

打开微信,使用扫一扫功能分享给好友