3981个中文文字图像识别

分享给好友

剩余奖金 ¥ 3,036

立即报名

立即报名

大赛简介

本数据集为3981个中文文字的图片数据集,图片已经剪裁完成,每个文字有多种不同字体下提取的图片。

1.ASCII码范围,[0x21--0x7e]。

2.汉字标点符号,14个。

3.常用的3981个字汉字。取自《义务教育语文课程标准(2011版)》

参赛须知

参赛时间: 本次竞赛无时间限制,长期有效开放

如何参赛?

  • 请在项目详情页点击【立即报名】按钮,首次需验证手机号、完善报名信息
  • 请点击本页的【资料下载】按钮,下载参赛资料并详细阅读README.md文件

参赛选手说明

  • 参赛人员身份信息需保证真实、有效,大赛主办方仅将个人信息用于赛事数据授权及颁奖使用
  • 欢迎海内外的在校学生,算法工程师和所有AI爱好者参与
  • 本次竞赛报名形式:以个人形式本地提交作品线上审核,并且以最终提交算法得分作为唯一有效成绩
  • 报名成功后请加入FlyAI竞赛交流群,一起学习进步!重要通知也将在群内发布,不要错过哦

比赛作品说明

  • 最终比赛成绩以排行榜显示排名为准
  • 根据作品提交时间先后顺序进行人工审核,审核合格后提交至排行榜
  • 禁止私下与队伍成员之外的人员分享代码和数据,鼓励在大赛交流群与所有参赛选手公开讨论
  • 参赛选手需自行检查提交作品的正确性,确认无误后再进行提交,如有任何提交问题导致成绩有误,主办方概不负责
  • 参赛作品必须保证原创性,不违反任何中华人民共和国的有关法律,不侵犯任何第三方知识产权或其它权利,如有发现并查证,主办方将取消其比赛资格、成绩

大赛奖项设置

奖项说明:

奖项设置 获奖人数 奖金额度说明(按最终得分评判)
参与奖(总奖金30%) 所有人 不同得分区间获得相应的竞赛奖金
突破奖(总奖金20%) 所有人 更新排行榜得分,获取相应竞赛奖金
排名奖(总奖金50%) 第一周/月前3名(冠、亚、季军) 项目上线第一周、第一个月; Time_P(周) = 0.5,Time_P(月) = 0.5;K1=0.5,K2=0.3,K3=0.2;
不同框架奖励 所有人 获得60FAI币用于GPU训练资源消耗

备注:

  • 上线时间:2019-04-15
  • 周排行奖结算时间:2019-04-22 15:00:00;月排名奖结算时间:2019-05-15 15:00:00
  • 奖金获取标准:55<Score 按照得分比例获取奖金
  • 获得奖金分为3部分:参与奖、突破奖为审核完毕实时获取的奖金,排名奖需在规定时间结束后根据排名顺序获得
  • Bouns表示为:奖金池总金额;Score表示为:模型得分;
  • 【参与奖】相同得分区间无法再次获得奖励
  • 各项奖金获得计算公式参考如下:
  • 参与奖(Participation Award)
  • R表示:得分的区间系数;T表示为:相同得分区间得分人数;
  • 100-标准分:分为5个区间系数;R1(0.02),R2(0.08),R3(0.15),R4(0.25),R5(0.5)
  • 奖金计算公式1
  • 突破奖(Prizes)
  • N表示:第N次更新排行榜;Prizes_N-1表示:排行榜更新后已发放的突破奖
  • 奖金计算公式2
  • 排名奖(Ranking Award)
  • Time_p表示:相关截止日期的奖金发放系数;K表示:每次发放排行榜前三名的分配系数;
  • 奖金计算公式3

赛事主题和数据说明

赛题描述

数据来源

OCRWords

数据描述

字段说明:

字段名 字段类型 取值区间 字段描述
image_path file_path 不为空 图片的相对路径
name int 不为空 图片中中文的16进制ASCII码
label int 大于等于 0, 小于等于 3980 图片的标注标签

输入字段: image_path,

输出字段: label,

参考文献:

[1]

评审标准

评审指标说明

  • 准确率(Accuracy):对于给定的测试数据集,预测正确的样本数与实际总样本数之比
  • True,表示预测正确的样本数数量
  • Total Number of Samples,表示实际总样本数数量
  • 计算公式如下:

比赛常见问题说明

Q:如何查看数据集?

  • 请在【赛事主题和数据描述>数据来源】点击文字链接查看原始数据集

Q:如何顺利提交作品并训练?

  • 请查看本详情页右侧栏提交指南代码命令提示,根据flyai命令提交作品并训练

Q:提交样例代码是否可获得比赛奖金?

  • 不可以。样例代码仅供开发者学习参考,如提交相似代码,不会通过人工审核且无法获取奖励

展开

排行榜

(每日 24 时更新)

1

提供者:Daiccccc

224.75

batch数据为64,循环次数为6000次,损失函数优化完,最终完成评分为97.14。

2019-04-17 20:28:31

224.75

97.14

2

提供者:丶favor

1224.50

batch数据为64,循环次数为6500次,损失函数优化完,最终完成评分为94.97。

2019-04-16 02:13:03

1224.50

94.97

3

提供者:baseline

346.88

batch数据为64,循环次数为2000次,损失函数优化完,最终完成评分为92.15。

2019-04-16 22:02:37

346.88

92.15

4

提供者:令狐冲

93.75

batch数据为256,循环次数为1000次,损失函数优化完,最终完成评分为89.61。

2019-04-16 16:32:38

93.75

89.61

5

提供者:tik_boa

60.00

batch数据为64,循环次数为2000次,损失函数优化完,最终完成评分为64.21。

2019-04-15 19:30:46

60.00

64.21

6

提供者:善假于物

15.00

batch数据为512,循环次数为4000次,损失函数优化完,最终完成评分为63.3。

PyTroch

CNN

2019-04-17 11:17:52

15.00

63.30

7

提供者:天天向上

batch数据为64,循环次数为5000次,损失函数优化完,最终完成评分为43.03。

2019-04-16 04:19:59

43.03

8

提供者:lyming

batch数据为512,循环次数为10000次,损失函数优化完,最终完成评分为41.05。

2019-04-19 09:48:08

41.05

9

提供者:Matthew

batch数据为1000,循环次数为70次,损失函数优化完,最终完成评分为37.3。

2019-04-17 09:54:16

37.30

10

提供者:你看起来真的很努力

batch数据为64,循环次数为200次,损失函数优化完,最终完成评分为22.9。

2019-04-17 13:25:13

22.90

11

提供者:落海的咸鱼

batch数据为3096,循环次数为500次,损失函数优化完,最终完成评分为18.98。

2019-04-19 20:22:51

18.98

12

提供者:柠檬

batch数据为64,循环次数为7000次,损失函数优化完,最终完成评分为9.61。

2019-04-18 04:13:35

9.61

13

提供者:玄学上分

batch数据为128,循环次数为10000次,损失函数优化完,最终完成评分为6.86。

2019-04-17 21:29:59

6.86

14

提供者:我要起床学习了

batch数据为64,循环次数为100次,损失函数优化完,最终完成评分为6.08。

2019-04-16 23:21:15

6.08

15

提供者:bestfitting

batch数据为64,循环次数为1000次,损失函数优化完,最终完成评分为4.74。

2019-04-16 18:52:11

4.74

16

提供者:DDBG

batch数据为64,循环次数为10000次,损失函数优化完,最终完成评分为3.59。

2019-04-18 20:59:03

3.59

17

提供者:Flipped

batch数据为256,循环次数为2500次,损失函数优化完,最终完成评分为1.62。

2019-04-15 23:57:00

1.62

18

提供者:zhiduanqingchang

batch数据为64,循环次数为3000次,损失函数优化完,最终完成评分为0.45。

2019-04-17 23:11:24

0.45

19

提供者:GodLovesJonny

batch数据为64,循环次数为6000次,损失函数优化完,最终完成评分为0.29。

2019-04-19 20:42:13

0.29

20

提供者:0101 m_liutao

batch数据为128,循环次数为1000次,损失函数优化完,最终完成评分为0.25。

2019-04-15 16:20:00

0.25

21

提供者:Gifford

batch数据为64,循环次数为1000次,损失函数优化完,最终完成评分为0.06。

2019-04-18 22:47:51

0.06

22

提供者:helloworld

batch数据为64,循环次数为10次,损失函数优化完,最终完成评分为0.05。

2019-04-18 18:13:09

0.05

23

提供者:喵喵

batch数据为32,循环次数为1000次,损失函数优化完,最终完成评分为0.04。

2019-04-18 17:56:12

0.04

24

提供者:Reluminia

batch数据为32,循环次数为10次,损失函数优化完,最终完成评分为0.04。

2019-04-17 21:15:55

0.04

25

提供者:懒散小青年

batch数据为100,循环次数为200次,损失函数优化完,最终完成评分为0.03。

2019-04-18 19:50:16

0.03

26

提供者:liyonghong

batch数据为128,循环次数为50次,损失函数优化完,最终完成评分为0.02。

2019-04-16 12:20:16

0.02

27

提供者:刘喵兄

batch数据为64,循环次数为10000次,损失函数优化完,最终完成评分为0.02。

2019-04-15 20:30:46

0.02

28

提供者:MagicCodes

batch数据为32,循环次数为10次,损失函数优化完,最终完成评分为0.02。

2019-04-19 16:11:12

0.02

万元奖金等你拿,挑战者,都在 FlyAI

点击立即报名

下载参赛资料

挑战者大赛 官方交流群

训练记录

你还没有任何提交记录喔...

使用指南

1. 下载项目并解压
2. 使用终端进入到项目的根目录下

cd /path/to/project

Mac和Linux用户使用 ./flyai 脚本文件

3. 初始化环境并登录

授权flyai脚本

chmod +x ./flyai

下载完成之后,执行下列命令并使用微信扫码登录

./flyai init

登录成功之后,会自动下载运行所需环境

4. 本地开发调试

执行

./flyai test

安装项目所需依赖,并运行 main.py

如果使用本地IDE开发,可以自行安装 requirements.txt 中的依赖,运行 main.py 即可

5.提交训练到GPU

项目中如有新的引用,需加入到 requirements.txt 文件中

在终端下执行

./flyai train

返回sucess状态,代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

默认训练成功后不公开在项目排行榜中,公开项目需在提交训练时执行

./flyai train -p=1

完整训练设置执行代码示例:

./flyai train -p=1 -b=32 -e=100

通过执行训练命令,本次训练循环 100 次,每次训练读取的数据量为 32 ,公开提交模型

$vue{ errorTip }

发送样例至我的邮箱

已发送

已发送成功

请查收FlyAI官方邮件查看详情 根据样例提高算法评分可以获得积分奖励 用来兑换GPU训练时长

确定

报名成功!

感谢您的参与!点击 下载资料 并及时提交您的作品

下载资料

打开微信,使用扫一扫功能分享给好友