生活场景汉语语音识别

分享给好友

2019-08-02 15:00:00
开始提交

2019-09-01 15:00:00
最终提交结束

自由训练

剩余奖金 ¥ 10,000
参赛权限提示

当前赛题需能力值达到 $vue{itemranking} 才可以正常提交训练哦~

当前赛题仅允许 600 能力值以下的新手可以正常提交训练哦~

报名参赛

下载当前代码

您可使用自己熟悉的编辑器实现算法并通过命令行
提交任务到FlyAI云端训练。确认下载体验吗?

$vue{upDataType ? '上传样例压缩包' : '上传代码压缩包' }

请将代码文件压缩为zip格式,文件大小不超过10M 提示:请确认删除"data"⽂件夹后进行上传操作

将文件拖拽至此处或点击此处选择文件

$vue{complete < 99 ? '上传中' : '上传完成'} $vue{complete}

$vue{fileName}
线上GPU运行环境:
FlyAl推荐如下配置,如有问题可手动添加或修改!

GPU环境

深度学习框架

其它依赖

提交
提交

提交确认

设置好参数后点击“确定“发布GPU训练任务

EPOCHS

BATCH SIZE

绑定你的微信账号

用于本地环境登录和实时接收训练通知

打开微信,使用扫一扫功能分享给好友

绑定你的微信账号

用于本地环境登录和实时接收训练通知

温馨提示

$vue{csv_msg}

知道了
提交结果文件

$vue{csvName == '' ? '仅支持上传 CSV 格式的文件' : csvName+' 上传中...'}

$vue{csvName}上传成功
取消 确认提交

提交成功

系统正在测评您的结果文件,

您可通过右侧【我的提交-查看记录详情】进行查看

知道了
  • 赛事介绍
  • 竞赛排行榜
  • 奖金记录
  • 讨论($vue{comment_count})
  • 学习资源

$vue{item.rank_name}

大赛简介

本数据集是Mozilla收集的汉语普通话语音数据集,旨在帮助教会机器真人的说话方式。数据集共包含6234条语音文件,内容涵盖了历史、文学、科学等多方面知识。

参赛须知

参赛时间: 本次竞赛无时间限制,长期有效开放

参赛方式

  • 下载FlyAI样例模版进行本地调试并提交到云端使用免费GPU进行模型训练获得最终成绩得分。

参赛选手说明

  • 参赛人员身份信息需保证真实、有效,大赛主办方仅将个人信息用于赛事数据授权及颁奖使用
  • 欢迎海内外的在校学生,算法工程师和所有AI爱好者参与
  • 本次竞赛报名形式:以个人形式本地提交作品线上审核,并且以最终提交算法得分作为唯一有效成绩
  • 在比赛截止日期前,团队中成绩最高分作为本团队的最终成绩
  • 报名成功后请加入FlyAI竞赛交流群,一起学习进步!重要通知也将在群内发布,不要错过哦

比赛作品说明

  • 参赛选手需要配合组委会对比赛作品的有效性与真实性进行验证
  • 不同团队/个人,提交相似结果文件,取消双方所有人员参赛资格
  • 多开小号报名、提交,一经发现将取消参赛资格
  • 禁止使用外部链接下载代码替换本项目代码
  • 比赛过程中,通过脚本获取比赛数据,成绩无效
  • 使用线上测试集进行训练或者使用非官方提供的外部数据进行训练,成绩无效
  • 使用的预训练模型需为FlyAI官方审核通过的模型,使用非官方验证预训练模型,成绩无效
  • 提交的代码具备可解释性并且其它开源框架可复现
  • 所有相似代码将一律不通过审核!!情况多次出现者封号处理
  • 如有发现利用非正常手段作弊行为,奖金一律不发放。之前所获得奖金金额官方有权收回,情节严重者封号处理
  • 提交代码即视为阅读并同意以上比赛作品说明

大赛奖项设置

奖项说明:

奖项设置 获奖人数 奖金额度说明(按最终得分评判)
参与奖(总奖金30%) 所有人 不同得分区间获得相应的竞赛奖金
突破奖(总奖金20%) 所有人 更新排行榜得分,获取相应竞赛奖金
排名奖(总奖金50%) 第一周/月前3名(冠、亚、季军) 项目上线第一周、第一个月; Time_P(周) = 0.5,Time_P(月) = 0.5;K1=0.5,K2=0.3,K3=0.2;
不同框架奖励 所有人 获得60FAI币用于GPU训练资源消耗

赛事主题和数据说明

赛题描述

通过实现算法并提交训练,获取奖金池奖金。小提示:抢先更新算法排行榜,有更大机会获取高额奖金哦!

数据描述

由于需要提交代码作品在云端进行训练,参赛数据集不对外开放。仅提供调试数据。

字段说明:

文件名 字段名称 字段类型 备注
audio_path url 不为空 语音文件路径
label string 不为空 标注

参考文献:

[1]

评审标准

算法输入输出格式

输入字段: audio_path,

输出字段: label,

评审指标说明

  • 评审参考指标: WER(字错误率,Word Error Rate)
  • 最终得分根据词错误率百分比差值计算,公式如下:
  • 评审计算公式

比赛常见问题说明

Q:比赛使用什么框架?

  • 比赛支持常用的机器学习和深度学习框架,比如TensorFlow,PyTorch,Keras,Scikit-learn、MXNet等。

Q:怎么参加比赛,需不需要提交CSV文件?

  • FlyAI竞赛平台提供免费云端GPU资源,报名后可以使用自己熟练的框架,修改main.py中的网络结构和processor.py中的数据处理;仅部分赛题支持CSV方式提交,请仔细阅读参赛方式相关内容。

Q:比赛排行榜分数怎么得到的?

  • 参加项目竞赛必须实现 model.py 中的predict_all方法。系统通过该方法,调用模型得出评分。
超过 50分 的成绩会在48小时内更新到排行榜,不要着急哦!
第三名

快来追我呀

batch数据为1,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为40.93。

2019-08-11 18:07:46

40.93

第三名

AiFool

batch数据为16,循环次数为500次,通过在线上环境完成训练,模型最优精度评分为26.98。

2019-08-24 05:20:23

26.98

第三名

此方一泉

batch数据为2,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为4.51。

2019-08-05 17:19:42

4.51

4

Santi

batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为3.77。

2020-05-07 06:07:50

3.77

5

Perl

batch数据为16,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为0.58。

2019-08-06 07:19:07

0.58

6

bnulee

batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为0.10。

2019-10-17 14:16:20

0.10

7

clare

batch数据为16,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为0.05。

2019-07-20 05:56:11

0.05

8

风雨兼程

batch数据为64,循环次数为80次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-08-06 14:59:54

0.00

9

知更

batch数据为50,循环次数为20次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-08-06 22:51:13

0.00

10

killf

batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-08-12 03:27:28

0.00

11

二小

batch数据为32,循环次数为50次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-08-15 10:19:30

0.00

12

batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-08-21 15:42:13

0.00

13

Neo Francies

batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-08-23 13:18:19

0.00

14

208.

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-08-23 14:34:53

0.00

15

xyk

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-09-21 09:35:18

0.00

16

zhong22

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-10-12 21:30:12

0.00

17

天雨龙马

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-10-15 10:33:21

0.00

18

E小zhu22

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-10-15 18:03:57

0.00

19

顺宝

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-10-18 16:55:51

0.00

20

sishiwu

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-10-26 13:57:48

0.00

21

夏1564457098

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-10-26 15:25:15

0.00

22

沐沐

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-10-30 17:45:13

0.00

23

阿尔贾克斯

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-11-01 18:00:37

0.00

24

鸡毛飞上天

batch数据为1,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-11-03 19:09:42

0.00

25

成文

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-11-06 09:56:10

0.00

26

learnFromBest

batch数据为16,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-11-07 22:33:03

0.00

27

D.N.A

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-11-12 18:43:42

0.00

28

王洪彬

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-11-13 19:05:45

0.00

29

龙行无疆

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-11-15 19:52:00

0.00

30

sly

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-11-20 10:40:08

0.00

31

trierbo

batch数据为64,循环次数为50次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-11-28 16:19:55

0.00

32

卡拉玛哈马塔

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-11-29 08:54:54

0.00

33

跟我走吧

batch数据为12,循环次数为15次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-11-30 10:54:34

0.00

34

dark444steel

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-11-30 16:29:24

0.00

35

rhapsody

batch数据为64,循环次数为128次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-11-30 22:30:05

0.00

36

Andy9918

batch数据为32,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为0.00。

2019-12-19 10:08:54

0.00

37

佳乐

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2020-01-03 14:44:14

0.00

38

星星

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2020-01-16 20:26:54

0.00

39

Jay Kay

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2020-03-29 00:36:06

0.00

40

Honay, King

batch数据为32,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为0.00。

2020-04-13 12:44:03

0.00

41

im-m

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2020-04-19 22:26:35

0.00

42

人道

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2020-04-25 14:53:48

0.00

43

圣诞包公

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2020-06-10 20:59:01

0.00

44

张万春

batch数据为64,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为0.00。

2020-06-17 14:14:40

0.00

45

=

batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为0.00。

2020-11-30 23:39:59

0.00

46

zxj

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2020-12-03 14:01:04

0.00

还没有奖金记录哦~ 快去参赛吧!

讨论
500字
表情
发送
删除确认
是否删除该条评论?
取消 删除
$vue{item.user_name}

$vue{item.title} $vue{item.title}

$vue{items}
$vue{item.like_count}
$vue{item.comment_counts}
$vue{item.comment_counts}
阅读 $vue{item.views}

这里还没有内容哦

挑战者大赛 官方交流群

我的记录

你还没有任何提交记录喔...

  • 参赛流程
  • 常见问题

第一步:参赛选手从FlyAI官网选择比赛报名,需下载样例代码

下载的项目中不包含数据集,运行main.py会自动下载调试数据集

本地调试根据不同数据集会提供10%~100%数据,全量数据提交到GPU后会自动更新替换

下载样例代码,解压后在样例代码上编写自己的模型代码,压缩后再在上传代码位置进行上传,就可以查看自己得分。

第二步:本地代码调试

本地配置Python3.5以上的运行环境,并安装项目运行所需的Python依赖包 app.json是项目的配置文件

在main.py中编写神经网络,没有框架限制

在prediction.py测试模型是否评估成功

main.py中需在class Main(FlyAI) 类中实现自己的训练过程

第三步:提交到GPU训练,保存模型

本地调试完成之后,提交代码到GPU,在全量数据上训练模型,保存最优模型。

提交GPU的方式有:网站在线提交。

第四步:评估模型,获取奖金,实时提现

GPU训练完成后,会调用prediction.py中的predict方法进行评估,并给出最后得分

高分的参赛选手,可实时获取奖金,通过微信提现

Q:如何获得奖金?

A:超过项目设置的最低分,根据公式计算,就可以获得奖金。

Q:比赛使用什么框架?

A:比赛支持常用的机器学习和深度学习框架,比如TensorFlow,PyTorch,Keras,Scikit-learn等。

Q:怎么参加比赛,需不需要提交csv文件?

A:FlyAI竞赛平台无需提交csv文件,在网页上点击报名,下载项目,使用你熟练的框架,修改main.py中的网络结构和数据处理,在prediction.py中进行加载模型及预测。将代码文件压缩为.zip格式,文件大小不超过10M,之后在网站进行在线提交就可以了。

Q:比赛排行榜分数怎么得到的?

A:参加项目竞赛必须实现 prediction.py 中的predict方法。调用模型得出评分。

Q:平台机器什么配置?

A:目前每个训练独占一块V100显卡,显存10G。

Q:本地数据集在哪?

A:可以本地使用ide运行 main.py 下载数据。

Q:FAI训练积分不够用怎么办?

A:目前GPU免费使用,可以进入到:我的积分,通过签到和分享等途径获得大量积分。

Q:离线训练代码不符合规范问题?

A:main.py中可以使用args.EPOCHS和args.BATCH。