仇恨言论识别

分享给好友

剩余奖金 ¥ 4,642

立即报名

立即报名

大赛简介

此数据集包含25000多条推文内容。仇恨言论识别任务:查看短文,并确定它是否为 0(包含仇恨言论),1(冒犯性的,但没有仇恨言论),2(一点也没有冒犯性)。

参赛须知

参赛时间: 本次竞赛无时间限制,长期有效开放

如何参赛?

  • 请在项目详情页点击【立即报名】按钮,首次需验证手机号、完善报名信息
  • 请点击本页的【资料下载】按钮,下载参赛资料并详细阅读README.md文件

参赛选手说明

  • 参赛人员身份信息需保证真实、有效,大赛主办方仅将个人信息用于赛事数据授权及颁奖使用
  • 欢迎海内外的在校学生,算法工程师和所有AI爱好者参与
  • 本次竞赛报名形式:以个人形式本地提交作品线上审核,并且以最终提交算法得分作为唯一有效成绩
  • 报名成功后请加入FlyAI竞赛交流群,一起学习进步!重要通知也将在群内发布,不要错过哦

比赛作品说明

  • 最终比赛成绩以排行榜显示排名为准
  • 根据作品提交时间先后顺序进行人工审核,审核合格后提交至排行榜
  • 禁止使用外部链接下载代码替换本项目代码
  • 所有相似代码将一律不通过审核!!情况多次出现者封号处理
  • 如有发现利用非正常手段作弊行为,奖金一律不发放。之前所获得奖金金额官方有权收回,情节严重者封号处理
  • 提交代码即视为阅读并同意以上比赛作品说明

大赛奖项设置

奖项说明:

奖项设置 获奖人数 奖金额度说明(按最终得分评判)
参与奖(总奖金20%) 所有人 根据基线得分与100分之间,分成5个奖金区间;不同得分区间获得相应的竞赛奖金。
突破奖(总奖金10%) 所有人 更新排行榜最高分数,获得相应的竞赛奖金
排名奖(总奖金70%) 月赛前5名 奖金发放最终以月为单位,前5名获奖占比以K系数表示,分别为:0.45,0.25,0.15,0.1,0.05
不同框架奖励 所有人 获得60FAI币用于GPU训练资源消耗

备注:

  • 上线时间:2019-08-08
  • 月排名奖结算时间:2019-09-08 15:00:00
  • 奖金获取标准:90<Score
  • 获得奖金分为3部分:参与奖、突破奖为审核完毕实时获取的奖金,排名奖需在规定时间结束后根据排名顺序获得
  • 排名奖发放完毕前5名参赛者需提供Markdown格式赛题解决思路(FlyAI提供模版)
  • Bouns表示为:奖金池总金额;Score表示为:模型得分;
  • 同一用户在参与奖中模型得分区间相同无法再次获得奖励
  • 各项奖金获得计算公式参考如下:
  • 参与奖(Participation Award)
  • R表示:得分的区间系数;T表示为:相同得分区间得分人数;
  • 100-标准分:分为5个区间系数;R1(0.02),R2(0.08),R3(0.15),R4(0.25),R5(0.5)
  • 奖金计算公式1
  • 突破奖(Prizes)
  • N表示:第N次更新排行榜;Prizes_N-1表示:排行榜更新后已发放的突破奖金
  • 奖金计算公式2
  • 排名奖(Ranking Award)
  • K表示:排行榜前5名的奖金分配系数,分别为:0.45,0.25,0.15,0.1,0.05;
  • 奖金计算公式3

赛事主题和数据说明

赛题描述

通过实现算法并提交训练,获取奖金池奖金。小提示:抢先更新算法排行榜,有更大机会获取高额奖金哦!

数据来源

HOLDistinguish

数据描述

字段说明:

字段名 字段类型 取值区间 字段描述
text string 不为空 文本
label int 大于等于 0, 小于等于 2 分类标签

输入字段: text,

输出字段: label,

参考文献:

[1]Racial Bias in Hate Speech and Abusive Language Detection Datasets

评审标准

评审指标说明

  • 精确率(Precision,简称为P):正确预测为正的占全部预测为正的比例
  • 召回率(Recall,简称为R):正确预测为正的占全部实际为正的比例
  • F1-Score 是精确率和召回率的一种加权平均,它的最大值为1,最小值为0
  • 计算公式如下:
  • 评审计算公式

比赛常见问题说明

Q:比赛使用什么框架?

  • 比赛支持常用的机器学习和深度学习框架,比如TensorFlow,PyTorch,Keras,Scikit-learn、MXNet、PaddlePaddle、FastAI等。

Q:怎么参加比赛,需不需要提交csv文件?

  • FlyAI竞赛平台无需提交csv文件,在网页上点击报名,下载项目,使用你熟练的框架,修改main.py中的网络结构,和processor.py中的数据处理。请仔细阅读右侧提交指南,使用FlyAI命令参与比赛。

Q:比赛排行榜分数怎么得到的?

  • 参加项目竞赛必须实现 model.py 中的predict_all方法。系统通过该方法,调用模型得出评分。

展开

  • 竞赛排行榜
第三名

提供者:sakuranew

76.00

batch数据为12,循环次数为15次,损失函数优化完,最终完成评分为92.35。

2019-08-12 02:35:50

76.00

92.35

第三名

提供者:NLP-Learner

25.00

batch数据为500,循环次数为32次,损失函数优化完,最终完成评分为92.33。

2019-08-13 00:48:52

25.00

92.33

第三名

提供者:余军

244.00

batch数据为32,循环次数为3次,损失函数优化完,最终完成评分为92.29。

2019-08-15 06:48:07

244.00

92.29

4

提供者:未名湖畔的落叶

12.50

batch数据为32,循环次数为5次,损失函数优化完,最终完成评分为92.09。

2019-08-10 21:15:09

12.50

92.09

5

提供者:Noah

batch数据为128,循环次数为16次,损失函数优化完,最终完成评分为90.68。

2019-08-16 11:14:30

90.68

6

提供者:killf

1.25

batch数据为32,循环次数为20次,损失函数优化完,最终完成评分为90.51。

Paddle

NLP

2019-08-10 07:57:44

1.25

90.51

7

提供者:麦小杨

batch数据为32,循环次数为4次,损失函数优化完,最终完成评分为90.45。

2019-08-17 20:39:36

90.45

8

提供者:那棵树

batch数据为64,循环次数为10次,损失函数优化完,最终完成评分为90.35。

2019-08-15 00:25:22

90.35

9

提供者:莫须有の嚣张

batch数据为64,循环次数为20次,损失函数优化完,最终完成评分为89.96。

2019-08-11 17:09:54

89.96

10

提供者:Xin Yao

batch数据为128,循环次数为20次,损失函数优化完,最终完成评分为89.76。

2019-08-10 12:14:24

89.76

11

提供者:nigeiwochi

batch数据为5,循环次数为100次,损失函数优化完,最终完成评分为89.53。

2019-08-13 12:47:47

89.53

12

提供者:探索之路

batch数据为128,循环次数为1000次,损失函数优化完,最终完成评分为89.53。

2019-08-14 09:29:49

89.53

13

提供者:malena

batch数据为256,循环次数为1340次,损失函数优化完,最终完成评分为89.07。

2019-08-09 05:04:36

89.07

14

提供者:指尖、泪残留

batch数据为500,循环次数为64次,损失函数优化完,最终完成评分为88.92。

2019-08-17 12:43:48

88.92

15

提供者:Cwinq

batch数据为10,循环次数为50次,损失函数优化完,最终完成评分为88.78。

2019-08-14 03:16:06

88.78

16

提供者:happyprince

batch数据为500,循环次数为32次,损失函数优化完,最终完成评分为88.73。

2019-08-09 00:00:22

88.73

17

提供者:陈查无此字

batch数据为32,循环次数为12次,损失函数优化完,最终完成评分为88.13。

2019-08-09 02:36:30

88.13

18

提供者:向颖聪

batch数据为64,循环次数为32次,损失函数优化完,最终完成评分为88.05。

2019-08-18 17:31:06

88.05

19

提供者:yphacker

batch数据为64,循环次数为8次,损失函数优化完,最终完成评分为88。

2019-08-08 23:32:27

88.00

20

提供者:白开水

batch数据为100,循环次数为32次,损失函数优化完,最终完成评分为87.99。

2019-08-15 10:05:30

87.99

21

提供者:AiFool

batch数据为1024,循环次数为1000次,损失函数优化完,最终完成评分为87.91。

2019-08-14 17:00:04

87.91

22

提供者:夏1564457098

batch数据为32,循环次数为30次,损失函数优化完,最终完成评分为87.88。

2019-08-16 13:49:05

87.88

23

提供者:cl

batch数据为32,循环次数为15次,损失函数优化完,最终完成评分为87.85。

2019-08-14 01:26:04

87.85

24

提供者:玖月初识

batch数据为32,循环次数为10次,损失函数优化完,最终完成评分为87.75。

2019-08-12 13:32:01

87.75

25

提供者:妙医佳-妙云事业部

batch数据为16,循环次数为32次,损失函数优化完,最终完成评分为86.95。

2019-08-12 12:35:18

86.95

26

提供者:ALC

batch数据为500,循环次数为32次,损失函数优化完,最终完成评分为86.21。

2019-08-18 14:57:34

86.21

27

提供者:ON-looker

batch数据为32,循环次数为32次,损失函数优化完,最终完成评分为86.07。

2019-08-09 20:34:59

86.07

28

提供者:binwang672012@gmail.com

batch数据为32,循环次数为100次,损失函数优化完,最终完成评分为85.49。

2019-08-13 17:43:37

85.49

29

提供者:青青子衿

batch数据为500,循环次数为1000次,损失函数优化完,最终完成评分为84.86。

2019-08-16 11:26:46

84.86

30

提供者:永不息的舞步

batch数据为32,循环次数为500次,损失函数优化完,最终完成评分为82.71。

Keras

bilstm + attention

2019-08-16 23:31:34

82.71

31

提供者:你好像很厉害的样子

batch数据为1,循环次数为1次,损失函数优化完,最终完成评分为79.9。

2019-08-09 05:24:11

79.90

32

提供者:0o0

batch数据为500,循环次数为320次,损失函数优化完,最终完成评分为。

2019-08-10 00:26:31

0.00

33

提供者:Yamada

batch数据为32,循环次数为10次,损失函数优化完,最终完成评分为。

2019-08-14 01:19:34

0.00

34

提供者:Jelly1564985141

batch数据为32,循环次数为10次,损失函数优化完,最终完成评分为。

2019-08-16 01:38:32

0.00

35

提供者:京

batch数据为30,循环次数为9次,损失函数优化完,最终完成评分为。

2019-08-16 11:59:41

0.00

36

提供者:Hawk™

batch数据为500,循环次数为32次,损失函数优化完,最终完成评分为。

fastai

AWD_LSTM

2019-08-19 14:02:24

0.00

万元奖金等你拿,挑战者,都在 FlyAI

点击立即报名

下载参赛资料

挑战者大赛 官方交流群

训练记录

你还没有任何提交记录喔...

使用指南

  • windows客户端
  • windows命令行
  • Mac/Linux
1. 下载项目并解压
2.进入到项目目录下,双击执行flyai.exe程序

第一次使用需要使用微信扫码登录

杀毒软件可能会误报,点击信任该程序即可

3.本地开发调试

运行flyai.exe程序,点击"本地调试"按钮,输入循环次数和数据量,点击运行即可调用main.py

如果使用本地IDE开发,需要执行安装“flyai”依赖并导入项目,运行main.py

4.下载本地测试数据

运行flyai.exe程序,点击"下载数据"按钮,程序会下载100条调试数据

5.提交训练到GPU

运行flyai.exe程序,点击"提交到GPU"按钮,输入循环次数和数据量,点击运行即可提交到GPU训练。

返回sucess状态,代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

1. 下载项目并解压
2. 打开运行,输入cmd,打开终端

Win+R 输入cmd

3. 使用终端进入到项目的根目录下

首先进入到项目对应的磁盘中,然后执行

cd path\to\project

Windows用户使用 flyai.exe

4. 本地开发调试

执行下列命令本地安装环境并调试(第一次使用需要使用微信扫码登录)

flyai.exe test

执行test命令,会自动下载100条测试数据到项目下

安装项目所需依赖,并运行 main.py

如果使用本地IDE开发,可以自行安装 requirements.txt 中的依赖,运行 main.py 即可

5.提交训练到GPU

项目中如有新的引用,需加入到 requirements.txt 文件中

在终端下执行

flyai.exe train

返回sucess状态,代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

完整训练设置执行代码示例:

flyai.exe train -b=32 -e=100

通过执行训练命令,本次训练循环 100 次,每次训练读取的数据量为 32 。

1. 下载项目并解压
2. 使用终端进入到项目的根目录下

cd /path/to/project

Mac和Linux用户使用 ./flyai 脚本文件

3. 初始化环境并登录

授权flyai脚本

chmod +x ./flyai

4. 本地开发调试

执行下列命令本地安装环境并调试(第一次使用需要使用微信扫码登录)

./flyai test 注意:命令前面不要加sudo

执行test命令,会自动下载100条测试数据到项目下

安装项目所需依赖,并运行 main.py

如果使用本地IDE开发,可以自行安装 requirements.txt 中的依赖,运行 main.py 即可

5.提交训练到GPU

项目中如有新的引用,需加入到 requirements.txt 文件中

在终端下执行

./flyai train 注意:命令前面不要加sudo

返回sucess状态,代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

完整训练设置执行代码示例:

./flyai train -b=32 -e=100

通过执行训练命令,本次训练循环 100 次,每次训练读取的数据量为 32 。

$vue{ errorTip }

发送样例至我的邮箱

已发送

已发送成功

请查收FlyAI官方邮件查看详情 根据样例提高算法评分可以获得积分奖励 用来兑换GPU训练时长

确定

$vue{flag?'报名成功!':'参赛温馨提示'}

感谢您的参与!点击 下载资料 并及时提交您的作品

您在当前领域能力值未达到参赛标准,
请选择符合能力标准的项目哦!

下载资料

打开微信,使用扫一扫功能分享给好友