搜狗新闻文本分类预测

分享给好友

报名参赛

体验云端免费GPU极速训练,还能赢奖⾦!

报名参赛

大赛简介

该数据集来自若干新闻站点2012年6月—7月期间国内,国际,体育,社会,娱乐等18个频道的新闻数据。根据新闻正文内容分析新闻的类别

赛事主题和数据说明

赛题描述

通过迭代自己的算法模型并提交训练,获取奖金池高额奖金。小提示:抢先更新算法排行榜,有更大机会获取高额奖金哦

数据来源

sogouNews

数据描述

由于需要提交代码作品在云端进行训练,参赛数据集不对外开放。仅提供调试数据,可通过使用本地调试的方式获取调试数据集。本地调试和提交指南请查看[文档中心]

字段说明:

字段名 字段类型 取值区间 字段描述
text string 不为空 文章内容
label string 不为空 文章类型

输入字段: text,

输出字段: label,

参考文献:

[1]Automatic Online News Issue Construction in Web Environment. Canhui Wang, Min Zhang, Shaoping ma, Liyun Ru, the 17th International World Wide Web Conference (WWW08), Beijing, April, 2008.

评审标准

评审指标说明

  • 准确率(Accuracy):对于给定的测试数据集,预测正确的样本数与实际总样本数之比
  • True,表示预测正确的样本数数量
  • Total Number of Samples,表示实际总样本数数量
  • 计算公式如下:

展开

  • 竞赛排行榜
  • 自由练习榜单
第三名

提供者:cclxx

大神经验
batch数据为128,循环次数为2500次,损失函数优化完,最终完成评分为94.8。

2019-04-10 10:54:12

94.80

大神经验
第三名

提供者:云中漫步的云彩

大神经验
batch数据为256,循环次数为4000次,损失函数优化完,最终完成评分为94.1。

2019-04-21 16:08:13

94.10

大神经验
第三名

提供者:BrikerMan

大神经验
batch数据为320,循环次数为2000次,损失函数优化完,最终完成评分为93.45。

2019-04-23 12:49:13

93.45

大神经验
4

提供者:杰

大神经验
batch数据为256,循环次数为3000次,损失函数优化完,最终完成评分为93.25。

2019-04-12 20:00:54

93.25

大神经验
5

提供者:菜菜来了

大神经验
batch数据为256,循环次数为5000次,损失函数优化完,最终完成评分为93.25。

2019-04-18 17:05:39

93.25

大神经验
6

提供者:Keaton

大神经验
batch数据为64,循环次数为20次,损失函数优化完,最终完成评分为93.05。

2019-08-01 17:14:30

93.05

大神经验
7

提供者:lbj

大神经验
batch数据为128,循环次数为3000次,损失函数优化完,最终完成评分为92.3。

2019-04-02 12:40:33

92.30

大神经验
8

提供者:麦小杨

大神经验
batch数据为16,循环次数为3次,损失函数优化完,最终完成评分为92.2。

2019-06-11 09:59:52

92.20

大神经验
9

提供者:NLP-Learner

暂未公开
batch数据为128,循环次数为1000次,损失函数优化完,最终完成评分为92.15。

2019-05-16 16:11:42

92.15

暂未公开
10

提供者:侠

大神经验
batch数据为128,循环次数为2000次,损失函数优化完,最终完成评分为91.95。

2019-05-23 11:53:58

91.95

大神经验
11

提供者:Z

暂未公开
batch数据为256,循环次数为5000次,损失函数优化完,最终完成评分为91.65。

2019-05-26 10:57:52

91.65

暂未公开
12

提供者:Staples

暂未公开
batch数据为128,循环次数为3000次,损失函数优化完,最终完成评分为91.2。

2019-04-02 13:11:27

91.20

暂未公开
13

提供者:alex_jiang

暂未公开
batch数据为256,循环次数为3000次,损失函数优化完,最终完成评分为91.1。

2019-04-02 16:33:45

91.10

暂未公开
14

提供者:Lavender

暂未公开
batch数据为256,循环次数为5000次,损失函数优化完,最终完成评分为91.1。

2019-06-23 18:59:51

91.10

暂未公开
15

提供者:yunqixu1554192835

暂未公开
batch数据为128,循环次数为4000次,损失函数优化完,最终完成评分为90.85。

Keras

CNN+LSTM

2019-04-09 17:12:14

90.85

暂未公开
16

提供者:梅三哥的柯基

暂未公开
batch数据为128,循环次数为2000次,损失函数优化完,最终完成评分为90.7。

2019-05-23 17:00:50

90.70

暂未公开
17

提供者:致Great

暂未公开
batch数据为64,循环次数为3000次,损失函数优化完,最终完成评分为90.65。

2019-04-10 01:00:59

90.65

暂未公开
18

提供者:Hallo

暂未公开
batch数据为256,循环次数为3333次,损失函数优化完,最终完成评分为90.5。

2019-03-20 16:49:44

90.50

暂未公开
19

提供者:as472780551

暂未公开
batch数据为128,循环次数为5000次,损失函数优化完,最终完成评分为90.5。

2019-05-19 09:41:45

90.50

暂未公开
20

提供者:horson

暂未公开
batch数据为128,循环次数为3000次,损失函数优化完,最终完成评分为90.45。

2019-04-15 14:56:02

90.45

暂未公开
21

提供者:Neptune

暂未公开
batch数据为128,循环次数为3000次,损失函数优化完,最终完成评分为90.3。

2019-04-27 12:38:36

90.30

暂未公开
22

提供者:军军无敌

暂未公开
batch数据为128,循环次数为5000次,损失函数优化完,最终完成评分为90.15。

2019-04-03 10:24:38

90.15

暂未公开
23

提供者:FC

暂未公开
batch数据为256,循环次数为3000次,损失函数优化完,最终完成评分为90.15。

2019-04-14 23:51:04

90.15

暂未公开
24

提供者:lightning-zgc

暂未公开
batch数据为128,循环次数为5000次,损失函数优化完,最终完成评分为90.1。

2019-04-04 18:34:27

90.10

暂未公开
25

提供者:Jtay2019

暂未公开
batch数据为128,循环次数为1000次,损失函数优化完,最终完成评分为90.1。

2019-05-14 07:58:18

90.10

暂未公开
26

提供者:虹猫少侠

暂未公开
batch数据为128,循环次数为3000次,损失函数优化完,最终完成评分为89.75。

2019-04-05 23:50:41

89.75

暂未公开
27

提供者:Sky*maple

暂未公开
batch数据为128,循环次数为3000次,损失函数优化完,最终完成评分为89.7。

2019-06-01 20:57:03

89.70

暂未公开
28

提供者:rust

暂未公开
batch数据为256,循环次数为1000次,损失函数优化完,最终完成评分为89.55。

2019-04-04 14:32:21

89.55

暂未公开
29

提供者:Frodo_X

暂未公开
batch数据为128,循环次数为2000次,损失函数优化完,最终完成评分为89.55。

2019-05-11 22:01:01

89.55

暂未公开
30

提供者:慕先

暂未公开
batch数据为200,循环次数为10000次,损失函数优化完,最终完成评分为89.55。

2019-07-28 22:35:25

89.55

暂未公开
31

提供者:晓风残月丶

暂未公开
batch数据为256,循环次数为2500次,损失函数优化完,最终完成评分为89.45。

2019-05-05 15:30:51

89.45

暂未公开
32

提供者:Gavin

暂未公开
batch数据为128,循环次数为8000次,损失函数优化完,最终完成评分为89.35。

2019-03-29 19:50:31

89.35

暂未公开
33

提供者:浮生若梦

暂未公开
batch数据为32,循环次数为10000次,损失函数优化完,最终完成评分为89.3。

2019-04-28 03:16:49

89.30

暂未公开
34

提供者:david-dzt

暂未公开
batch数据为128,循环次数为3000次,损失函数优化完,最终完成评分为89.25。

2019-04-07 19:49:09

89.25

暂未公开
35

提供者:To Be Strong

暂未公开
batch数据为128,循环次数为2000次,损失函数优化完,最终完成评分为89.2。

2019-05-10 18:02:11

89.20

暂未公开
36

提供者:LzM_

暂未公开
batch数据为128,循环次数为3000次,损失函数优化完,最终完成评分为89.1。

2019-03-21 01:32:11

89.10

暂未公开
37

提供者:李佳政Rengar

暂未公开
batch数据为128,循环次数为2000次,损失函数优化完,最终完成评分为88.95。

2019-04-03 14:15:24

88.95

暂未公开
38

提供者:zhiduanqingchang

暂未公开
batch数据为128,循环次数为2000次,损失函数优化完,最终完成评分为88.95。

2019-04-08 00:04:19

88.95

暂未公开
39

提供者:ttttaeyang

暂未公开
batch数据为128,循环次数为3000次,损失函数优化完,最终完成评分为88.95。

2019-05-20 16:40:17

88.95

暂未公开
40

提供者:低调菜

暂未公开
batch数据为128,循环次数为3000次,损失函数优化完,最终完成评分为88.8。

2019-04-08 18:50:43

88.80

暂未公开
41

提供者:藏锋1558175243

暂未公开
batch数据为512,循环次数为5000次,损失函数优化完,最终完成评分为88.75。

2019-05-19 02:31:56

88.75

暂未公开
42

提供者:江月

暂未公开
batch数据为128,循环次数为2500次,损失函数优化完,最终完成评分为88.5。

2019-05-22 13:39:45

88.50

暂未公开
43

提供者:梯度下降

暂未公开
batch数据为256,循环次数为5000次,损失函数优化完,最终完成评分为88.4。

2019-03-19 16:42:24

88.40

暂未公开
44

提供者:Anthonyจุ๊บ

暂未公开
batch数据为1024,循环次数为3000次,损失函数优化完,最终完成评分为88.2。

2019-06-27 15:45:14

88.20

暂未公开
45

提供者:Elliott

暂未公开
batch数据为64,循环次数为2000次,损失函数优化完,最终完成评分为88.15。

2019-05-18 23:43:49

88.15

暂未公开
46

提供者:刘谕齐

暂未公开
batch数据为256,循环次数为1500次,损失函数优化完,最终完成评分为88.1。

2019-03-31 10:02:55

88.10

暂未公开
47

提供者:凌空

暂未公开
batch数据为128,循环次数为2500次,损失函数优化完,最终完成评分为88.05。

2019-05-04 22:24:03

88.05

暂未公开
48

提供者:筱潇妍

暂未公开
batch数据为2000,循环次数为256次,损失函数优化完,最终完成评分为88.05。

2019-08-04 13:26:50

88.05

暂未公开
49

提供者:善假于物

暂未公开
batch数据为512,循环次数为3000次,损失函数优化完,最终完成评分为87.35。

2019-04-07 17:24:02

87.35

暂未公开
50

提供者:k一起旅行

暂未公开
batch数据为128,循环次数为3000次,损失函数优化完,最终完成评分为87.2。

2019-04-02 18:35:49

87.20

暂未公开
51

提供者:灵翼侠

暂未公开
batch数据为32,循环次数为1000次,损失函数优化完,最终完成评分为86.35。

2019-07-01 00:39:25

86.35

暂未公开
52

提供者:为之奈何

暂未公开
batch数据为1024,循环次数为2000次,损失函数优化完,最终完成评分为82.15。

2019-07-04 14:41:28

82.15

暂未公开
53

提供者:fatty

暂未公开
batch数据为128,循环次数为1000次,损失函数优化完,最终完成评分为78.35。

2019-04-03 18:52:37

78.35

暂未公开
54

提供者:sixgod

暂未公开
batch数据为256,循环次数为2019次,损失函数优化完,最终完成评分为77.75。

2019-05-20 17:16:20

77.75

暂未公开
55

提供者:AiFool

暂未公开
batch数据为256,循环次数为100次,损失函数优化完,最终完成评分为77.7。

2019-06-21 17:34:45

77.70

暂未公开
56

提供者:渐行渐远

暂未公开
batch数据为256,循环次数为1500次,损失函数优化完,最终完成评分为63.55。

2019-04-02 15:06:19

63.55

暂未公开
57

提供者:x1554808904

暂未公开
batch数据为32,循环次数为100次,损失函数优化完,最终完成评分为63.15。

2019-04-09 23:50:24

63.15

暂未公开
58

提供者:亚豪

暂未公开
batch数据为128,循环次数为64次,损失函数优化完,最终完成评分为55.55。

2019-05-24 00:48:54

55.55

暂未公开
59

提供者:杰森

暂未公开
batch数据为64,循环次数为1000次,损失函数优化完,最终完成评分为37.7。

2019-04-15 10:53:48

37.70

暂未公开
60

提供者:葫芦枚

暂未公开
batch数据为128,循环次数为500次,损失函数优化完,最终完成评分为25.35。

2019-06-16 17:20:24

25.35

暂未公开
61

提供者:普六茹那罗延

暂未公开
batch数据为32,循环次数为4000次,损失函数优化完,最终完成评分为23.6。

2019-05-26 14:21:32

23.60

暂未公开
62

提供者:就是很任性

暂未公开
batch数据为1000,循环次数为10次,损失函数优化完,最终完成评分为22.8。

2019-04-17 05:48:42

22.80

暂未公开
63

提供者:WillGO!

暂未公开
batch数据为128,循环次数为500次,损失函数优化完,最终完成评分为15.45。

2019-04-30 18:09:35

15.45

暂未公开
第一名
马什么梅 2019-08-05 20:31:08
2019-08-05 20:31:08
88.82
第二名
χ 2019-08-05 22:05:18
2019-08-05 22:05:18
88.82
第三名
michael... 2019-08-08 16:41:49
2019-08-08 16:41:49
88.82
4
永不息的舞步 2019-08-17 05:39:17
2019-08-17 05:39:17
84.4
5
小数定理 2019-08-18 10:28:45
2019-08-18 10:28:45
84.4
6
为我 2019-08-20 23:21:08
2019-08-20 23:21:08
84.4
7
勾陈一 2019-09-02 23:26:43
2019-09-02 23:26:43
84.4
8
宏峰 2019-09-06 09:24:06
2019-09-06 09:24:06
84.4
9
丅丄 2019-09-06 10:28:39
2019-09-06 10:28:39
84.4
10
2019-09-08 08:56:46
2019-09-08 08:56:46
84.4
11
成廿八吋大髀 2019-09-10 09:57:56
2019-09-10 09:57:56
84.4
12
小明1562660031 2019-09-10 16:00:44
2019-09-10 16:00:44
84.4
13
Lllhb 2019-09-18 23:58:34
2019-09-18 23:58:34
84.4
14
弱鸡瑟瑟发抖 2019-09-28 07:36:40
2019-09-28 07:36:40
84.4
15
胡坤伦 2019-09-29 17:27:40
2019-09-29 17:27:40
84.4
16
路飞1568872150 2019-09-30 10:22:05
2019-09-30 10:22:05
84.4
17
Julius 2019-09-30 15:09:48
2019-09-30 15:09:48
84.4
18
jsong 2019-10-18 21:34:27
2019-10-18 21:34:27
84.4
19
jkx、 2019-10-20 11:44:34
2019-10-20 11:44:34
84.4
20
陈坤峰 2019-08-22 21:39:45
2019-08-22 21:39:45
40.55
21
abbott_wj 2019-09-04 21:13:25
2019-09-04 21:13:25
35.45

挑战者大赛 官方交流群

训练记录

你还没有任何提交记录喔...

使用指南

  • windows客户端
  • windows命令行
  • Mac/Linux
1. 下载项目并解压
2.进入到项目目录下,双击执行flyai.exe程序

第一次使用需要使用微信扫码登录

杀毒软件可能会误报,点击信任该程序即可

3.本地开发调试

运行flyai.exe程序,点击"本地调试"按钮,输入循环次数和数据量,点击运行即可调用main.py

如果使用本地IDE开发,需要执行安装“flyai”依赖并导入项目,运行main.py

4.下载本地测试数据

运行flyai.exe程序,点击"下载数据"按钮,程序会下载100条调试数据

5.提交训练到GPU

运行flyai.exe程序,点击"提交到GPU"按钮,输入循环次数和数据量,点击运行即可提交到GPU训练。

返回sucess状态,代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

1. 下载项目并解压
2. 打开运行,输入cmd,打开终端

Win+R 输入cmd

3. 使用终端进入到项目的根目录下

首先进入到项目对应的磁盘中,然后执行

cd path\to\project

Windows用户使用 flyai.exe

4. 本地开发调试

执行下列命令本地安装环境并调试(第一次使用需要使用微信扫码登录)

flyai.exe test

执行test命令,会自动下载100条测试数据到项目下

安装项目所需依赖,并运行 main.py

如果使用本地IDE开发,可以自行安装 requirements.txt 中的依赖,运行 main.py 即可

5.提交训练到GPU

项目中如有新的引用,需加入到 requirements.txt 文件中

在终端下执行

flyai.exe train

返回sucess状态,代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

完整训练设置执行代码示例:

flyai.exe train -b=32 -e=100

通过执行训练命令,本次训练循环 100 次,每次训练读取的数据量为 32 。

1. 下载项目并解压
2. 使用终端进入到项目的根目录下

cd /path/to/project

Mac和Linux用户使用 ./flyai 脚本文件

3. 初始化环境并登录

授权flyai脚本

chmod +x ./flyai

4. 本地开发调试

执行下列命令本地安装环境并调试(第一次使用需要使用微信扫码登录)

./flyai test 注意:命令前面不要加sudo

执行test命令,会自动下载100条测试数据到项目下

安装项目所需依赖,并运行 main.py

如果使用本地IDE开发,可以自行安装 requirements.txt 中的依赖,运行 main.py 即可

5.提交训练到GPU

项目中如有新的引用,需加入到 requirements.txt 文件中

在终端下执行

./flyai train 注意:命令前面不要加sudo

返回sucess状态,代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

完整训练设置执行代码示例:

./flyai train -b=32 -e=100

通过执行训练命令,本次训练循环 100 次,每次训练读取的数据量为 32 。

$vue{ errorTip }

发送样例至我的邮箱

已发送

已发送成功

请查收FlyAI官方邮件查看详情 根据样例提高算法评分可以获得积分奖励 用来兑换GPU训练时长

确定

$vue{flag?'报名成功!':'参赛温馨提示'}

通过迭代赛题的样例代码提高模型准确率哦~
准确率越高,奖励越丰富!

查看样例代码

⼤神你好!当前能⼒值⽆法参加新⼿手赛

多给新手一些机会哦~

查看样例代码

打开微信,使用扫一扫功能分享给好友

绑定你的微信账号

用于本地环境登录和实时接收训练通知