1.比赛调研

1.1 比赛链接

Feedback Prize - Predicting Effective Arguments | Kaggle

1.2 比赛周期

5.24-8.23

1.3 比赛的快速介绍

本次比赛的目标是将学生写作中的争论元素分类为“有效”、“充分”或“无效”。您将创建一个使用代表美国 6 至 12 年级人口的数据进行训练的模型,以尽量减少偏差。来自本次比赛的模型将有助于为学生获得关于他们的议论文的更多反馈铺平道路。借助自动指导,学生可以完成更多作业,最终成为更自信、更熟练的作家。

总结,是一个nlp的分类任务,需要对议论文(essay)里面的话语元素(disclouse)进行分类,总共有3类,有效,充分或者无效。话语元素是议论文里面的一段话,到时候分类可以直接根据话语元素进行分类,也可以增加议论文的内容进行分类。

1.4 数据描述

Feedback Prize - Predicting Effective Arguments | KaggleRate the effectiveness of argumentative writing elements from students grade 6-12https://www.kaggle.com/competitions/feedback-prize-effectiveness/data

数据主要包括了train.csv, test.csv, sample_subimssion.csv以及train和test两个文件夹

train和test两个文件夹

主要是存放话语元素对应的议论文,可以看成一个话语元素的上下文

train.csv

discouse_id: 话语元素id

essay_id: 议论文id

discourse_text: 话语元素的文本

discourse_type: 话语元素的类型,总共有7种,Lead引言,Postion问题的观点或者结论,Claim 断言, CouterClaim反诉,Rebuttal反驳,Evidence证据,Concluding Statement结论。

discourse_effective: 话语元素有效性,总共有三类: Ineffective (无效), Adequate(充分), Effective(有效).

test.csv

和训练集差不多,但少了discourse_effective,这是我们需要进行预测的

sample_submission.csv

discourse_id: 议论文id

Ineffective: 无效性的概率

Adequate:充分性的概率

Effective: 有效性的概率

到时候会根据这三个概率值与真实值计算交叉熵损失,分数越小排名越高

1.5 比赛思路

把话语元素的文本以及议论文作为输入,到一些sota模型里面包括deberta v3等进行训练,然后进行模型融合,得到最后的输出。

Feedback Prize-Kaggle比赛调研相关推荐

  1. 2022-kaggle-nlp赛事:Feedback Prize - English Language Learning

    文章目录 零.比赛介绍 0.1 比赛目标 0.2 数据集 0.3 注意事项 一.设置 1.1 导入相关库 1.2 设置超参数和随机种子 1.3 启动wandb 二. 数据预处理 2.1 定义前处理函数 ...

  2. 第四期 | 带学斯坦福CS224n自然语言处理课+带打全球Kaggle比赛(文末重金招募老师!)...

    在未来五年,你认为人工智能领域最具有商业价值的方向是什么? 上个月我和一个算法工程师朋友聊了聊,询问算法岗的行业薪资,他说现在计算机视觉算法岗工程师年薪大约50万左右,正当我感叹如今计算机视觉的火爆时 ...

  3. Kaggle比赛心得

    正文共5453个字,5张图,预计阅读时间14分钟. 最近参加了两场Kaggle比赛,收获颇多,一直想写篇文章总结一下.接触Kaggle到现在不到一年,比赛成绩一个银牌(5%)一个铜牌(9%),勉强算入 ...

  4. 广告行业中那些趣事系列51:超牛的kaggle比赛Favorita Grocery Sales Forecasting冠军方案...

    导读:本文是"数据拾光者"专栏的第五十一篇文章,这个系列将介绍在广告行业中自然语言处理和推荐系统实践.本篇分享了kaggle比赛<Corporación Favorita G ...

  5. Kaggle比赛模型融合方法

    介绍 集成模型是一种能在各种的机器学习任务上提高准确率的强有力技术.在这篇文章中,我会分享我在Kaggle比赛中的集成方法. 在第一部分中,我们会讨论从提交文件中建立集成.主要包括: 投票集成 平均 ...

  6. kaggle比赛集成指南

    转自 介绍 集成模型是一种能在各种的机器学习任务上提高准确率的强有力技术.在这篇文章中,我会分享我在Kaggle比赛中的集成方法. 在第一部分中,我们会讨论从提交文件中建立集成.主要包括: 投票集成 ...

  7. 竞赛老陪跑怎么办?来自一位Kaggle比赛失败者的含泪总结

    大数据文摘出品 来源:medium 编译:zeroInfinity.笪洁琼 Kaggle比赛应该是数据竞赛中公认含金量最高的那个.每场比赛,参加的队伍至少上千人,也并非每次都次都能脱引而出,一不小心就 ...

  8. 在参加了39场Kaggle比赛之后,有人总结了一份图像分割炼丹的「奇技淫巧」

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转载自:机器之心 一个经历了 39 场 Kaggle 比赛的团队 ...

  9. 通俗理解kaggle比赛大杀器xgboost + XGBOOST手算内容 转

    通俗理解kaggle比赛大杀器xgboost    转 https://blog.csdn.net/v_JULY_v/article/details/81410574 XGBOOST有手算内容 htt ...

最新文章

  1. mybatis动态sql中where标签的使用
  2. Python执行系统命令的四种方法
  3. 关闭sql执行功能及找回08CMS系统管理员密码
  4. dotnet core 数据库
  5. 联想EDU同传系统 版本7.5 7.6在机房中出现的一些故障和解决办法
  6. Android之个性化ListView实现
  7. [深度学习]人脸检测-Tensorflow2.x keras代码实现
  8. 用与非门设计血型配对电路_利用与非门CD4011做一个防盗报警器,那些高大上就这么简单...
  9. Uber发布史上最简单的深度学习框架Ludwig!不懂编程也能玩转人工智能
  10. Oracle 11g r2 下载地址
  11. poj -- 1042 Gone Fishing(枚举+贪心)
  12. ssd网络结构简单说明
  13. mysql backtrace_是什么导致Linux 64位上的backtrace()崩溃(SIGSEGV)
  14. 5G明确C波段频率使用规划的5层意义
  15. WTD实验(lv9-day15)
  16. Mockoon代理模式
  17. mysql wait for_mysql定时执行及延时执行,实现类似sql server waitfor功能
  18. 力士乐触摸屏维修VCP20.2DUN-003-PB-NN-PW
  19. Shiro RememberMe 反序列化漏洞
  20. PHP 制作微信小程序API 简例

热门文章

  1. 网络设备互联技术· 『1』
  2. 语音识别公司排名YQ5969智能语音识别模块的快速崛起
  3. Spring事务管理(应对面试)
  4. 拿到域管权限后的域内网络拓扑
  5. linux用户、组的创建
  6. 给大家介绍一下地推的认知
  7. mac上Apk反编译工具合集整理与资源
  8. Linux和Windows误删文件恢复办法
  9. 移动照片社交应用成美网络新宠
  10. 简单示例mock的使用 (Junit结合Jmock)