智源-知乎联合发布大规模用户关系数据集,同步开启10万元竞赛
比赛平台地址:
▶▷ 文本数据
文本数据主要包括知乎话题、问题,以及回答的文本数据。这些数据通过两种方式加密:
1)单字,以 64 维 embedding 的表示。单字包括单个汉字、中韩文字、英文字母、标点及空格等;词语包含切词后的中文词语、英文单词、标点及空格等。
2)词语,以 64 维 embedding 的表示。提醒:单字 ID 和词语 ID 存在于两个不同的命名空间,即词语中某个字或标点,和单字中的相同字符及相同标点不一定有同一个 ID。
▷▶ 问题数据(183万)
问题数据除了上述提到的问题标题和描述的单字编码、切词编码,绑定话题外,还包括提问时间和提问者 ID。
▷▶ 回答数据(475万)
回答数据包括:回复的问题 ID,回答创建时间;是否包括图片、视频,以及答案长度;回答内容的单字编码序列和切词编码序列;回答是否被标为优秀、推荐、被收入圆桌,以及回答的点赞数、评论数、被收藏数、感谢数、被举报数、反对数等。
▶▷ 任务描述
评测要求选手根据提供的数据集和 1000 万条带标签的邀请数据,预测验证集中用户是否会接受某个新问题的邀请。
?
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。
▽ 点击 | 阅读原文 | 报名参赛
智源-知乎联合发布大规模用户关系数据集,同步开启10万元竞赛相关推荐
- 一篇文章回顾智源悟道 1.0 发布全程
北京卫视新闻频道,对智源"悟道1.0"发布进行报道 3月20日,北京智源人工智能研究院发布"悟道1.0",这是我国首个超大规模智能模型系统! "悟道1 ...
- 智源神经元识别挑战赛发布:收获不只是10万元奖金
U-RISC:Ultra-high Resolution EM Images Segmentation Challenge 2019 年 10 月,北京智源人工智能研究院联合北京大学,共同发布了超高清 ...
- 交互式多模型_26亿参数,智源、清华开源中文大规模预训练模型
近日,北京智源人工智能研究院和清华大学研究团队联合发布了以中文为核心的大规模预训练语言模型 CPM-LM,参数规模达 26 亿,预训练中文数据规模 100 GB. 26亿参数,智源.清华开源中文大规模 ...
- 计算机十大算法应用 知乎,2019 智源·知乎看山杯算法大赛收官:7 支团队脱颖而出,单人队荣摘桂冠!...
雷锋网 AI 开发者按:1 月 10 日,北京智源人工智能研究院联合知乎.数据评测平台 biendata 举办的「2019 智源·知乎看山杯专家发现算法大赛」正式收官. 大赛颁奖仪式暨算法交流会在清华 ...
- AI:2020年6月24日北京智源大会演讲分享之机器学习前沿青年科学家专题论坛——10:40-11:10金驰《Near-Optimal Reinforcement Learning with Sel》
AI:2020年6月24日北京智源大会演讲分享之机器学习前沿青年科学家专题论坛--10:40-11:10金驰<Near-Optimal Reinforcement Learning with S ...
- AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—13:30-14:10山世光教授《从看脸到读心:基于视觉的情感感知技术》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛-13:30-14:10山世光教授<从看脸到读心:基于视觉的情感感知技术> 导读:首先感谢北京智源大会进行主题演讲的各领域顶 ...
- AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—15:30-16:10孙富春教授《机器人视触觉传感器与主动感知》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛-15:30-16:10孙富春教授<机器人视触觉传感器与主动感知> 导读:首先感谢北京智源大会进行主题演讲的各领域顶级教授, ...
- 63万张!旷视发布最大物体检测数据集Objects365,物体检测竞赛登陆CVPR
郭一璞 发自 北京会议中心 量子位 报道 | 公众号 QbitAI 比ImageNet大的图像数据集来了. 在4月16日的智源学者计划启动暨联合实验室发布会上,旷视科技发布了通用物体检测数据集Obj ...
- 2021智源大会AI TIME|大规模预训练模型离通用人工智能还有多远?
点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 6月1日,人工智能领域内行盛会"北京智源大会"如约而至.当天上午,北京市副市长靳伟.科技部战略规划司司长许倞出席并致 ...
最新文章
- 强大的矩阵奇异值分解(SVD)和特征值及其应用
- Gartner发布2021年重要战略科技趋势!
- Python进阶8——字典与散列表,字符串编解码
- Dapper+SqlServerCe部署
- 倒计时 2 天 | 神策 2019 数据驱动大会即将开幕
- SpringCloud 教程 | 第一篇: 服务的注册与发现(Eureka)
- vc 查看硬盘盘符剩余空间
- 软件项目管理相关概念介绍笔记
- mysql 函数重载_[赋值]函数,变量,重载 ,_第1页_169IT
- Taro+react开发(80):状态改变的构造函数
- Linux(17)-Make编译,Configure
- 吐血解决python中文写入文件问题
- 【MySQL】MySQL show index 索引信息
- win11如何设置始终以管理员身份运行 windows11设置始终以管理员身份运行的方法步骤
- C#中winform怎么在线预览PDF,预览网上的PDF控件!不用安装Adobe PDF Reader等等其他,方案记录
- Linux环境安装ghostscript
- androidStudio连接不上模拟器(夜神模拟器)
- Vmware Workstation 无法连接到虚拟机,请确保您有权运行该程序。
- ensp 移动主机搜索不到AP信道_案例WiFi信道上的一个坑
- Unity遮罩 反向遮罩实现
热门文章
- 链表有环是什么意思_互联网大厂offer收割之单向链表的概念及面试题大全
- Servlet线程安全
- html标签处理数据时合并空格
- http://www.cnblogs.com/Bear-Study-Hard/archive/2008/03/26/1123267.html
- mysql 用户命令_MySQL命令行新建用户
- python查询mysql表名字动态日期_Python之路day11作业-MySQL表查询
- python怎么创建方法_python中的__new__方法
- php json与接口的使用,api接口与json
- java 映射类_将数据库类型映射到具体的Java类
- wsl ubuntu 版本_让Ubuntu滚动更新