2018科大讯飞AI营销算法比赛笔记
题目背景:
本次大赛提供了讯飞AI营销云的海量广告投放数据,参赛选手通过人工智能技术构建预测模型预估用户的广告点击概率,即给定广告点击相关的广告、媒体、用户、上下文内容等信息的条件下预测广告点击概率。官方赛事链接
参考链接一、参考链接二、参考链接三
任务
讯飞AI营销广告点击率预估,预测广告被点击的概率。
数据
*注 :报名参赛或加入队伍后,可获取数据下载权限。
提供下载的数据集包括两个部分:
初赛:
1. round1_iflyad_train.txt 训练集,每一行数据为一个样本,可分为5类数据,包含基础广告投放数据、广告素材信息、媒体信息、用户信息和上下文信息,共1001650条数据。其中‘click’字段为要预测的标签,其它34个字段为特征字段。 2. round1_iflyad_test_feature.txt 测试集,共40024条数据,与训练集文件相比,测试集文件无‘click’字段,其它字段同训练集。
复赛:
1. round2_iflyad_train.txt 训练集,每一行数据为一个样本,可分为5类数据,包含基础广告投放数据、广告素材信息、媒体信息、用户信息和上下文信息,共1998350条数据。其中‘click’字段为要预测的标签,其它34个字段为特征字段。 2.round2_iflyad_test_feature.txt 测试集,共80276条数据,与训练集文件相比,测试集文件无‘click’字段,其它字段同训练集。
出于数据安全保证的考虑,所有数据均为脱敏处理后的数据。数据集提供了若干天的样本,最后一天数据构成了测试集,其余日期的数据作为训练数据。
注意:此次比赛分为初赛和复赛两个阶段,两个阶段的区别是所提供样本的量级有所不同,其他的设置均相同。
参考链接
基本数据
字段 | 解释 |
---|---|
instance_id | 样本id |
click | 是否点击 |
广告信息
字段 | 解释 |
---|---|
adid | 广告id |
advert_id | 广告主id |
orderid | 订单id |
advert_industry_inner | 广告主行业 |
advert_name | 广告主名称 |
campaign_id | 活动id |
creative_id | 创意id |
creative_type | 创意类型 |
creative_tp_dnf | 样式定向id |
creative_has_deeplink | 响应素材是否有deeplink(Boolean) |
creative_is_jump | 是否是落页跳转(Boolean) |
creative_is_download | 是否是落页下载(Boolean) |
creative_is_js | 是否是js素材(Boolean) |
creative_is_voicead | 是否是语音广告(Boolean) |
creative_width | 创意宽 |
creative_height | 创意高 |
媒体信息
字段 | 解释 |
---|---|
app_cate_id | app分类 |
f_channel | 一级频道 |
app_id | 媒体id |
inner_slot_id | 媒体广告位 |
app_paid | app是否付费 |
用户信息
字段 | 解释 |
---|---|
user_tags | 用户标签信息,以逗号分隔 |
上下文信息
字段 | 解释 |
---|---|
city | 城市 |
carrier | 运营商 |
time | 时间戳 |
province | 省份 |
nnt | 联网类型 |
devtype | 设备类型 |
os_name | 操作系统名称 |
osv | 操作系统版本 |
os | 操作系统 |
make | 品牌(例如:apple) |
model | 机型(例如:"iphone") |
2018科大讯飞AI营销算法比赛笔记相关推荐
- 赛后复盘 - DataCastle 科大讯飞AI营销算法大赛
最近这个月参加了DataCastle上的科大讯飞AI营销算法大赛,最后的名次是97 / 1086,没能进入复赛(要求前50名).其实也没什么好失落的,已经尽力了,这就是我现阶段的真实水平.最大的遗憾, ...
- 竞赛|数据竞赛Top解决方案开源整理-科大讯飞AI营销算法、阿里妈妈搜索广告、腾讯广告算法、搜狗的用户画像
https://mp.weixin.qq.com/s/_4QG0dWhh784lF0n1wymcw
- 科大讯飞AI营销云广告投放数据分析报告【实战总结】
4月份项目实战的总结,前后进行了约20多天. 花了大量时间在清洗数据,虽然耗时但是觉得过程中很享受,喜欢"静静地泡在里面"的感觉. 另外,了解了涉及到的广告投放.业务指标体系.手机 ...
- 科大讯飞AI营销大赛 CTR预估总结
背景介绍: 科大讯飞AI营销云在高速发展的同时,积累了海量的广告数据和用户数据,如何有效利用这些数据去预测用户的广告点击概率,是大数据应用在精准营销中的关键问题,也是所有智能营销平台必须具备的核心技术 ...
- 合肥科大讯飞-AI研究算法工程师(视觉感知) 招聘贴
AI研究算法工程师(视觉感知)方向:机器人 岗位职责: 负责扫地机器人业务中的感知算法研究: 任职资格: 1.硕士及以上学历,计算机.信号处理.自动化.应用数学等相关专业.具备丰富数理统计,模式识别. ...
- AI:2020 科大讯飞AI开发者大赛,总奖金池180+万元!拿下比赛,大厂offer到手,那么,你还在等什么?
AI:2020 科大讯飞AI开发者大赛,iFLYTEK热浪来袭,总奖金池180+万元!拿下比赛,大厂offer到手,那么,你还在等什么? 导读:总奖金池180+万元,除此外,还有绿色就业通道& ...
- AI公开课:19.04.24刘聪-科大讯飞AI副院长《人工智能的“顶天立地”之路》课堂笔记以及个人感悟
AI公开课:19.04.24刘聪-科大讯飞AI副院长<人工智能的"顶天立地"之路>课堂笔记以及个人感悟 导读 刘聪,2001年进入中国科学技术大学,攻读电 ...
- 科大讯飞 ai算法挑战赛_为井字游戏挑战构建AI算法
科大讯飞 ai算法挑战赛 by Ben Carp 通过本·卡尔普 为井字游戏挑战构建AI算法 (Building an AI algorithm for the Tic-Tac-Toe challen ...
- Ai关于目标检测类算法比赛的经验总结
内容来源于 宅码,作者Ai. 附一张作者签名--艾宏峰! 导读: 本文为作者自己参加的三个目标检测类算法比赛的经验总结,分为五个部分:数据研究和准备.参数调节.模型验证以及模型融合,作者还给出了一些关 ...
最新文章
- 深度学习(4)基础4 -- 神经网络架构激活函数过拟合处理
- 浅谈网络游戏的设计——服务器端编程 (3)
- jquery实现抽奖系统
- mysql 8安装_mysql安装过程详解
- 系统页面升级系统中_国产系统哪家强?华为EMUI系统大升级,拿下最强指日可待...
- 产品认知:说说产品经理的底层思维——用户思维
- 2053. 数组中第 K 个独一无二的字符串
- java 判断子类_java判断class是否是某个类的子类或父类
- openshift 3 mysql_最新OpenShift免费空间申请与使用教程-1G内存1G空间支持PHP和MysqL
- verdi中波形怎么看间距_小间距led显示屏金线封装真伪怎么看?
- docker下centos7 systemctl启动报错 docker Failed to get D-Bus connection 报错
- 基于深度学习的番茄叶部病害识别模型
- Nginx代理服务器使用
- Atitit Atitit 客户常见技术问题的解答.docx
- 单片机开发,stm32开发,串口下载软件,flymcu
- 关于 USB 3.0/3.1 线序定义
- HashMap底层原理实现
- 三菱PLC与两台变频器通讯控制 三菱PLC通过MODBUS控制两台士林变频器程序,PLC可以用3U或者3G,
- 李航统计学习方法课件 ---由清华大学深圳研究院袁春教授制作
- 西方文化系列讲座之希腊文化(下)
热门文章
- 实现labelme批量json_to_dataset方法(anaconda)
- 异贝,通过移动互联网技术,为中小微实体企业联盟、线上链接、线上线下自定义营销方案推送。案例55
- Excel VBA:填充——FillDown方法
- 微信聊天服务器端口号怎么查,如何查看服务的端口号
- 英国名校TOP10对Alevel成绩要求汇总
- 微信企业邮箱登陆入口在哪?企业邮箱忘记密码怎么修改?
- matlab数值微分与数值积分
- 域服务器用户一直被锁,Windows Server 2019 域用户账户锁定策略
- 计算机网络上传慢,电脑上传速度慢的正确处理方法
- 搜狗有一个超良心的功能 Ctrl+shift+E