4月份项目实战的总结,前后进行了约20多天。

花了大量时间在清洗数据,虽然耗时但是觉得过程中很享受,喜欢“静静地泡在里面”的感觉。

另外,了解了涉及到的广告投放、业务指标体系、手机设备版本及API等相关知识,有趣!

感受:分析问题的思路 比 代码的实现更为重要

项目背景:2018科大讯飞AI营销算法大赛,点击去官网

数据集:选用训练集数据round1_iflyad_train.txt ,每一行数据为一个样本,分为5类数据,包含基础广告投放数据、广告素材信息、媒体信息、用户信息和上下文信息,共1001650条数据。数据经过脱敏处理。

语言:Python+panda、numpy、re、seaborn、matplotlib等第三方类库

完成:

  • 无效数据的删选和过滤,比如NaN,unkown等缺失值
  • 缺失值的填补:比如设备品牌make大量缺失值,可以用型号model中含有的品牌信息进行补充,效果非常明显
  • 使用正则表达式re库匹配数据,比如各类设备品牌的清洗,比如将iphone,ipad,apple,ios等统一为apple;对操作系统版本型号的提取
  • 使用pandas,numpy完成数据的去重、排序、统计计算等,对能进行groupby分组操作的特征进行了汇总统计
  • 特征提取:如对城市省份代码进行切割提取特征值,对时间维度进行weekday,hour,segment时段的不同角度的分析,在一定程度上增加信息量
  • 数据可视化:使用matplotlib、seaborn库完成图形可视化
  • 完成数据分析报告

说明

  • 具体维度的代码实现中,学习到了很多小技能,后续将整理代码陆续上传
  • 为了ppt呈现的效果,没有采用pyhton生成的图形,后续做了一版excel版本的图表放入ppt
  • 数据经过脱敏处理,数据报告中出现不少数字代码,比如“71”省份,请直接理解为某省份。也正是因为数据脱敏,所以分析更偏向数据,无法对应到业务进行阐述
  • 后续代码整理过程中,会进一步完善目前的分析结果

数分报告概图:

科大讯飞AI营销云广告投放数据分析报告【实战总结】相关推荐

  1. 科大讯飞AI营销大赛 CTR预估总结

    背景介绍: 科大讯飞AI营销云在高速发展的同时,积累了海量的广告数据和用户数据,如何有效利用这些数据去预测用户的广告点击概率,是大数据应用在精准营销中的关键问题,也是所有智能营销平台必须具备的核心技术 ...

  2. 赛后复盘 - DataCastle 科大讯飞AI营销算法大赛

    最近这个月参加了DataCastle上的科大讯飞AI营销算法大赛,最后的名次是97 / 1086,没能进入复赛(要求前50名).其实也没什么好失落的,已经尽力了,这就是我现阶段的真实水平.最大的遗憾, ...

  3. 2018科大讯飞AI营销算法比赛笔记

    题目背景: 本次大赛提供了讯飞AI营销云的海量广告投放数据,参赛选手通过人工智能技术构建预测模型预估用户的广告点击概率,即给定广告点击相关的广告.媒体.用户.上下文内容等信息的条件下预测广告点击概率. ...

  4. 用AI实现智能化广告投放:探讨智能广告投放技术和实时广告投放

    作者:禅与计算机程序设计艺术 在互联网技术飞速发展的今天,每天都有成千上万的人在网上进行各种各样的活动,例如购物.阅读.观看视频等.为了让用户更加高效地获取信息,广告也逐渐成为互联网领域中重要的收入来 ...

  5. 竞赛|数据竞赛Top解决方案开源整理-科大讯飞AI营销算法、阿里妈妈搜索广告、腾讯广告算法、搜狗的用户画像

    https://mp.weixin.qq.com/s/_4QG0dWhh784lF0n1wymcw

  6. SEM推广及广告投放数据分析及可视化

    网络推广对于一个企业或者产品来说重要程度不容小觑,在互联网时代用户们获取信息的途径也是多种多样,其中大部分人依赖于搜索引擎给出的结果.很多企业意识到这点后开始了花费金钱着手于此,竞价推广也随之兴起. ...

  7. 移动端的角度浅谈数据分析报告

    麦肯锡给大数据定义: "一种规模大到在获取.存储.管理.分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模.快速的数据流转.多样的数据类型和价值密度低四大特征.&qu ...

  8. 数据分析报告怎么用?

    本文是作者基于自身多年数据分析的经验,总结的一体化数据分析框架,简单地介绍下数据分析能分析能落地的几点.enjoy~ 大数据,这个被炒烂了的概念,现如今已被人工智能替代.我们先不讨论人工智能,就大数据 ...

  9. 神策广告投放(用户行为)分析经验总结

    神策广告投放(用户行为)分析 为什么要进行用户行为分析(用户运营) ​ 注意:神策的数据结构是user event(用户事件结构),该结构的核心点就是event(用户行为事件),神策都是以用户触发某个 ...

最新文章

  1. java如何实现redis分片存储_面试官:你说一下Redis吧,怎么实现高可用,还有持久化怎么做的?...
  2. 数字孪生技术从概念走向实际应用
  3. qt linux 串口eventdriven,详解 Qt 串口通信程序全程图文 (1)
  4. 对于一个采用字符数组存放的字符串str,设计一个递归算法StrLength(char *str)求其字符个数(长度)。递归求字符串长度
  5. ubuntu dhcp ping 不通 自己_??2、DHCP安装和配置
  6. Xml之Linq遍历
  7. 【Codeforces gym 102388】SUFE ICPC Team Formation Test,签到题BDG
  8. Unity学习日志_NGUI简介
  9. 迎接专业音频世界的AoIP时代
  10. 找回 Windows 11 丢失的扫雷游戏【新春快乐】
  11. Windows安全中心无反应,导致关闭不了病毒防护
  12. 帕累托分布(Pareto distributions)、马太效应
  13. 『杭电1166』敌兵布阵
  14. 12.2版本数据库ORA-20001: Statistics Advisor: Invalid task name for the current user
  15. 火狐Firefox安装屏蔽广告插件ublock origin方法
  16. 2016英语三级分数计算机,公共英语三级考试分数权重计算方法
  17. Word2vec与LDA的聚类区别
  18. JOJ 2453 Candy
  19. 存储模型之虚拟存储技术
  20. JavaScript逆向实战:admin加密成WaQ7xbhc9TefbwK是什么加密算法?逆向思维考验、详细流程图解

热门文章

  1. Python视觉深度学习系列教程 第二卷 第10章 GoogLeNet
  2. UNITY OCULUS QUEST开发入门教程 1 - 准备篇
  3. 反对996,吐槽996,但出路在哪里?
  4. 三十岁了,还是身无分文,一事成无该怎么补救?
  5. 基于Vue,Vue-router,Vuex的简书网站模仿
  6. Dual attention network for scene segmentation
  7. 数据完整性和Oracle的约束
  8. [ SharePoint ADFS 开发部署系列 (一)]
  9. 1.4 计算机专业高级教程(计算机安全防护知识)
  10. 程序设计算法竞赛基础——练习2解题报告