分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow

也欢迎大家转载本篇文章。分享知识,造福人民,实现我们中华民族伟大复兴!

竞赛介绍:链接

这篇文章记录2015阿里天池大数据竞赛中,我的一些代码,由于目前还在比赛中,仅分享一个naive solution,基于规则,代码主页在我的github上:链接,下面是代码说明。有兴趣的请看代码注释,恕不详述。

本repo目录说明

  • data  存放数据
  • preprocess    数据预处理
  • rule   根据规则生成提交文件
  • model   训练机器学习模型(暂时不分享)

代码使用说明

  • fork本repo,非Github用户请点右下角的Downlown ZIP

  • 解压后,将tianchi_mobile_recommend_train_user.csv以及tianchi_mobile_recommend_train_item.csv放入/data/目录下

  • 仅需两个步骤即可获得一份提交文件,F1可达到7.6%

    • 第一步,进入/preprocess/目录,运行data_preprocess.py
    • 第二步,进入/rule/目录,运行gen_submission_by_rule.py
  • 完成上面两个步骤后,在/rule/目录下会生成一份tianchi_mobile_recommendation_predict.csv文件,提交它。

补充说明

  • 纯Python,无任何依赖项。

  • 关于代码实现的功能,在每份代码文件中均有注释,代码可能写得比较乱,也可能有bug,欢迎issues。

  • 如果你想获得更高的F1值,修改gen_submission_by_rule.py这份文件,加入一些规则,F1可以达到9%以上

  • 建议在Linux下运行;在我的PC上(8核),上面两个步骤总共花了不到20分钟。

  • 请在规则的基础上,做特征工程,训练模型,这才是参赛目的。

  • 进入第二赛季后,请删了这些代码,不适合处理大数据。

给我老师的人工智能教程打call!http://blog.csdn.net/jiangjunshow

2015阿里天池大数据竞赛-Solution相关推荐

  1. 阿里天池大数据竞赛——口碑商家客流量预测 A2

    阿里天池大赛koubeiyuce1 2017年二月份,天池大数据比赛,口碑商家客流量预测,参赛地址及详情: https://tianchi.shuju.aliyun.com/competition/i ...

  2. 阿里天池大数据竞赛(一)用ODPS提取特征

    //2015年4月30日 提取特征之所以难,是因为我们写出的sql语句往往只能提取一个特征. 而在ODPS上却不一样,一条语句可以提取很多特征. 如提取最近1.2.3.4天四种行为的数量 重点是dec ...

  3. 9个比赛7进top10,阿里天池大数据竞赛思路分享

    向AI转型的程序员都关注了这个号

  4. 阿里天池大数据竞赛第一名,如何用AI检测肺癌

    向AI转型的程序员都关注了这个号

  5. 阿里巴巴天池大数据竞赛黄金联赛全面开战,全球同步报名,只为寻找最聪明的你!...

    阿里巴巴天池大数据竞赛黄金联赛全面开战,全球同步报名,只为寻找最聪明的你!          天池大数据竞赛是由阿里巴巴集团主办,面向全球新生代力量的高端算法竞赛.通过开放海量数据和"天池& ...

  6. AI比赛-NER:“万创杯”中医药天池大数据竞赛——中药说明书实体识别挑战

    大赛概况 疫情催化下,人工智能正在持续助力中医药传承创新加速发展,其中中医用药知识体系沉淀挖掘是一个基础工作.通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础.挑战旨在通过抽 ...

  7. 【TIANCHI】天池大数据竞赛(学习赛)--- 淘宝用户购物行为数据可视化分析

    目录 前言 一.数据集的来源和各个字段的意义 二.数据分析 1.引入库 2.读入数据 3.查看数据数量级 4.PV(Page View)/UV访问量 5.漏斗模型 6.用户购买商品的频次分析. 7.A ...

  8. 天池大数据竞赛第一名,上海交通大学人工智能实验室如何用AI定位肺结节

    癌症,犹如黑暗中的魔鬼,带给人们恐惧与绝望.而肺癌,在我国作为发病率.死亡率最高的一类癌症,伤害着无数家庭.在我国每年都有近60万人死于肺癌.然而,癌症的死亡率与首次发现癌症的时期紧密相关,早期肺结节 ...

  9. 阿里天池大数据之移动推荐算法大赛总结及代码全公布

    移动推荐算法比赛已经结束了一个多星期了,现在写一篇文章来回顾一下自己的参赛历程. 首先,对不了解这个比赛的同学们介绍一下这个比赛(引用自官网): 赛题简介 2014年是阿里巴巴集团移动电商业务快速发展 ...

  10. 利用hive完成阿里天池大数据音乐预测比赛数据处理工作

    hive shell 创建外表,指定目录 CREATE EXTERNAL TABLE IF NOT EXISTS songs2 ( sid string, aid string, ptime stri ...

最新文章

  1. R 循环中将变量作为对象名
  2. my02_Atlas mysql5.7安装配置
  3. 状态模式 设计模式_设计模式:状态
  4. QPW 企业维度评分表(tf_company_dimesion)
  5. leetcode1233. 删除子文件夹
  6. ubuntu进行apt-get时候出现Package ssh is not available, but is referred to by another package 错误...
  7. oracel动态sql实例
  8. 基于 MongoDB 动态字段设计的探索 (二) 聚合操作
  9. python数据归一化代码_Python 数据归一化/标准化
  10. docker-compose.yml(2)
  11. 背景建模算法比较与ViBe算法论文解读与python代码
  12. cobar mysql 性能_Cobar
  13. c#绝对值函数图像_C# 中如何取绝对值函数
  14. 苹果计算机音频无法使用,苹果电脑没声音了怎么回事
  15. SQL自动审核工具archer
  16. python提升算法3_XGBOOST_docs_Scikit-LearnAPI_XGBClassifier_train参数01
  17. JavaScript根据用户输入动态计算周数
  18. 实习每日总结_20161219
  19. 戴尔游匣 G15 2022 高配版参数配置
  20. L1正则化和L2正则化(从解空间角度)

热门文章

  1. PowerDesigner 下载安装
  2. 每天10道Crypto Day3
  3. 一个骨灰级塞班开发者的自白
  4. 影响力最大化——CELF算法的简介与python实现
  5. java计算机毕业设计小小银动漫网站源代码+数据库+系统+lw文档
  6. 浅谈Foxmail邮件迁移
  7. (转载)奇谈怪论:从容器想到去IOE、去库存和独角兽
  8. 整洁代码--写好注释
  9. 全能模拟器retroarch+android,全能模拟器 RetroArch Android
  10. 学习基于springboot的java分布式中间件-Redis(3) redis之缓存穿透等典型问题