https://www.toutiao.com/a6641920612455416334/

2019-01-02 23:24:11

原创: Frank 机器学习blog 2017-02-26

目前,在线展示广告越来越流行。在线展示广告的目的是获取更多的潜在客户,吸引客户购买商品。在线展示广告的一个基本要求就是通过广告获取用户所需费用要小于用户购买商品所耗费用,进而使得通过广告吸引来的客户为企业带来利润。

在线展示广告中,比较流行的方式是通过手工精心设计更吸引人的广告,来招揽客户。然而,这种方法具有其局限性,并不是所有用户的兴趣点都一致,由于这种方式没有个性化特征,所带来的效果并没有特别显著。既然人工方式带来的效果不显著,那么可以考虑利用机器学习自动挖掘其中的潜在特性,进而带来更好的效果。

什么是机器学习呢?机器学习即为利用算法自动发现人们自己不能发现的潜在特征,或者隐藏的一些规律。机器学习已经在很多领域取得了显著的效果,如图像识别,语音识别,自然语言处理等。

如何在市场营销中利用机器学习呢?首先需要找出相关的特征。在机器学习中,一般用一行表示一个样本,每个列是一个相关的特征。针对不同的应用场景,需要找出不同的特征。本文以客户流失预测为例,客户流失预测相关的特征大致有距离上次登录时间,下单数,消费总金额,评论数等等。

其次要确定目标变量。每个样本都对应一个目标变量,比如在客户流失场景中,可以用0和1来标识某个用户是否流失。

确定了特征和目标变量,就要收集相关数据。为收集相关数据,需要找到相关的数据库以及相关的表格中相应的列或者其他存储方式的原始数据。在这个步骤中,可以得到一张集成的表格,其中包含了相关特征和目标变量。每一行对应一个样本。

收集完数据,接下来要选择恰当的机器学习算法来解决客户流失预测问题。由于预测客户流失本质上是一个二分类问题,可以选择的算法主要有logistic regression(逻辑回归), decision tree(决策树),neural network(神经网络), support vector machine(支持向量机)等等。 现实问题中,通常数据比算法更重要,解决问题的算法有很多,只要收集的数据质量比较好,那么利用恰当的算法往往比复杂算法用于质量比较差的数据时取得的效果更好。简而言之,通常情况下数据比算法要重要。

logistic regresion 示意图

decision tree 示意图

neural network 示意图

support vector machine 示意图

选择了恰当的算法,就要对原始数据进行分割,分割成训练集和测试集。如此分割,是为了方便查看在训练集上训练所得模型是否在测试集中可以取得理想的效果。通常分割比例为6:4或者7:3。前者为训练集占比,后者为测试集占比。训练集用来训练算法,学习其中的参数,测试集用来查看或检验所选算法在测试集上的效果。

将原始数据分成训练集和测试集之后,就可以运行算法了。当前比较流行的机器学习算法都集成到了包里,用户可以利用R或者Python来运行相关算法。目前,数据科学(data science)领域比较流行的运行机器学习算法的两种语言就是R和Python。

运行完算法,需要衡量算法效果。通常可以利用准确率,召回率,F1 score 以及AUC (Area under ROC)。准确率即为预测成流失的样本中真实流失样本占比,召回率即为原本即为流失样本且预测成流失样本的样本在真实流失样本中的占比。F1 score 是准确率以及召回率的调和平均。AUC是ROC(receiver operating characteristic)曲线下的面积,其中ROC是曲线,横坐标是FPR(FALSE positive rate),纵坐标是TPR(TRUE positive rate,也可以看做召回率)。

ROC 曲线示意图

ROC 曲线示意图

通过机器学习算法也可以发现对客户流失造成较大影响的因素,进而可以采取相应的措施来挽留客户。挽留客户是营销领域中比较重要的一项任务,挽留了客户才可以使得客户为企业带来更大的价值。

浅谈机器学习在市场营销中的应用相关推荐

  1. 浅谈机器学习之深度学习

    浅谈机器学习之深度学习 从人工智能到机器学习再到深度学习 人工智能是个很大的知识集合体,但目前有个和它关系最大的学科---机器学习 机器学习是一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算 ...

  2. 计算机技术在企业管理中的应用浅论,浅谈计算机技术在现代企业管理中的应用...

    随着计算机的普及,计算机在企业管理中的应用不断扩大.管理信息系统日益成为热点.管理信息系统是一个由人.计算机等组成并能进行管理信息的收集.传递.存储.加工.维护和使用的系统.本文针对大多数现代企业管理 ...

  3. 自己动手写一个推荐系统,推荐系统小结,推荐系统:总体介绍、推荐算法、性能比较, 漫谈“推荐系统”, 浅谈矩阵分解在推荐系统中的应用...

    自己动手写一个推荐系统 废话: 最近朋友在学习推荐系统相关,说是实现完整的推荐系统,于是我们三不之一会有一些讨论和推导,想想索性整理出来. 在文中主要以工程中做推荐系统的流程着手,穿插一些经验之谈,并 ...

  4. 浅谈机器学习之数据集构建

    浅谈机器学习之数据集构建 ​ 正如大家现在知道的,深度学习模型(DL)和机器学习模型(ML)是数据驱动型任务,在近乎完美的数据集面前,模型间的细微差异可以忽略.但要获得覆盖目标场景所有特征的样本,不仅 ...

  5. 浅谈智能气压传感器在智能手机中的应用

    浅谈智能气压传感器在智能手机中的应用 手机之所以智能,离不开各种各样的传感器, 传感器技术的地位越来越重要.现在智能手机中比较常见的传感器有: 距离传感器:当接电话是,传感器会感应到距离,从而自动关掉 ...

  6. [原创]浅谈持续集成在测试中的应用

    [原创]浅谈持续集成在测试中的应用 今天抽空理了下思路,来谈谈持续集成在测试中的应用,关于持续集成的介绍,可以参见我之前写的 浅谈我对持续集成的理解. 闲话少说,简单先介绍下,持续集成在测试中应用的范 ...

  7. java执行jar中的main_浅谈java 执行jar包中的main方法

    浅谈java 执行jar包中的main方法 通过 OneJar 或 Maven 打包后 jar 文件,用命令: java -jar ****.jar 执行后总是运行指定的主方法,如果 jar 中有多个 ...

  8. python竞赛_浅谈Python在信息学竞赛中的运用及Python的基本用法

    浅谈Python在信息学竞赛中的运用及Python的基本用法 前言 众所周知,Python是一种非常实用的语言.但是由于其运算时的低效和解释型编译,在信息学竞赛中并不用于完成算法程序.但正如LRJ在& ...

  9. 计算机技术在排水领域的应用,浅谈计算机技术在市政给排水中的应用.doc

    浅谈计算机技术在市政给排水中的应用.doc 浅谈计算机技术在市政给排水中的应用 [摘要]随着科技的进步与时代的发展,计算机技术在各个领域与行业中得到了广泛应.应用计算机技术可以增加工作的科学性与准确性 ...

最新文章

  1. 如何让云存储更好为“我”所用
  2. Maven父子工程配置文件详解
  3. CSS设置图片的对齐
  4. SpringBoot-拦截器、过滤器、监听器
  5. 浅谈MySQL索引背后的数据结构及算法【转】
  6. 掌门教育微服务体系 Solar
  7. android gesture,Android Gesture 手势创建以及使用示例
  8. pic单片机c语言多路模拟量输入,pic单片机多路ad切换程序介绍
  9. 为什么硬件管理里面没有eplan加密狗_Eplan2.7”没有可用加密狗“问题
  10. 网页前端:JavaScript编程
  11. origin拟合曲线,并绘制曲线上某一点的切线
  12. jmeter常用操作说明
  13. 阿里云ACP云计算认证有用吗?
  14. 简单的网页登录注册页面
  15. python什么证书最有价值,python哪个证书含金量高
  16. 3D塔防游戏实现 5.2 3D怪物死亡(Feekood语言)
  17. 北航计算机学院李卫国,北航学生评选“心目中最爱戴的老师”
  18. 企业微信单点登陆流程
  19. 博通Broadcom SDK源码学习与开发12终结篇——TR069网管协议
  20. 1.1 Python 程序设计基本方法

热门文章

  1. 省高校计算机等级考试二级,湖南省高校计算机等级考试二级考试0810.ppt
  2. 智源社区AI周刊·第二期:过去一周AI领域的新鲜事
  3. 独家 | 利用AI进行高精度图像编辑︰EditGAN(附链接)
  4. 赠票 | 第三届语言与智能高峰论坛200个免费参会名额!
  5. 独家 | 一文读懂人工神经网络学习原理
  6. Web版VS Code上线:最好用的IDE终于发布网页版,然而微软发完秒删
  7. 雪上加霜!股东向 Zoom 发起集体诉讼,索赔高额补偿
  8. 新年之际,最新摄影必备的无人机免费送10个给大家!
  9. 【重磅】谷歌2021博士奖研金完整名单出炉,13个方向共75人获奖
  10. 「自然语言处理NLP」的“高光时刻” --- 28篇标志性论文