案例场景:每个销售型公司都有一定的促销费用,促销费用可以带来销售量的显著提升;当给出一定的促销费时,预计会带来多大的商品销售量?

原始数据:data.txt 文件 ,包含了建模所需的原始数据

依赖库:re、numpy、sklearn、matplotlib

纬度数量:1

记录数:100

x:促销费用  y:商品销售量

python IDE:PyCharm

python版本:Python 3.7.2

案例过程:

第一步:导入库

import reimport numpyfrom sklearn import linear_modelfrom matplotlib import pyplot as plt

导入库:import [库名]

导入库中指定函数:from [库名] import [函数名]

第二步:导入数据

fn = open('data.txt','r')
all_data = fn.readlines()
fn.close()

读取文件,并保存至变量all_data中,注意open参数的文件名可以是绝对路径,也可相对路径。

第三步:数据预处理

x = []
y = []
for single_data in all_data:tmp_data = re.split('\t|\n',single_data)x.append(float(tmp_data[0])y.append(float(tmp_data[1])
x = numpy.array(x).reshape([100,1])
y = numpy.array(y).reshape([100,1])

用正则分割每行数据,赋值给x和y,将x:促销费用  y:商品销售量 的列表转换成x和y数组类型。

第四步:数据分析

pltscatter(x,y)
plt.show()

plt.scatter(x,y) 用一个散点图来展示x和y。plt.show() 是展示图像(二维图像),

该图像为线性回归模型处理更为准确。

第五步:数据建模

model = linear_model.LinearRegression()
model.fit(x,y)

先创建一个模型对象,后续所有的模型操作都基于该对象上产生。然后model.fit(x,y) 将x和y分别作为自变量和因变量输入模型进行训练。

第六步:模型评估

model_coef = model.coef_
model_intercept = model.intercept_
re = mode.score(x,y)

model_coef = model.coef_  :获取模型的自变量的系数并赋值为model_coef;
model_intercept = model.intercept_ :获取模型的截距并赋值为model_intercept;
re = mode.score(x,y) : 获取模型的决定系数R的平方。

上述步骤可得到线性回归方程 y = model_coef*x + model_intercept ,即 y = 2.09463661*x + 13175.36904119 。该方程决定系数R的平方是0.78764146847589545 。

第七步:销售预测

new_x=[]
new_x.append(float("84610"))
new_x = numpy.array(new_x).reshape([-1, 1])
pre_y = model.predict(new_x)
print(pre_y)

创建促销费用常量,作为预测的输入,pre_y = model.predict(new_x) 作用是对促销费用常量new_x输入模型进行预测,最后打印出来[[190402.57234225]]。注意perdict()的第一个参数需要为numpy数组类型。

至此,已完成功能需求代码编写与测试。

第一个用python实现的数据化运营分析实例——销售预测相关推荐

  1. python数据分析-《Python数据分析与数据化运营》电子版

    2019-01-04更新说明,更新到"3.13 本章小结"部分. ---------------------- 前 言 为什么要写这本书 读者对象 如何阅读本书 勘误和支持 致谢 ...

  2. 【组队学习】【28期】基于Python的会员数据化运营

    基于Python的会员数据化运营 论坛版块: http://datawhale.club/c/team-learning/37-category/37 开源内容: https://github.com ...

  3. 【组队学习】曹志宾:基于Python的会员数据化运营

    分享人:曹志宾,Datawhale成员,香港科技大学硕士在读 分享内容: 案例描述与分析 前期准备与数据预处理 RFM模型使用与操作 Excel中的RFM分析 组队学习: 红星:基于Python的会员 ...

  4. 【组队学习】孙健坤:基于Python的会员数据化运营

    分享人:孙健坤,哈尔滨工业大学 分享内容: 什么是会员制? 什么是会员数据化运营? 如何进行会员数据化运营 组队学习: 基于Python的会员数据化运营 开源内容: https://github.co ...

  5. python进行数据预测的实例-第一个使用Python完成的数据化运营案例――销售预测...

    时间:2019-02-25 概述:销售预测 第一个使用Python完成的数据化运营案例--销售预测,依赖库:re.numpy.sklearn.matplotlib,程序输入:data.txt,程序输出 ...

  6. Python数据分析与数据化运营(笔记)第一章:python与数据化运营

    1.开头三个问题: 1.python是什么? 2.数据化运营是什么? 3.为什么要将python用于数据化运营? 1.1 Python是什么? 老生常谈,这里简单列举一下,百度一大把,不过多赘叙 py ...

  7. python数据分析与数据化运营_电商数据分析与数据化运营.pdf

    作 者 :刘振华 出版发行 : 北京:机械工业出版社 , 2018.06 ISBN号 :978-7-111-59819-0 页 数 : 194 丛书名 : 数据分析与决策技术丛书 原书定价 : 69. ...

  8. 一个使用python和TUShare进行股票分析的例子

    (2021.1)这篇文章写成的时间较早,使用的读取数据的接口有更新,具体内容请查看:https://tushare.pro/register?reg=365021. (原内容:) <利用Pyth ...

  9. 这才是真正适合小白的教程:Python有什么用?数据化运营怎么做?

    导读:数据化运营是提高利润.降低成本.优化运营效率.最大化企业财务回报的必要课题.Python作为数据科学界的关键工具之一,几乎可以应用于所有数据化运营分析和实践的场景. 作者:宋天龙 如需转载请联系 ...

  10. python数据分析:商品数据化运营(上)——知识点

    商品数据运营指标 销售类指标 订单量/商品销售量 订单量指用户提交订单的数量,计算逻辑去重后的订单ID的数量. 商品销售量又称销售件数,指销售商品的数量. 订单金额/商品销售金额 订单金额为用户提交订 ...

最新文章

  1. 微软已经宣布自2009年4月14日起放弃对windows xp的主流支持
  2. 发送请求_发送soap请求调用wsdl服务
  3. Django:视图和URL配置
  4. PHP算法按数组某一字段进行排序
  5. ASCII码表在线查询进制转换
  6. cocos2d-x游戏开发(二)开始菜单续
  7. 【.NET 日常开发技巧】一个性能强悍的HttpClient 库
  8. android 开源项目列表【持续整理中。。。】
  9. fortran调用matlab画图,[转载]Matlab与Fortran的交互--基本概念
  10. CentOS6.5升级内核到3.10.28
  11. VLAN TAG 实例
  12. 苹果屏幕供应商JDI正寻求中国投资 因国内面板厂商正在崛起
  13. Java基础学习总结(39)——Log4j 1使用教程
  14. Matlab计算矩阵和函数梯度
  15. 欧姆龙cp1h指令讲解_欧姆龙PLC编程指令含义及其用法
  16. 成功解决:[‘‘, ‘‘, __ob__: Observer]
  17. win7录屏_专业电脑录屏方法有哪些?分享录屏靠谱方法!
  18. [决策单调 分治] LOJ#535. 「LibreOJ Round #6」花火
  19. ADP的人力资源外包方法论
  20. 关于极光推送通知栏无法正确显示应用图标

热门文章

  1. SQLite在指定列后面插入字段_如何用SQL语句添加和修改字段?
  2. jenkins 版本升级
  3. AXI_lite 总线学习
  4. js设置一个打点计时器
  5. 《运动改造大脑》总结
  6. Jpa 注解详解 映射详解 一对多 多对一
  7. win10电脑显示未连接网络连接到服务器,win10系统未识别网络无法连接到internet的解决方法...
  8. Python3 猴子第一天摘下若干个桃子,当即吃了一半..
  9. 【Linux c】sipc
  10. Win7 Hiberfil.sys pagefile.sys