北京市朝阳医院药品销售数据分析
目录
第1章绪论
1.1研究背景
1.2 研究目的与意义
1.3研究内容
2.1数据采集
2.1.1源数据下载
2.2.2源数据存储
2.2数据预处理
2.2.1数据预处理工具介绍及操作
2.2.2读取数据
2.2.3数据规范化处理
2.2.4 检测空值和缺失值及处理
2.2.5重复值检测及处理
2.2.6时间数据处理
2.2.7异常值数据处理
2.2.8重置索引
2.3数据存储
2.4本章小结
3.1可视化工具介绍
3.1.1Excel可视化工具
3.1.2Tableau可视化工具
3.1.3Echarts可视化工具
3.1.4PyEcharts可视化工具
3.1.5Matplotlib可视化工具
3.2感冒类药品销售可视化
3.2.1数据获取
3.2.2可视化分析
3.3药品销售数量排行可视化
3.3.1数据获取
3.3.2可视化分析
3.4药品销售金额趋势可视化
3.4.1数据获取
3.4.2可视化分析
3.5 问题与措施
3.5.1 问题总结
3.5.2 相关措施
第4章总结与展望
4.1 总结
4.2 展望
参考文献:
第1章绪论
1.1研究背景
随着社会的不断发展进步,人们的衣食住行得到很大的改善,但同时,正是因为生活质量的不断提高,人们的饮食更加复杂化,由于不健康的饮食和生活习惯,导致身体的致病因素也随之增多,其次,工作压力,生活环境,体育运动等原因也是导致身体患病的因素之一。根据《中国卫生健康统计年鉴》的统计数据,近年来中国平均每人每年去医院看病6次左右。当然,有的人一年去医院看病十几次甚至几十次,有的人几年也不去医院看病一次,人们身体健康至关重要需引起全面重视。
下列年份的总诊疗人次数和平均每人就诊次数(按照总诊疗人次数除以当年总人口而得出)如图1-1所示:
图1-1
总诊疗人次数:指所有诊疗工作的总人次数,统计界定原则为:①按挂号数统计,包括门诊、急诊、出诊、预约诊疗、单项健康检查、健康咨询指导(不含健康讲座)人次。患者一次就 诊多次挂号,按实际诊疗次数统计,不包括根据医嘱进行的各项检查、治疗、处置工作量以及免 疫接种、健康管理服务人次数;②未挂号就诊、本单位职工就诊及外出诊(不含外出会诊)不收取挂号费的,按实际诊疗人次统计。
1.2 研究目的与意义
通过研究医院的药品销量,从而分析患者的致病原因,为此提出解决措施,可以从源头有效的预防此类疾病的发生。以及根据医院的药品销售数量,对医院药品库存提出参考,对于销量较高的药品应加大库存量,对于销量较低的药品适当减少库存,将医院资源更加合理化应用。避免出现供不应求的现象产生。同时,对于药品生产商,可以根据医院药品销售数量的反馈,从而适当的调整药品的生产,将销量居高的药品加大生产,对于销量较低的药品减少生产,避免因长时间库存而影响药品质量,同时,可以根据季节性疾病,地区性患者疾病特征,以及具有传染性疾病的药品根据医院药品销量结合外界因素(气候,地域特点等)预测药品需求,更加科学的控制各药品生产数量,将资源合理化应用。如,2022年底,全国疫情解封之后,患者对感冒类药品的需求远远大于供给,各种感冒药出现断货现象。
同时,药品价格指数是反映不同时期药品价格变动方向和程度的相对数指标,可用于测算药品价格变动对医院药品成本和病人药品费用的影响。医院药品销售指教包括药品购进价格指数、药品零售价格指数,单纯计算药品价格指数不能完整反映引起医院药品成本费用的变化原因,还需要计算药品购进量作数、药品销售量指数、药品费用指数。医院药品销售指教体系包括药品价格指数、药品数量指教和药品费用指数及其相对关联关系。在资料充足的情况下,根据不同的目的可计算不同的药品价格指数,如门诊药品价格指教、住院药品价格指教,或者计算西药价格指教、中药价格指数,为了反映基本药物和抗生素药品的价格变化情况,可计算基本药品价格指数、抗生素药品价格指数。[1]
1.3研究内容
本文以北京市朝阳医院为例,获取2018年1月-7月的药品销售数据,通过对所售药品进行归类,数量统计,药品的成分组成分析等,来分析患者的购药需求及深层分析致病原因,为患者,医院,药品生产商提出参考。
主要内容包括以下两大方面,如图2-1所示:
图2-1
第2章 数据采集与存储
2.1数据采集
2.1.1源数据下载
确定数据源,我的数据源是通过网页下载“朝阳医院2018年销售数据”。下载地址:
进入到所在页面后,CSDN用户为我们提供了一个数据下载链接和密码
数据下载:链接:https://pan.baidu.com/s/1NFCMP8QbIsMCgDrXEq5GCw
密码:o558
2.2.2源数据存储
我将下载好的源数据保存到电脑本地,保存路径为:"D:\学习\大数据分析及应用\朝阳医院2018年销售数据.xlsx"
打开下载好的文件,我们会发现文件文件中存在一些空值,重复值,数据格式错位等一些问题,所以我们需进一步对数据进行预处理。如下图是截取的数据表中存在问题的一部分。
2.2数据预处理
2.2.1数据预处理工具介绍及操作
我们对数据采取预处理使用的工具是jupyter notebook,以下是简单介绍:
Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。
Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享程序文档,支持实时代码,数学方程,可视化和 markdown。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等。
进入软件:
简单操作:
1.键盘输入模式
Jupyter Notebook 有两种键盘输入模式。
编辑模式,允许用户往单元中键入代码或文本;这时的单元框线是绿色的。
命令模式,键盘输入运行程序命令;这时的单元框线是灰色。
2.2.2读取数据
1.首先导入数据分析数据库Pandas和科学计算基础工具包Numpy
2.2.3数据规范化处理
查看数据规范化处理后的前5行数据,可以通过下图发现数据类型已转换
接下来我们查看数据的shape属性,结果显示为6578行x7列
从输出的前五行数据分析,我们发现“购药时间”存在歧义,将“购药时间”改为“销售时间”,通过rename()将其重命名,具体操作及处理结果如下图所示:
2.2.4 检测空值和缺失值及处理
使用isnull()检测空值和缺失值,返回True(存在)和False,并使用sum()统计每列缺失值个数,具体操作如下图所示:
处理完成后我们再次.isnull().sum()来进行一次检测,检查是否删除成功。
查看删除后数据的shape属性,可以发现由6578行变成了6575行,可以看出,有些列的缺失值和空值在同一行。
2.2.5重复值检测及处理
2.2.6时间数据处理
通过time.1oc[:,0]提取了time的第一列数据,并赋值给data. loc[:,'销售时间'],用time中的日期数据更新了data的“销售时间”列。
再次通过使用isna()和sum()统计dataframe每个数据列所包含的缺失值个数,通过结果可以发现“销售时间”存在23个缺失值。
再次采用dropna()方法删除“销售时间”列存在缺失值的行,并将结果赋给新的对象cy_data3
2.2.7异常值数据处理
定义一个布尔数组对象,通过cy_data3.loc[:,'销售数量']>0判断销售数量列中的数据是否大于0,大于0的显示True,小于0的显示False.
通过vec_bool布尔数组对data进行切片,截取销售数量数据大于0的行,并将结果返回给cy_data4
通过describe()方法计算处理后cy_data4的描述统计信息,默认是销售时间,应收金额和实收金额这三列并对其进行统计分析,包括数据汇总(count),标准差(std)。
从结果可以看出刚刚min存在负数的问题已解决,也可以看出这3列数据都在正常范围之内。
2.2.8重置索引
由于前面处理数据时删除了很多行,所以需重置索引并赋给新的对象,设置参数drop=True表示不再保留原有的index数据。
2.3数据存储
"D:\学习\大数据分析及应用\朝阳医院2018年销售数据(处理后).xlsx"
2.4本章小结
3.1可视化工具介绍
3.1.1Excel可视化工具
3.1.2Tableau可视化工具
3.1.3Echarts可视化工具
做图步骤:1.引入Echarts.js文件 ——图表依赖这个库
3.初始化Echarts实例化对象——实例化Echarts对象
5.将配置项设置给Echarts实例对象——让Echarts对象根据修改好配置项生效。
3.1.4PyEcharts可视化工具
而Echarts 是一个由百度开源的数据可视化工具,有着良好的交互性,精巧的图表设计能力。当Python与Echarts结合就形成了pyecharts.
pyecharts是一种交互式的可视化库,图形展示跟matplotlib相比就好比河流与池塘。pyecharts更加灵活美观,作图更加灵活、巧妙。
做图步骤:1.导入模块;2.输入数据;3.设置全局变量;4.显示图片
3.1.5Matplotlib可视化工具
Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。
画板——位于最底层,导入Matplotlib库时就自动存在。
图表信息——添加或修改axes上的图形信息优化图表的显示效果。
绘图架构:import matplotlib.pyplot as plt
3.2感冒类药品销售可视化
3.2.1数据获取
为了分析北京朝阳医院2018年1月-7月感冒类药品的销售情况,我们针对数据表进行处理,然后通过处理后的数据表进行可视化并加以分析。
前期,我们将下载好的源数据导入到jupyter notebook中进行了预处理,然后将预处理后的信息以.xlsx文件形式存储在本地:
"D:\学习\大数据分析及应用\朝阳医院2018年销售数据(处理后).xlsx"
3.2.2可视化分析
数据分析:如图3-6所示,针对感冒药销量,我们将每种感冒药的销量进行了分析,发现感冒的销量最高,占到47%,清热解毒口服液销量仅次于感康,占比25%。对于感康等药品的详细信息,通过查阅资料发现:
感康:适用于缓解普通感冒及流行性感冒引起的发热、头痛、四肢触痛、打喷嚏、流鼻涕、鼻塞、咽喉痛等症状。
清热解毒口服液:用于热毒壅盛所致发热面赤,烦躁口渴,咽喉肿痛等症;流感、上呼吸道感染。
占比最大的两种感冒药,虽然都为感冒药,但作用却略有不同,可以发现,共同点都可以治疗流感,说明众多人因流感而导致感冒。
同时,针对销量较好的药品,医院应增加进货量,以最大程度满足供需,对于销量较差的药品,应减少进货量,进行库存优化,达到资源最大化利用。
3.3药品销售数量排行可视化
3.3.1数据获取
3.3.2可视化分析
a.高血压本品适用于高血压的治疗。可单独应用或与其他抗高血压药物联合应用。
本品主要成份为苯磺酸氨氯地平,其化学名称为:3-乙基-5-甲基-2-(2-氨基乙氧甲基)-4-(2-氯苯基)-1,4-二氢-6-甲基-3, 5-吡啶二羧酸酯苯磺酸盐。
Top2: 开博通,又名卡托普利,是一种有机化合物,化学式为C9H15NO3S,主要用作血管紧张素转移酶抑制药,被应用于治疗高血压和某些类型的充血性心力衰竭。
本品主要成份为酒石酸美托洛尔;化学名称为:1-异丙氨基-3-【对-(2-甲氧乙基)苯氧基-2-丙醇L(+)-酒石酸盐。
适应症为:1.心绞痛:变异型心绞痛;不稳定型心绞痛;慢性稳定型心绞痛。
化学名称:2,6-二甲基-4(2-硝基苯基)-1,4-二氢-3,5-吡啶二甲酸二甲酯
适应症为:1、高血压本品适用于高血压的治疗。可单独应用或与其他抗高血压药物联合应用。
本品主要成份为苯磺酸氨氯地平,其化学名称为:3-乙基-5-甲基-2-(2-氨基乙氧甲基)-4-(2-氯苯基)-1,4-二氢-6-甲基-3, 5-吡啶二羧酸酯苯磺酸盐。
1、保持生活作息规律,避免熬夜,早睡、早起有利于控制血压,对血管起到保护作用。
2、适当运动,提倡有氧运动,如慢跑、快走,避免剧烈运动,以免导致血压突然升高,诱发脑出血、心衰等并发症。
3、养成良好的饮食习惯,避免暴饮暴食,饮食以清淡、低脂、低盐为原则,避免饮用咖啡、浓茶,戒烟限酒。
4、密切监测血压,同时定期检测血糖、血脂。
5、保持情绪稳定,避免大喜大悲。
对于医院而言,针对销量较好的药品,应增加进货量,以最大程度满足供需,对于销量较差的药品,应减少进货量,进行库存优化,达到资源最大化利用。
图3-10柱形图
数据分析,图3-10为药品销售数量升序排序,可以看出1-7月,销量低于50的药品达到29种,D厄贝沙坦氢氯噻嗪片(倍悦)等药品的销量不足10,医院可以根据此数据,适当的减少此类药品的进货,减少对库房资源的占用,也避免长时间库存而影响药品质量。对于药品生产商而言,也可以适当的减少此类药品的生产数量。
3.4药品销售金额趋势可视化
3.4.1数据获取
为了分析2018年北京市朝阳医院1-7月药品销售金额变化趋势,我采取使用Matplotlib制作折线图,通过图中线的变化来分析数据,我们直接在数据预处理的界面中,调用处理后的对象cy_data5,将cy_data5 赋给新的对象groupDf2,目的是防止做图时对之前清洗过的数据造成影响。
第一步:重命名行名(index)为销售时间所在列的值
第二步:将索引按月进行分组
第三步:应用函数,计算每个月的消费总额
第四步:选取每个月的应收金额和实收金额的消费总额
第五步,做图,首先,导入模块绘图架构:import matplotlib.pyplot as plt。然后创建画布与创建子图。再对画布添加内容。最后进行图像的展示。操作代码如下:
3.4.2可视化分析
图3-11折线图
数据分析:如图3-11所示,通过折线图,我们发现,从1月到2月,销售金额有所下降,原因是春节期间,医院休假以及大部分人们返乡回家过节,前往医院购药人数较少,2-4月,春节后人们复工复产,城市人员有所上升,会导致医院的药品销售上涨,加之换季时候,普通感冒以及流感的爆发会使人们需要购买药品,从而使得销售金额有所上涨,4-6月销售金额变化不大,7月份数据不完整,所以不具备参考价值。同时可以看出,应收金额和实收金额之间的高度差反应了折扣率的大小,应收金额和实收金额差距越大,折扣率越大。可以看出4月份的折扣率最大,销售金额最高,药品打折在一定程度上会刺激销售量的增加。医院可以根据此图,来预测医院的输入,为医院的财政做出参考价值。
3.5 问题与措施
3.5.1 问题总结
问题1:处理数据时,我使用describe()方法统计信息,发现销售数量存在负数,而导致销售金额出现负值,因此需要删除销售量小于0的值,问题截图如下:
3.5.2 相关措施
处理问题1:定义一个布尔数组vec_bool,将cy_data3赋给vec_bool,通过cy_data3.loc[:,'销售数量']>0判断销售数量列中的数据是否大于0,大于0的显示TRUE,小于0的显示FALSE,然后通过vec_bool布尔数组对data进行切片,截取销售数量数据大于0的行,并将结果返回给cy_data4。最后再利用describe()进行数量统计,发现销售数量存在的负值的问题已解决。
第4章总结与展望
4.1 总结
本文以2018年北京市朝阳区1-7月销售数据为例,统计了朝阳医院1-7月的药品销售排行及各药品深层分析,发现高血压类药品销售最多,且排行前五的全是高血压类药品,为此对患者,医院以及药品生产商提出了参考意见;以及感冒类药品每月的销售数量及各种感冒类药品的销售占比,发现了2-4月流感季节感冒药销量居高,且感康的销量在感冒类药品中占比最大,对患者预防感冒及患感冒后服用感康与其他药品的注意事项提出了参考意见,其注意事项内容参考了知网中的论文。还分析了医院的销售金额变化趋势等,供医院财政收入参考。
4.2 展望
由于本次课程设计的时间紧张,加之自己的知识能力有限,对于研究目的中提出的根据已有药品销量对未来药品销量等一些预测分析,还未完成,药品销量的分析可以从侧面反应出患者对不同药品的需求,以及不同季节,地域的影响对药品销量均有所影响。在后期,我将继续完成本次课设未完成的预测分析、价格指数分析等一些问题,更加深层次的挖掘数据的意义,更好的为患者,医院,及制药商提出可靠性参考意见。
同时,面对已有问题,政府应建立完善的卫生保健体系,不断增加医疗投入,完善医疗设备,提高医疗技术水平,以优质的医疗资源来保障各类人群健康需求。
建立全民健康教育体系,通过举办健康讲座、宣传疾病预防和科普普及等活动,增强公众的健康知识与意识,倡导人们树立健康的生活方式和消费观。
鼓励开展科学研究,探索更为安全、有效、快速的治疗手段和疾病控制方法。技术的应用和理论的深入研究可以为人类疾病控制和健康提供更有效的方法和方案。
中国的疾病现状绝非一朝一夕形成,需要持续地采取措施,慢慢地改善,才能为广大人民提供安全、有效的医疗服务和更好的健康保障。除此之外,还需要强调预防和早期筛查的重要性。对于诸如糖尿病、高血压、肝病、癌症等慢性疾病,及时的筛查和早期治疗可以大大提高治愈率。例如,定期检查血糖、血压、肝功能等,对于预防或者治疗疾病都有很大的帮助。而且,许多疾病的早期症状并不明显,需要及时就医才能够被发现。因此,个人主动关注自身身体状况,定期进行体检是十分必要的。
作为每个人,我们也应该树立健康意识,寻求科学的健康生活方式。尤其是在现代社会,工作和生活压力大,人们的健康情况正面临很大的挑战。减少对烟、酒、咖啡等副作用大的物质的依赖是有必要的,保持充足的睡眠、适当的锻炼以及多吃健康食品对身体健康也有很大的帮助。
切实关注中国的疾病现状是我们每一个人的责任。及时接受医学检查、改变不健康的生活习惯、培养健康的心态和信念都与一个健康的生活密不可分,而这也是我们所期望的。在促进健康状况的改善过程中,我们还需要重视的是与环境和食品卫生相关的问题。中国是世界上最大的发展中国家之一,人口众多、农村人口占比较高,在环境卫生和食品安全方面存在着很大的问题。空气污染、水污染等诸多环境问题已经成为当前中国面临的重要挑战,而食品安全问题更是广受人们关注。
针对环境问题,我们应该积极参与到环保活动中,防止污染未然。尤其是在重点区域,政府应加大治理力度,落实环保政策,加强监管执法,着力构建绿色生态环境。
食品安全问题可以通过实行科学的品种培养、农药、肥料的使用、养殖等行业规范和技术规范来改善。消费者也应该养成培养良好的食品卫生习惯、购买在法销售的商品和从正规销售机构购买食品等生活方式。
探究中国疾病现状,除了针对医疗行业重视医疗服务质量提升外,调整个人生活方式以及整体社会生态环境等方面的改善也是需要关注的。倡导健康生活方式,加强环境改善和食品安全问题解决,可以缓解疾病高发、并最终改善中国疾病现状。
参考文献:
[1]王光伟,吴咏梅,李晖.浅谈医院药品销售指数的编制及应用[J].企业导报,2012,(24):120-121.
[2]李梦琳.西药感冒药的不良反应研究[J].生物技术世界,2015,(01):64.
北京市朝阳医院药品销售数据分析相关推荐
- 月均数据_药品销售数据分析案例
今天用python去做一个简单的药品销售数据分析案例 一.数据分析的目的 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程. 本篇 ...
- 重点客户销售数据分析python_药品销售数据分析--python
一.数据分析的目的 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程. 本篇文章中,假设以朝阳医院2018年销售数据为例,目的是了 ...
- python医药数据分析_药品销售数据分析--python
一.数据分析的目的 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程. 本篇文章中,假设以朝阳医院2018年销售数据为例,目的是了 ...
- 根据医院药品销售数据分析本年度销售情况
一.数据分析的目的 本篇文章中以某医院2018年药品销售数据为例,目的是了解该医院在2018年里的销售情况,这就需要知道几个业务指标,例如:月均消费次数,月均消费金额.客单价以及消费趋势. 二.数据分 ...
- python药店销售数据分析_Python:某医院药品销售数据分析
数据分析步骤: 提出问题-理解数据-数据清洗-构建模型-数据可视化 下面就拿2018年朝阳医院销售数据按上述步骤进行分析. 1.提出问题 根据拿到的销售数据字段信息,我们对以下三个业务指标进行分析 . ...
- python销售数据分析方法_Python数据分析之药品销售案例分析(上)
一.一维数组 1.1 一维数据可以由numpy中的Array函数或者Pandas包中的Series函数创建,series函数是建立在array函数基础上,功能更加强大一些. 1.2Array 函数 利 ...
- 探索性分析——某医院18年销售数据分析
针对某医院18年销售记录,做简单的数据分析,熟悉相关语法及分析过程. 一.分析目的 以某医院18年销售数据为例,了解18年的销售情况,分析几个业务指标,例如:月均消费次数,月均消费金额.客单价以及消费 ...
- python药店销售数据分析_解析医院药店销售数据,看看Python数据分析结果有什么惊人的发现|python基础教程|python入门|python教程...
https://www.xin3721.com/eschool/pythonxin3721/ 前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时 ...
- 药品销售管理系统 系统开发 PB9.0
忙了两周,终于可以初步搞定了,虽然还有好多东西没考虑周到.但起码能执行基本的业务操作了.待以后再修改了.. <管理信息系统> 课程设计 说 明 书 摘要 这次做的药品销售管理系统是在学习完 ...
最新文章
- smali to java_Smali —— 数学运算,条件判断,循环
- 利用 Java dump 进行 JVM 故障诊断
- 未来的C#之只读引用与结构体
- 简化springboot部署,太灵活方便了!
- SQL必知必会-使用游标
- MATLAB学习笔记(十六)
- 《支付宝的高可用与容灾架构演进》读后感
- Mysql事务,并发问题,锁机制
- java info()方法_Java中的提供者getInfo()方法
- ubuntu 各版本
- 抖音极速版/快手极速版自动浏览
- Gwallet小百科 | 2019年区块链游戏行业发展现状分析
- cmake flags
- 再见2018,你好2019!
- table maker's delimma
- FNL资料的变量说明
- 微信小程序如何将数据存储到服务器,微信小程序关于数据存储的一些坑
- 解决phpStudy端口占用的问题
- 文献合集 | 超扫描之fNIRS / fMRI / EEG / MEG
- 如何修改别人的GHO作品
热门文章
- arm生态发展与交叉编译链选择
- metabase v1.38.1 使用ldap认证
- 优酷路由宝安装php,优酷路由宝怎么设置_优酷路由器怎么安装?-192路由网
- Xshell的安装和使用
- 王者荣耀转系统服务器繁忙,王者荣耀:跨系统角色转移已成为常态,亲身经验分享给大伙儿...
- UI控件笔记(二):UI之UILabel和UIImageView
- 突破教育网的防线,将搜狗浏览器的教育网加速功能全面推向各种浏览器
- 矩阵特征值分解与奇异值分解含义解析及应用
- 米推(MiPush)简述
- 【计算机网络】物理层(完整版)