Python金融数据挖掘 第11章 复习思考题2 (聚类)选取中华人民共和国第六次人口普查的各地区人口数以及男女比例进行K-Means聚类分析。
1、题目
选取中华人民共和国第六次人口普查的各地区人口数以及男女比例进行K-Means聚类分析。
2、 代码
# K取值2
print("step2.1:聚类")
k=2
centroids,clusterAssment=kmeans(dataSetKNN1,k)
print('数据类型:',dataSetKNN1.dtype)
print("step3.1:结果输出:见'图11.2.2.png'")
showCluster_2(dataSetKNN1,k,centroids,clusterAssment)# K取值3
print("step2.2:聚类")
k=3
centroids,clusterAssment=kmeans(dataSetKNN1,k)
print('数据类型:',dataSetKNN1.dtype)
print("step3.2:结果输出:见'图11.2.3.png'")
showCluster_2(dataSetKNN1,k,centroids,clusterAssment)
3、结果图
(1)我觉得这个图有问题,但没想出来怎么修改。等待后续修改一下,继续上传。
(2)
(3)
Python金融数据挖掘 第11章 复习思考题2 (聚类)选取中华人民共和国第六次人口普查的各地区人口数以及男女比例进行K-Means聚类分析。相关推荐
- Python金融数据挖掘 第11章 复习思考题1 (聚类)给出一个数据集data_multivar.txt,里面有200个点坐标,在平面坐标系下可以画出它的散点图,用K均值聚类算法来训练模型,分4类。
1.题目 给出一个数据集data_multivar.txt,里面有200个点坐标,在平面坐标系下可以画出它的散点图,如图11-12所示. data_multivar.txt 图11-12 数据集 da ...
- Python金融数据挖掘 第7章 复习思考题 3
3.有'手机垃圾短信'数据集,将其放在文件中:sms_spam.csv,该文件共有5537行,2列,分别是类型(type,ham为非垃圾短信,spam为垃圾短信)和内容(text,短信的具体内容). ...
- Python金融数据挖掘 第7章 第3节 (7) 案例:基于股评文本的情绪分析
1.特征词 表示一篇文本,矩阵数据,聚类.分类.预测 2.情绪.情感分析 情感值.舆论文本.文本数据,来源管,新闻.情感倾向:存在误差,不准确 3.基于股评文本的情绪分析 #网络舆情,判断指数走向 3 ...
- Python金融数据挖掘 第7章 第2节 (5)高频词
1.长度 文本长度:按照字数.标点符号.中英文 分词长度:词数,列表:list 预处理--统计词频.词,矩阵数据--深入分析,二维表,记录(文本).字段(词) 2.引入库 import jieba i ...
- 利用python爬取历代中国行政图,从先周到中华人民共和国,jpg格式边框带经纬度,可自行配准矢量化
古代地图,对于历史相关研究人员,是需要的工具,本想找到历代矢量的历史地图数据,但是发现很难有资源,因此只能找到已经公开制图了jpg数据,如果你有耐心,可以配准后矢量化,获取历代矢量数据,不够工作量浩大 ...
- 大学学python在金融中的应用_《Python金融数据挖掘及其应用》教学大纲
< python 金融数据挖掘及其应用> 课程教学 大纲 课程代码: 学 分: 5 学 时: 80 (其中:讲课学时: 60 实践或实验学时: 20 ) 先修课程:数学分析.高等代数.概率 ...
- Python金融数据挖掘 第八章 复习思考题2
一.问题 设有一份购物篮数据basketdata.txt,包括两部分内容. 第一部分是1000名顾客的个人信息,含7个变量:会员卡号(cardid).消费金额(value).支付方式(pmethod) ...
- Python金融数据挖掘 第八章 复习思考题1
一.问题 医院礼品店已完成5项交易,购买记录清单如表8-3所示,请使用Apriori算法进关联规则分析. (1)使用数字代替商品完成第3列: (2)计算购买"鲜花"的支持度: (3 ...
- 利用python进行数据分析——第11章时间序列
文章目录 时间序列 一.日期和时间数据类型及工具 1.1字符串与datetime互相转换 二.时间序列基础 2.1索引.选取.子集构造 2.2 含有重复索引的时间序列 三.日期的范围.频率以及移动 3 ...
- Python for Informatics 第11章 正则表达式五(译)
注:文章原文为Dr. Charles Severance 的 <Python for Informatics>.文中代码用3.4版改写,并在本机测试通过. 11.4 转义字符 之前我们在正 ...
最新文章
- 费曼:所有的科学知识都是不确定的
- 15.文件系统——软RAID的实现(二)(mdadm,watch, RAID1)
- Python遍历列表时删除元素
- 工作总结11:vue获取数据接口
- (软件工程复习核心重点)第六章实现和测试-第六节:白盒测试
- 加载自己保存训练模型OSError: Unable to open file (unable to open file: name = ‘./model/LeNet_model‘, errno = 2
- 构建系统发育树~序列对比 MEGA、MAFFT(图文教程)
- 面对互联网寒冬,程序员能够做什么?
- java se 知识点(一)
- Air202学习 三 (模块串口使用)
- DAS、NAS、SAN三种高端存储技术分析
- 倾斜摄影的单体化建模研究 和osg 关系
- java 绘制六边形_六边形架构 Java 实现
- 为什么街上发传单的人会认真发完,却不把传单丢了呢?
- Linux命令--查看文件信息
- 开源OpenIM:高性能、可伸缩、易扩展的即时通讯架构
- w7运行里的计算机怎么设置,W7系统怎么设置开机启动项
- 早上喝水较健康 喝法有学问!
- 地奥畅依笙 源于医药科技,忠于健康运动!
- 记录自己答题带思路Python简单?先来40道基础面试题测试下