sklearn代码11 1-熵
import numpy as np
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Z8Lm1iLN-1635839408553)(1.png)]
− ∑ i = 1 n p ( x i ) ∗ l o g 2 p ( x i ) -\sum_{i = 1}^{n}{p(xi)*log_2p(xi)} −i=1∑np(xi)∗log2p(xi)
∑ i = 1 n p ( x i ) ∗ l o g 2 1 p ( x i ) \sum_{i=1}^{n}p(xi)*log_2\frac{1}{p(xi)} i=1∑np(xi)∗log2p(xi)1
# 账号是否真实进行划分:3(no) 7(yes)# 不进行划分,信息熵info_D = 0.3*np.log2(1/0.3)+0.7*np.log2(1/0.7)
info_D
0.88129089923069259
# 决策树,对目标值进行划分
# 三个属性,日志密度 好友密度,真实头像
# 使用日志密度进行树的构建
# 3 s ----> 0.3 2N 1Y
# 4 m ----> 0.4 1N 3Y
# 5 l ----> 0.5 3Yinfo_F = 0.3*(2/3*np.log2(3/2)+1/3*np.log2(3))+0.4*(0.25*np.log2(4)+0.75*np.log2(4/3))+0.3*(1*np.log2(1))
info_F
0.59999999999999987
# 信息增益
info_D - info_F
0.28129089923069273
# 好友密度
# 4 s 0.4--->3N 1Y
# 4 m 0.4--->4Y
# 2 l 0.2--->2Yinfo_F_D = 0.4*(0.75*np.log2(4/3) + 0.25*np.log2(4)) + 0 + 0
info_F_D
0.32451124978365314
# 信息增益
info_D - info_F_D
0.55677964944703939
sklearn代码11 1-熵相关推荐
- python实现k core算法_python实现密度聚类(模板代码+sklearn代码)
本人在此就不搬运书上关于密度聚类的理论知识了,仅仅实现密度聚类的模板代码和调用skelarn的密度聚类算法. 有人好奇,为什么有sklearn库了还要自己去实现呢?其实,库的代码是比自己写的高效且容易 ...
- sklearn代码查询(学习笔记)
这里写目录标题 运行软件 决策树 回归树 numpy用法 调参思维 画学习曲线 网格搜索 网格搜索重要接口 泛化误差 影响泛化误差的因素 树模型调参策略(按顺序去调) 数据预处理 0.样本不均衡问题 ...
- sklearn代码21 2-2020天猫双十一销量
# 认为天猫销量与年份之间存在函数关系,一元二次,一元三次 import numpy as npimport matplotlib.pyplot as plt %matplotlib inline y ...
- 【数据挖掘】-KNN算法+sklearn代码实现(六)
目录 介绍算法的例子 KNN算法原理 KNN算法的关键: 算法的优点: 算法的缺点: 关于k值的选取 代码实现 总结 KNN(K-Nearest Neighbor)最邻近分类算法是数据挖掘分类(cla ...
- 算法手撕代码11~15
深度学习/机器视觉/数字IC/FPGA/算法手撕代码目录总汇 目录 1.二叉树的深度 2.对称的二叉树 3.构建乘积数组 4.复杂链表的复制
- 11选5c语言代码,11选5中“胆”存秘籍 三绝招助彩民有所斩获
图集 今年以来,利用"2胆全拖"方式投注"11选5"任选三的彩民越来越多,那么什么是"2胆全拖".如何运用"2胆全拖"进 ...
- sklearn代码18 python自动化处理数据
import numpy as npimport pandas as pdfrom pandas import Series,DataFrameimport matplotlib.pyplot as ...
- DIV+CSS最常用的网页布局代码11例。
转载自品略图书馆 http://www.pinlue.com/article/2019/03/2104/598296899335.html div css布局不同于table布局,它主要是按列来计算, ...
- 【常用代码11】js关闭当前页面,关闭当前浏览器窗口。
js版 window.open('','_self');window.close(); 可以放在a标签里面 <a href="javascript:window.opener=null ...
最新文章
- javascript模块化、模块加载器初探
- 机器人学习--网友资料系列 激光SLAM建图、粒子滤波定位和位姿图优化
- efcore 新特性 SaveChanges Events
- python判断字符串结尾-字符串#69301_27种Python字符串操作方法大全
- Spring Cloud 微服务下的权限解决方案
- 超市称秤小票用计算机怎么算,电脑收银系统如何连接电子条码秤
- chrome 安装 gliffy插件以及使用
- latex表格排版指南
- 数据治理:携程度假的数据治理实践
- git pull更新不到最新代码
- 云免停机卡免流服务器监控
- 秋名山老司机从上车到翻车的悲痛经历,带你深刻了解什么是Spark on Hive!
- 秒解UTF-8带来的烦恼
- android --------- Android10系统上访问本地相机下的视频文件报错 /storage/emulated/0/DCIM/Camera/ open failed: EACCES
- iphone传输 android,安卓苹果数据互传,三种方法教你怎样把iPhone数据迁移到安卓手机...
- 压缩感知稀疏基之离散余弦变换(DCT)和离散正弦变换(DST)
- SourceTree系列5:贮藏和修复Bug
- 卡尔曼滤波 预测与测量我们更应该相信谁?
- unittest.defaultTestLoader.discover实现在运行时运行用例
- Python 爬取百度 搜索风云榜 新闻并 自动推送 到邮箱