一次函数+机器学习入门
【欢迎加我的qq:1047495710交流机器学习】
在机器学习的线性回归或者分类中,我们需要用到一次函数。
接下来,我们用案例来说明,何为一次函数,他是怎么样为我们服务并且解决我们的问题的。
今天天气风和日丽,葱油饼走在马路上,看着远处的房子不由的感叹,这美妙的城市何时能有我的一席之地。
说这时巧那时快,一个金光闪闪的小木屋就出现在他的面前,并且标价1万元RMB。
葱油饼一看眼泪就下来了,这不就是我梦想的家?那个不需要多大的地方?
他一看,这户房间正在装修,显然早已经被人买走了。
但是怀顾四周,远处居然有一排排的金色小木屋,赫然都是葱油饼的梦中豪宅,但是这些房子都没有标价,这可把葱油饼急坏了。
但是这个时候,天空一股狂风而过,飘来一张广告单,赫然是面前这个小区的出售广告。
葱油饼兴奋不已,但是他看了一眼,却发现这个广告单被撕成了两半,只有比面前的小木屋更贵的大木屋,和更小的小小木屋。
他该怎么知道他的木屋是多少钱呢?
下面就是广告单:
面积 | 价格 | |
大木屋 | 400 | 2400000 |
中木屋 | 200 | 1200000 |
小小木屋 | 50 | 300000 |
小木屋 | 100 | ???? |
他看了看,拿起纸笔,略微计算,通过价格除以面积,得到了每平米的价格都为6000RMB,然后用每平米的价格乘100平米,也就是小木屋的面积,得到小木屋的价格,为600000RMB。
这里,葱油饼完成了最简单的单变量函数,也就是最简单的一次函数。
y=6000x
也就是
价格=6000乘以面积
这里y代表价格,x代表面积,6000代表每平米的价格。
这是葱油饼发现的计算房价的单变量一次函数。
但是这个小木屋居然价值60万,可不是葱油饼可以负担得起的,于是他想看看有没有更加便宜,但是类似面前的金色小木屋的房子。
可是大部分中介为了赚钱,都不会将房子的价格标明,只等你询问后,报给你一个虚高的价格,而真实的价格,需要你自己去探索。
于是葱油饼去找了很久,用38平台,百饼网,找了很久,终于在饼城的郊区找到了他的梦想豪宅,但是他的梦想豪宅是刚开的楼盘,房子还没开始售卖,焦急的葱油饼想知道,这里的房子大概多少钱,这样他就敢交定金了。
于是他搜索了附近类似的房子,用来预测眼前的房子的价格。
但是很悲剧的是,他发现,之前的公式貌似不能用了,这是为什么呢?
他之前的房价是这样子的数据关系。
房面积和价格是等比例关系,也就是说,知道房面积便可以知道价格了。
但是附近的房子,却价格不是这样。
面积 | 价格 | |
50 | 154000 | |
100 | 526000 | |
200 | 912000 | |
300 | 1201000 |
他们用线形图来表示,就很明显的表示了他们的价格是起伏不定的。
葱油饼套用之前的公式,发现了之前的公式并不能很好的预测目前的数据。
他将第一个公式的计算结果都用线段连接起来,发现和第二个数据的数据几乎没有重合,这就表示预测失败啦。
你看,蓝色的线条代表我们用第一次的公式,计算的时候,得到的结果,然后串联成为一条线,也就是每个x对应的结果,成为一条线。
但是利用这个公式计算的线段,代表的数据结果,却并没有和第二次要预测的数据重合,我们知道,这两个数据的x是一样的,50平米,100平米,200平米,300平米,他们的单位是一样的,在x轴的标示也是一样的,相对的,y轴也是一样的,以RMB为单位进行标记。
但是唯一不一样的是,他们的x和y之间的关系不一样,通过之前的数据我们可以清楚的发现,第一个数据,都在一条直线上,可以用直线连接,第二个数据却不可以用直线连接。
我们可以将两个数据都用线连接一下看看。
也就是说第一个公式,不能用在第二个公式上了,我们得想办法寻找一条直线,尽可能的相交与第二个数据的直线,这样我们才能最大程度的预测一个差不多的价格。
我们怎么寻找这条直线呢?
这就是我们要用到的工具了。
一次函数,y=wx+b。
利用这个公式,我们可以在线形图上寻找到我们任何想要的直线,然后预测我们的数据,我们现在得清楚一件事情,线性图表示了x和y的关系,将他们的结果串联,就是他们的线性。
同样的,当一个东西的x值和y值是同一标准,比如我们这个例子中,x轴都是面积,y轴都是价格,我们就能用数学公式进行运算了。
我们观察之前的图。
也就是第二个数据的线性图。
我们需要找一条线,尽可能的贴合这个蓝色线条,在之前的例子我们知道,这条线段代表着数据的关系,所以当我们寻找到一条线和这条线相似,就代表我们找到了可以预测此线条的公式了。
我们就得研究这个蓝色线条的数据关系,来探索我们怎么寻找我们的公式了。
首先,我们看看蓝色线段的起点是50平米对应着154000RMB的价格。
但是其实不论他的面积是多少,起点都是0平米,所以价格也是0人民币,所以我们在前面加上这个线段,完善这个线段的整体。
下面,我们就利用此数据,画一条直线,看看他会怎么样呈现,然后让我们可以尽可能的预测我们想要的房价。
这条黑线,就是我们要找的公式了,他可以让我们预测我们的房价结果,他的线性表示,他很贴近这条蓝色的线。
我们看看,他的起点是什么。
在我的图片中,x轴的刻度很大,0,50,100,但是其实他们是按照尺子的刻度按照数字单位排列的,y轴也是。
在黑线中,他的起点是10w,也就是y轴的0.1,因为我的绘图软件会缩小尺度,方便浏览,其实这里的y轴0.1就是一万人民币的意思。
那就是说,我们的之前的第一次研究的公式。
y=6000x,当x即使等于0的时候,也要让结果为1万。
因为黑线的起点是10万,也就是x为0的时候结果为10000。
我们就让y=6000x+1w。
也就是y=6000x+10000
然后我们研究黑线的x和y的比例关系,发现,y除以x,等于 3000。
最终我们得到了公式y=3000x+10000,就是这条黑线的公式,通过这个公式,葱油饼就可以完美的预测他的房子价格了。
其实这个公式就是y=wx+b
这里的wx依旧是比例的关系,y和x的比例,y是x的多少倍,但是这个b,就决定了这个线条的起点,比如刚才,我们想画一条黑线,他的起点要从10000开始,就需要加一个b。
数学中,这个b叫做截距,也就是当x为0,y轴的起点。
他决定了线段的起点的高度。
wx决定了线段的走向,你应该很懂。
然后你利用公式,将计算的结果在图上一画,然后连接,就出现了一条黑线,他便是你的公式的计算结果连接的,通过他,你就可以预测你的房价啦。
【课程到这里就结束啦,欢迎添加我的qq:1047495710进行机器学习的交流】
另外这是我的某宝店二维码,有单子的请call我,走某宝,不迷路。
一次函数+机器学习入门相关推荐
- python3中多项式创建_机器学习入门之机器学习之路:python 多项式特征生成PolynomialFeatures 欠拟合与过拟合...
本文主要向大家介绍了机器学习入门之机器学习之路:python 多项式特征生成PolynomialFeatures 欠拟合与过拟合,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助. 分享 ...
- python 非线性回归_机器学习入门之菜鸟之路——机器学习之非线性回归个人理解及python实现...
本文主要向大家介绍了机器学习入门之菜鸟之路--机器学习之非线性回归个人理解及python实现,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助. 梯度下降:就是让数据顺着梯度最大的方向,也 ...
- 【机器学习入门】(13) 实战:心脏病预测,补充: ROC曲线、精确率--召回率曲线,附python完整代码和数据集
各位同学好,经过前几章python机器学习的探索,想必大家对各种预测方法也有了一定的认识.今天我们来进行一次实战,心脏病病例预测,本文对一些基础方法就不进行详细解释,有疑问的同学可以看我前几篇机器学习 ...
- 【机器学习入门】(10) 特征工程:特征抽取,字典特征抽取、文本特征抽取,附完整python代码
各位同学好,今天和大家介绍一下python机器学习中的特征工程.在将数据放入模型之前,需要对数据的一些特征进行特征抽取,方法有: (1) 字典特征抽取 DictVectorizer(),(2) 文本特 ...
- matlab 职坐标,机器学习入门之机器学习实战ByMatlab(四)二分K-means算法
本文主要向大家介绍了机器学习入门之机器学习实战ByMatlab(四)二分K-means算法,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助.前面我们在是实现K-means算法的时候,提到 ...
- 十年公务员转行IT,自学AI三年,他淬炼出746页机器学习入门笔记
整理 | Jane 编辑 | Just 出品 | AI科技大本营(ID:rgznai100) 近期,梁劲传来该笔记重大更新的消息.<机器学习--从入门到放弃>这本笔记的更新没有停止,在基于 ...
- 我的机器学习入门清单及路线!
Datawhale干货 作者:桔了个仔,南洋理工大学,Datawhale成员 知乎:https://www.zhihu.com/people/huangzhe 这是我个人的机器学习入门清单及路线,所以 ...
- 吴恩达机器学习入门 2018 高清视频公开,还有习题解答和课程拓展,网友:找不到理由不学!...
贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 机器学习入门课程哪家最强? 斯坦福吴恩达的CS229称第二,恐怕没人敢称第一. 最近,吴恩达在斯坦福的最新CS229 2018课程,已经完 ...
- 计算机书籍-机器学习入门之道
书名:机器学习入门之道 作者:[日]中井悦司 出版社:人民邮电出版社 出版时间:2018年05月 去当当网了解 机器学习商业应用指南 人工智能入门教程 数据科学参考书 代码基于python
最新文章
- matlab julian day,通用的日期格式与儒略日(julian day)格式的互相转换
- Exchange2007 中Send as 与Send on behalf of 讲解
- c++ socket 结构体
- cd返回上一 git_git统计代码量脚本
- 【django】全局上下文
- angular模态框位置_宽带双波束双模态OAM反射阵天线
- python实战,教你用微信每天给女朋友说晚安
- python输出结果每5个换行_python for循环 - python基础入门(11)
- 白鹭引擎写入文字图层方法实例
- 数字电路设计200例_惊险!200米高空,quot;蜘蛛侠quot;救quot;蜘蛛人quot;!
- 小明滚出---响应对象HttpServletResponse和请求对象HttpServletRequest实例
- 微课|《Python编程基础与案例集锦(中学版)》第5章例题讲解(1)
- Zookeeper学习笔记——1 单机版本环境搭建
- 高阶篇:4.1.2)QFDII(设计要求逐层分配给各零件)
- php文件改后缀,php 如何修改文件后缀
- 如何画出一张优秀的架构图(老鸟必备)
- SDIO - 1bit / 4bit V2.0 协议深度解析-简单易懂协议详解
- MapX 简介 (转)
- 基于android的母婴商城app系统
- 拒绝背后黑手的窥探IPC$漏洞大揭秘