机器学习系列(一)—— 绪言
目录
- 一、序言
- 二、机器学习简介
- 1、机器学习
- 2、机器学习和人工智能
- 2.1 人工智能、机器学习、神经网络和深度学习的关系如下:
- 2.2 机器学习的分类:
- 2.3 机器学习关注的问题
- 2.3.1 分类问题
- 2.3.2 回归问题
- 2.3.3 聚类问题
- 三、机器学习的应用
- 3.1 计算机视觉
- 3.2 自然语言处理
- 3.3 社会网络分析
- 3.4 推荐
- 四、机器学习的步骤
- 五、学习路线
一、序言
刚进入研一,目前正在学习机器学习相关课程,从本篇博客开始记录学习历程,和大家一起共同学习进步!在学习之前,最好有数学基础(高等数学、线性代数和概率论数理统计)和Python基础。如果没学过Python可以到这里学习 => 《Python菜鸟教程》。由于本人为初学者,若在内容上有不当之处,还请各位前辈和同学帮忙指出。
二、机器学习简介
1、机器学习
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
它是人工智能的核心,是使计算机具有智能的根本途径。
机器学习是一类算法的统称,机器学习方法是计算机利用已有的数据(经验),得出了某种模型(规律),并利用此模型预测未来(结果)的一种方法。
2、机器学习和人工智能
2.1 人工智能、机器学习、神经网络和深度学习的关系如下:
2.2 机器学习的分类:
- 有监督学习:分类和回归属于监督学习,这类算法必须知道预测什么。即目标变量的分类信息。(分类问题、回归问题属于有监督学习)
- 无监督学习:此时数据没有类别信息,也不会给定目标值。(聚类问题属于无监督学习)
- 强化学习:又称增强学习,通过与环境进行交互来学习解决问题的一类算法。
2.3 机器学习关注的问题
2.3.1 分类问题
划分有限个类别,根据数据样本的特征,判断属于哪一个类别。常见的如:(1)垃圾邮件分类 (2)图像分类 (3)文字识别
2.3.2 回归问题
根据数据样本上抽取出的特征,预测一个连续值的结果。常见的如:股票走势、房价走势等
2.3.3 聚类问题
根据数据样本上抽取出的特征,让样本抱抱团(相近/相关的样本在一团内)。如:用户群体划分和新闻分类。
三、机器学习的应用
3.1 计算机视觉
典型的应用包括:人脸识别、车牌识别、扫描文字识别、图片内容识别、图片搜索等等。
3.2 自然语言处理
典型的应用包括:搜索引擎智能匹配、文本内容理解、文本情绪判断,语音识别、输入法、机器翻译等等。
3.3 社会网络分析
典型的应用包括:用户画像、网络关联分析、欺诈作弊发现、热点发现等等。
3.4 推荐
典型的应用包括:虾米音乐的“歌曲推荐”,某宝的“猜你喜欢”等等。
四、机器学习的步骤
本部分来自CSDN博主zxhohai
通常学习一个好的函数,分为以下三步:
1、选择一个合适的模型,这通常需要依据实际问题而定,针对不同的问题和任务需要选取恰当的模型,模型就是一组函数的集合。
2、判断一个函数的好坏,这需要确定一个衡量标准,也就是我们通常说的损失函数(Loss
Function),损失函数的确定也需要依据具体问题而定,如回归问题一般采用欧式距离,分类问题一般采用交叉熵代价函数。
3、找出“最好”的函数,如何从众多函数中最快的找出“最好”的那一个,这一步是最大的难点,做到又快又准往往不是一件容易的事情。常用的方法有梯度下降算法,最小二乘法等和其他一些技巧(tricks)。
学习得到“最好”的函数后,需要在新样本上进行测试,只有在新样本上表现很好,才算是一个“好”的函数。
开发机器学习应用程序的步骤:(Step 4 -5为核心)
- 收集数据
- 准备输入数据 =>为算法准备特定的数据格式
- 分析输入数据 =>确保数据集中没有垃圾数据
- 训练算法 =>从输入数据中抽取知识和信息
- 测试算法 =>
- 使用算法 => 将机器学习算法转化成应用程序,执行实际任务
五、学习路线
0.math (数学基础)1.python-basic (python基础)2.numpy(numpy基础)3.pandas(pandas基础)4.scipy(scipy基础)5.data-visualization(数据可视化基础,包含matplotlib和seaborn)6.scikit-learn(scikit-learn基础)7.machine-learning(机器学习基础)8.deep-learning(深度学习基础)9.feature-engineering(特征工程基础)
机器学习系列(一)—— 绪言相关推荐
- 机器学习系列18:核函数
https://www.toutiao.com/a6700783341630652931/ 机器学习系列18:核函数 让我们来考虑这样一个问题,现在给定一个数据集,让你划分出决策边界,该怎么办呢?数据 ...
- 机器学习系列19:将核函数应用于支持向量机
https://www.toutiao.com/a6701463387273953806/ 机器学习系列19:将核函数应用于支持向量机 当我们在已知参数的情况下,如何用带有核函数的支持向量机(SVM) ...
- 机器学习系列16:机器学习系统设计
https://www.toutiao.com/a6700782123118232068/ 机器学习系列16:机器学习系统设计 偏斜分类的误差评估 举个例子,我们想训练一个模型去诊断患者是否患有癌症. ...
- 人工智能 机器学习系列 2:代价函数
机器学习系列 2:代价函数 现在我有一些数据集,就像上图中的叉.那么我想通过一次函数也叫线性回归函数(一条直线)去拟合这些数据,一次函数在没有确定之前,应该是这个样子的: 其中 θ0 和 θ1 都是未 ...
- 机器学习系列 1:监督学习和无监督学习
https://www.toutiao.com/a6690813539747103246/ 2019-05-15 09:31:00 机器学习系列 1:监督学习和无监督学习 机器学习就是通过一大堆数据集 ...
- 机器学习系列之EM算法
机器学习系列之EM算法 我讲EM算法的大概流程主要三部分:需要的预备知识.EM算法详解和对EM算法的改进. 一.EM算法的预备知识 1.极大似然估计 (1)举例说明:经典问题--学生身高问题 我们需要 ...
- k近邻法matlab_机器学习系列(一)K近邻算法(KNN,KNearestNeigh
本文源自微信公众号[Python编程和深度学习]原文链接:机器学习系列(一)K-近邻算法(KNN,K-Nearest-Neighbor),欢迎扫码关注鸭! 目录 一.算法概述 二.Python代码 三 ...
- 阿里巴巴机器学习系列课程
亲爱的同学们,福利来临!随着机器学习领域的发展越来越火,阿里云机器学习PAI为广大机器学习爱好的学生提供免费的一站式算法平台,该平台提供上百种算法,并且兼容TensorFlow.Caffe.MXNET ...
- 机器学习系列(8)_读《Nature》论文,看AlphaGo养成
机器学习系列(8)_读<Nature>论文,看AlphaGo养成 标签: 机器学习算法深度学习神经网络蒙特卡罗树搜索 2016-03-16 11:23 17843人阅读 评论(8) 收藏 ...
- 机器学习系列(2)_从初等数学视角解读逻辑回归
作者:龙心尘 && 寒小阳 时间:2015年10月. 出处:http://blog.csdn.net/longxinchen_ml/article/details/49284391 ...
最新文章
- KDD 2021 即将开幕!当线上 AI 顶会开始内卷.....
- 解决Python通过pip安装报错:(有图)Could not install packages due to an EnvironmentError: HTTPSConnectionPool
- 通俗理解注意力机制中的Q、K和V表示的具体含义
- Codeforces 446C —— DZY Loves Fibonacci Numbers(线段树)
- 十五天精通WCF——第十四天 一起聊聊FaultException
- 【面试招聘】有哪些好的秋招经验分享?数据、算法岗的几点经验分享
- OpenJudge NOI 1.8 25:螺旋加密
- css多行文本溢出显示省略号(兼容ie)
- 查询排序_MySQL查询性能优化
- 打开一个页面,并监听该页面的关闭事件
- 使用HeartBeat实现高可用HA的配置过程详解
- python元素定位_Python自动化中的元素定位(一)
- asp.net session 超时设置
- 鹰眼系统原理_飞思卡尔智能车一:山外鹰眼摄像头使用原理
- 微搭低代码小程序模板体验
- 测绘资质分级标准-工程测量、界线与不动产测绘
- Canvas实用库收藏
- 镭速(Raysync)文件传输高可用安装部署介绍!
- 实习心得体会之JDBC操作21090712
- 2022 年超详细过程步骤讲解 CentOS 7 安装Maven。以及Mavne配置文件的修改