• 应当选择哪一种距离度量方式?KNN K值如何确定?也即如何确定超参。

    • problem-dependent,具体问题具体分析;
    • try what hyperparameters work best on test set.
      • 并非是一个好主意,测试集(模型还未见过的数据)最好的用途在于作为模型泛化能力的评价,应当十分节俭地使用;

0. 数据集的切分

可采用如下方式对数据集进行切分:


1. NN ⇒ Classification

注意区分,NN(Nearest Neighbor)和 KNN,前一个是最近邻,后一个是前 K 近邻;

  • train(X, y):无序训练,模型不需要参数
  • predict(X):逐一计算和训练集 X 每一个元素距离的大小,
    取最近的元素的 label,作为自己的 label

分类的速度随着训练集规模的变化:Linearly;对于现实应用而言,test 的时间性能更为看重。CNN 的一大好处就在于,

  • expensive training
  • cheap test evaluation

机器学习算法的流程总结相关推荐

  1. 人工智能概述、人工智能发展历程、人工智能主要分支、机器学习工作流程、完整机器学习项目的流程、机器学习算法分类、独立同分布、模型评估、深度学习简介

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 1.1 人工智能概述 1 人工智能应用场景 2 人工智能小案例 ...

  2. 机器学习算法原理系列篇4:建模流程(上)

    精彩人工智能相关文章,微信搜索  : robot-learner , 或扫码 机器学习建模流程涉及到几个重要的步骤,如下图所示.在下面的篇章中,我们就每一个步骤展开讨论. 数据收集 获得有效的数据是建 ...

  3. 机器学习算法基本工作流程

    数据科学家 - 主要步骤 观察大局 获得数据 从数据探索和可视化中获得洞见 机器学习算法的数据准备 选择和训练模型 微调模型 展示解决方案 启动.监控和维护系统 观察大局 获取明确的目标任务 明确目标 ...

  4. 机器学习——算法分类以及开发流程

    目录 机器学习算法的判别依据 数据类型 数据类型的不同应用 机器学习开发流程 1.原始数据 2.数据的基本处理 3.特征工程 4.找到合适的算法进行预测 5.模型评估--判定模型效果 6.上线使用 机 ...

  5. 机器学习算法易受攻击?阿里“安全基建”这样应对AI的不安全

    出品 | AI科技大本营(ID:rgznai100) 数字基建的浪潮之下,诸多行业领域都在加速融合5G.大数据中心.AI等新技术,向数字化转型.近日,多位全国政协委员.院士和安全行业专家提出,应尽快出 ...

  6. 数学推导+纯Python实现机器学习算法:GBDT

    Datawhale推荐 作者:louwill,Machine Learning Lab 时隔大半年,机器学习算法推导系列终于有时间继续更新了.在之前的14讲中,笔者将监督模型中主要的单模型算法基本都过 ...

  7. 有必要将所有机器学习算法都实现一遍吗?

    点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 来源:知乎 整理:louwill 链接:https://www.zhihu.com/q ...

  8. 知乎讨论:有必要将所有机器学习算法都实现一遍吗?

    观点分享 来源:知乎 整理:louwill 链接:https://www.zhihu.com/question/36768514 作者:微调 https://www.zhihu.com/questio ...

  9. 有没有必要把机器学习算法自己实现一遍?

    编辑:机器学习算法与自然语言处理-忆臻,Charlotte数据挖掘-小杜https://www.zhihu.com/question/36768514 作者:微调 https://www.zhihu. ...

最新文章

  1. 【小白的CFD之旅】20 计算区域的构建
  2. 安装lua及问题解决
  3. mysql interval 3 day_Mysql之INTERVAL与DATE_SUB与EXTRACT函数的使用
  4. 【翻译】C#表达式中的动态查询
  5. 织梦cms第四版仿七猫技术导航源码 附安装教程
  6. VB 自启动建立右键菜单
  7. 【NOIP2016】【Luogu1909】买铅笔(模拟)
  8. 易语言解析html实例,易语言解析JSON教程
  9. 教你如何用R进行数据挖掘
  10. C#使用AForge连接摄像头并且拍照
  11. 如何在 think-cell 瀑布图中并行汇总多个系列?
  12. ps保存psd后图层全没了_Photoshop文件不显示图层
  13. js实现复制input隐藏域的取巧做法
  14. mysql the cabinet_mysql 一个较特殊的问题:You can’t specify target table ‘wms_cabinet_form’ | 很文博客...
  15. 加湿器-香薰机的设计方案(单片机程序+PCB)超声波震荡方式 原理图+PCB+源代码+详细设计说明
  16. BLE传输速率以及抓包工具
  17. Vue-GoogleMap (一)实时定位
  18. LeetCode20.有效的括号——纯C
  19. 揭秘郭台铭兄弟开店计划 苹果中国渠道裂变
  20. php用什么打开_我的php文件怎么打开_如何打开php文件的办法

热门文章

  1. 【java学习之路】(java SE篇)(练习)集合练习:经典例题
  2. java线程释放_Java多线程出现异常会自动释放锁
  3. HBase之Rowkey设计总结与实战篇
  4. java中$和 的区别详解_MyBatis中#{}和${}的区别详解
  5. 数值方法与计算机算法试卷,《数值方法与计算机算法》课程教学大纲.pdf
  6. C++设计模式之Strategy(策略模式)
  7. redis源码剖析(5):基础数据结构inset
  8. leetcode 509. 斐波那契数(Fibonacci Number)
  9. CentOS Bash 命令补全增强软件包 bash-completion
  10. 吴恩达深度学习笔记(十一)—— dropout正则化