目录

1、发现与明确问题

2、人工智能项目的开发周期

3、数据准备

4、特征工程

4.1特征工程是什么

4.2 特征工程的基本方法


1、发现与明确问题

技术角度:需要思考AI系统性能能达到预期吗?需要多少数据?能获取到足够数据吗?需要多长时间?

业务角度:要解决什么问题?商业目的是什么?

对数据进行分析,一般通过使用适当的统计、机器学习、深度学习等方法、对收集的大量数据进行计算,汇总与整理,以求最大化的开发数据价值,发挥数据作用。

2、人工智能项目的开发周期

3、数据准备

数据准备的流程:数据采集-->数据清洗--->数据标注--->数据验收---->数据交付

数据采集方法:

观测数据、人工收集、调查问卷、线上数据库

数据清洗:

有缺失的数据、有重复的数据、有内容错误的数据(逻辑/格式...)、不需要的数据

数据标注:

数据标注即通过分类、画框、标注、注释等,对图片、语音、文本等数据进行处理,标记对象的特征,以作为机器学习标签的过程。

数据划分:

数据标注后需要划分为训练集与测试集。拆分比例根据具体任务决定,通常训练集的比重较大,一个可能的划分比例是:训练集数据数量:测试集数据数量=8:2

训练集:用于完成模型训练任务

测试集:用于对模型的泛化效果进行检验。

数据验收:

合法性:数据符合定义的业务规则或约束的程度

准确性:数据接近真实值的程度

完整性:所有必须数据的已知程度

一致性:数据在同一数据集内或跨多个数据集的一致程度

数据管理:

数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程。其目的在于充分有效的发挥数据的作用,实现数据有效管理的关键是数据组织。

与数据相关的问题:

数据不足、数据隐私泄露、分类质量低、数据质量低

4、特征工程

4.1特征工程是什么

特征工程是指从原始数据转换为特征向量的过程。特征工程是机器学习中最重要的起始步骤,会直接影响机器学习的效果,通常需要大量的时间来完成。数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。

4.2 特征工程的基本方法

特征选择:

从给定的特征集合中选出相关特征子集的过程称为特征选择。去除无关特征可以降低学习任务的难度,也同样让模型变得简单,降低计算复杂度。抛弃这部分信息一定程度上会降低模型的性能,但这也是计算复杂度和模型性能之间的取舍。

特征提取:

特征提取( feature extraction )一般是在特征选择之前,它提取的对象是原始数据,目的就是自动地构建新的特征,将原始数据转换为一组具有明显物理意义(比如Gabor、几何特征、纹理特征)或者统计意义的特征。

 特征构建:

特征构建( feature construction)指从原始数据中人工的构建新的特征。需要花时间去观察原始数据,思考问题的潜在形式和数据结构,对数据敏感性和机器学习实战经验能帮助特征构建。

人工智能项目开发规划与准备相关推荐

  1. 2.1 人工智能项目开发与规划

    2.1 人工智能项目开发与规划 人工智能项目开发的目标:发现与明确问题 技术角度:需要思考AI系统性能能达到预期吗,需要多少数据,能否获取足够的数据,需要多久的时间 业务角度:需要解决什么问题,商业目 ...

  2. 2.4 人工智能项目开发与验收

    2.4 人工智能项目开发与验收 模型性能评估与测试 分类任务的评价指标: 评价指标:评价指标的选择会影响如何比较和测量算法的性能 泛化性:从目标领域内的训练数据到任意其他数据上的性能良好 准确率:正确 ...

  3. python人工智能项目开发实例-人工智能学习路线图,整理近200个实战案例与项目...

    Created by 唐宇迪 人工智能实战就业(面试)学习路线图 这个项目是干什么的? 整理这个项目的初衷是方便同学们快速开启人工智能自学计划,在学习过程中少走弯路用最快的效率入门Ai并开始实战项目, ...

  4. 美国中央情报局CIA正通过开发人工智能项目,收集与检索社交媒体情报

    据外媒 9 月 11 日报道,美国中央情报局( CIA )正通过开发人工智能程序访问.收集与检索社交媒体情报. 美国 CIA 技术开发副主任 Dawn Meyerriecks 在情报与国家安全峰会上发 ...

  5. Java语言开发在线购物推荐网 购物商城推荐系统 基于用户、物品的协同过滤推荐算法 SSM(Spring+SpringMVC+Mybatis)开发框架 大数据、人工智能、机器学习项目开发

    Java语言开发在线购物推荐网 购物商城推荐系统 基于用户.物品的协同过滤推荐算法 SSM(Spring+SpringMVC+Mybatis)开发框架 大数据.人工智能.机器学习项目开发ShopRec ...

  6. Java语言开发在线音乐推荐网 音乐推荐系统 网易云音乐爬虫 基于用户、物品的协同过滤推荐算法 SSM(Spring+SpringMVC+Mybatis)框架 大数据、人工智能、机器学习项目开发

    Java语言开发在线音乐推荐网 音乐推荐系统 网易云音乐爬虫 基于用户.物品的协同过滤推荐算法 SSM(Spring+SpringMVC+Mybatis)框架 大数据.人工智能.机器学习项目开发Mus ...

  7. FPGA项目开发之时钟规划

    FPGA项目开发之时钟规划 当我刚开始我的FPGA设计生涯时,我对明显更小.更不灵活的 FPGA(想想 XC4000XL / Clcyone3/4和 Spartan)和工具的非常简单的时钟规则之一是尽 ...

  8. 使用Java+SSM(Spring+SpringMVC+Mybatis)开发在线美食推荐网 美食推荐系统 美食天下美食爬虫 基于用户、物品的协同过滤推荐算法实现 大数据、人工智能、机器学习项目开发

    使用Java+SSM(Spring+SpringMVC+Mybatis)开发在线美食推荐网 美食推荐系统 美食天下美食爬虫 基于用户.物品的协同过滤推荐算法实现 大数据.人工智能.机器学习项目开发Fo ...

  9. Java开发在线购物推荐网 购物商城推荐系统 基于用户、物品的协同过滤推荐算法 京东商城爬虫 SSM(Spring+SpringMVC+Mybatis)开发框架 大数据、人工智能、机器学习项目开发

    Java开发在线购物推荐网 购物商城推荐系统 基于用户.物品的协同过滤推荐算法 京东商城爬虫 SSM(Spring+SpringMVC+Mybatis)开发框架 大数据.人工智能.机器学习项目开发Sh ...

最新文章

  1. 九 configparser模块
  2. Gzip,BZip2,Lzo,Snappy比较
  3. 如何求matlab的in(2.0375),东南大学Matlab作业1.doc
  4. 线性调频信号与脉冲压缩
  5. Discuz X3.4版块规则支持html代码修改
  6. 思岚A1M8激光雷达-ubuntu18.04-slam建图参考
  7. JS怎么获取当月最后一天
  8. 基于stm32无线充电器设计
  9. VB6 MsgBox 函数
  10. 二叉排序树中查找效率最高的是
  11. 最新爱词霸 Java + mysql (含源码+数据库)
  12. 四平方和定理 leetcode279 c++
  13. ElasticSearch 亿级数据检索深度优化
  14. JVM 栈分配与TLAB
  15. ibm服务器进不去系统怎么回事,IBM X3400服务器故障开机进不去系统
  16. psu计算机测试,「电脑维修」电源的检测(使用电源测试器)
  17. 下一半***清除全集
  18. 我是主考官7:他为什么没有被录取
  19. zookeeper windows 入门安装和测试
  20. drupal8 存取session

热门文章

  1. CSP认证201703-3 Markdown[C++题解]:字符串处理、模拟
  2. 《算法竞赛进阶指南》打卡-基本算法-AcWing 99. 激光炸弹:二维前缀和
  3. 中国人民大学《组织行为学》_12怎样让员工快速融入群体?
  4. c语言prog.c: in function 'main':,C语言 tr1 :: function和tr1 :: bind
  5. Linux信号 一 信号可靠性与分类
  6. java编写学生管理系统_Java实现学生管理系统
  7. php下dat函数e,PHP 常用函数记录 一
  8. u盘排序软件_总有一款U盘适合你
  9. 图综合练习--拓扑排序_03 数据结构与算法 - 排序
  10. java逻辑代码_Java逻辑代码判断字数