人工智能项目开发规划与准备
目录
1、发现与明确问题
2、人工智能项目的开发周期
3、数据准备
4、特征工程
4.1特征工程是什么
4.2 特征工程的基本方法
1、发现与明确问题
技术角度:需要思考AI系统性能能达到预期吗?需要多少数据?能获取到足够数据吗?需要多长时间?
业务角度:要解决什么问题?商业目的是什么?
对数据进行分析,一般通过使用适当的统计、机器学习、深度学习等方法、对收集的大量数据进行计算,汇总与整理,以求最大化的开发数据价值,发挥数据作用。
2、人工智能项目的开发周期
3、数据准备
数据准备的流程:数据采集-->数据清洗--->数据标注--->数据验收---->数据交付
数据采集方法:
观测数据、人工收集、调查问卷、线上数据库
数据清洗:
有缺失的数据、有重复的数据、有内容错误的数据(逻辑/格式...)、不需要的数据
数据标注:
数据标注即通过分类、画框、标注、注释等,对图片、语音、文本等数据进行处理,标记对象的特征,以作为机器学习标签的过程。
数据划分:
数据标注后需要划分为训练集与测试集。拆分比例根据具体任务决定,通常训练集的比重较大,一个可能的划分比例是:训练集数据数量:测试集数据数量=8:2
训练集:用于完成模型训练任务
测试集:用于对模型的泛化效果进行检验。
数据验收:
合法性:数据符合定义的业务规则或约束的程度
准确性:数据接近真实值的程度
完整性:所有必须数据的已知程度
一致性:数据在同一数据集内或跨多个数据集的一致程度
数据管理:
数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程。其目的在于充分有效的发挥数据的作用,实现数据有效管理的关键是数据组织。
与数据相关的问题:
数据不足、数据隐私泄露、分类质量低、数据质量低
4、特征工程
4.1特征工程是什么
特征工程是指从原始数据转换为特征向量的过程。特征工程是机器学习中最重要的起始步骤,会直接影响机器学习的效果,通常需要大量的时间来完成。数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。
4.2 特征工程的基本方法
特征选择:
从给定的特征集合中选出相关特征子集的过程称为特征选择。去除无关特征可以降低学习任务的难度,也同样让模型变得简单,降低计算复杂度。抛弃这部分信息一定程度上会降低模型的性能,但这也是计算复杂度和模型性能之间的取舍。
特征提取:
特征提取( feature extraction )一般是在特征选择之前,它提取的对象是原始数据,目的就是自动地构建新的特征,将原始数据转换为一组具有明显物理意义(比如Gabor、几何特征、纹理特征)或者统计意义的特征。
特征构建:
特征构建( feature construction)指从原始数据中人工的构建新的特征。需要花时间去观察原始数据,思考问题的潜在形式和数据结构,对数据敏感性和机器学习实战经验能帮助特征构建。
人工智能项目开发规划与准备相关推荐
- 2.1 人工智能项目开发与规划
2.1 人工智能项目开发与规划 人工智能项目开发的目标:发现与明确问题 技术角度:需要思考AI系统性能能达到预期吗,需要多少数据,能否获取足够的数据,需要多久的时间 业务角度:需要解决什么问题,商业目 ...
- 2.4 人工智能项目开发与验收
2.4 人工智能项目开发与验收 模型性能评估与测试 分类任务的评价指标: 评价指标:评价指标的选择会影响如何比较和测量算法的性能 泛化性:从目标领域内的训练数据到任意其他数据上的性能良好 准确率:正确 ...
- python人工智能项目开发实例-人工智能学习路线图,整理近200个实战案例与项目...
Created by 唐宇迪 人工智能实战就业(面试)学习路线图 这个项目是干什么的? 整理这个项目的初衷是方便同学们快速开启人工智能自学计划,在学习过程中少走弯路用最快的效率入门Ai并开始实战项目, ...
- 美国中央情报局CIA正通过开发人工智能项目,收集与检索社交媒体情报
据外媒 9 月 11 日报道,美国中央情报局( CIA )正通过开发人工智能程序访问.收集与检索社交媒体情报. 美国 CIA 技术开发副主任 Dawn Meyerriecks 在情报与国家安全峰会上发 ...
- Java语言开发在线购物推荐网 购物商城推荐系统 基于用户、物品的协同过滤推荐算法 SSM(Spring+SpringMVC+Mybatis)开发框架 大数据、人工智能、机器学习项目开发
Java语言开发在线购物推荐网 购物商城推荐系统 基于用户.物品的协同过滤推荐算法 SSM(Spring+SpringMVC+Mybatis)开发框架 大数据.人工智能.机器学习项目开发ShopRec ...
- Java语言开发在线音乐推荐网 音乐推荐系统 网易云音乐爬虫 基于用户、物品的协同过滤推荐算法 SSM(Spring+SpringMVC+Mybatis)框架 大数据、人工智能、机器学习项目开发
Java语言开发在线音乐推荐网 音乐推荐系统 网易云音乐爬虫 基于用户.物品的协同过滤推荐算法 SSM(Spring+SpringMVC+Mybatis)框架 大数据.人工智能.机器学习项目开发Mus ...
- FPGA项目开发之时钟规划
FPGA项目开发之时钟规划 当我刚开始我的FPGA设计生涯时,我对明显更小.更不灵活的 FPGA(想想 XC4000XL / Clcyone3/4和 Spartan)和工具的非常简单的时钟规则之一是尽 ...
- 使用Java+SSM(Spring+SpringMVC+Mybatis)开发在线美食推荐网 美食推荐系统 美食天下美食爬虫 基于用户、物品的协同过滤推荐算法实现 大数据、人工智能、机器学习项目开发
使用Java+SSM(Spring+SpringMVC+Mybatis)开发在线美食推荐网 美食推荐系统 美食天下美食爬虫 基于用户.物品的协同过滤推荐算法实现 大数据.人工智能.机器学习项目开发Fo ...
- Java开发在线购物推荐网 购物商城推荐系统 基于用户、物品的协同过滤推荐算法 京东商城爬虫 SSM(Spring+SpringMVC+Mybatis)开发框架 大数据、人工智能、机器学习项目开发
Java开发在线购物推荐网 购物商城推荐系统 基于用户.物品的协同过滤推荐算法 京东商城爬虫 SSM(Spring+SpringMVC+Mybatis)开发框架 大数据.人工智能.机器学习项目开发Sh ...
最新文章
- 九 configparser模块
- Gzip,BZip2,Lzo,Snappy比较
- 如何求matlab的in(2.0375),东南大学Matlab作业1.doc
- 线性调频信号与脉冲压缩
- Discuz X3.4版块规则支持html代码修改
- 思岚A1M8激光雷达-ubuntu18.04-slam建图参考
- JS怎么获取当月最后一天
- 基于stm32无线充电器设计
- VB6 MsgBox 函数
- 二叉排序树中查找效率最高的是
- 最新爱词霸 Java + mysql (含源码+数据库)
- 四平方和定理 leetcode279 c++
- ElasticSearch 亿级数据检索深度优化
- JVM 栈分配与TLAB
- ibm服务器进不去系统怎么回事,IBM X3400服务器故障开机进不去系统
- psu计算机测试,「电脑维修」电源的检测(使用电源测试器)
- 下一半***清除全集
- 我是主考官7:他为什么没有被录取
- zookeeper windows 入门安装和测试
- drupal8 存取session
热门文章
- CSP认证201703-3	Markdown[C++题解]:字符串处理、模拟
- 《算法竞赛进阶指南》打卡-基本算法-AcWing 99. 激光炸弹:二维前缀和
- 中国人民大学《组织行为学》_12怎样让员工快速融入群体?
- c语言prog.c: in function 'main':,C语言 tr1 :: function和tr1 :: bind
- Linux信号 一 信号可靠性与分类
- java编写学生管理系统_Java实现学生管理系统
- php下dat函数e,PHP 常用函数记录 一
- u盘排序软件_总有一款U盘适合你
- 图综合练习--拓扑排序_03 数据结构与算法 - 排序
- java逻辑代码_Java逻辑代码判断字数