景联文科技:为自动驾驶车载语音识别技术提供全方面的数据支持
随着车联网和智能汽车的兴起,越来越多的功能被搭载在汽车上。随着语音识别技术在智能车载领域落地应用越来越成熟,更多司机解放了双手,通过简单的语音指令就可以进行导航、听音乐、控制车窗和空调等设备。
在前不久刚刚举办的华为夏季旗舰新品发布会上出现了汽车作为压轴产品的发布,即AITO品牌的第二款车型——问界M7,Harmony OS智能座舱配备了一个更加智能的语音助手“小艺”。它不但能够实现60秒连续对话,期间不需要额外唤醒,还可分别根据声音来源,识别主驾、副驾和后排的指令。并且为了照顾部分地区的用户,未来小艺还将支持粤语和四川话两种语言命令,解决方言难题。
虽然作为新车标配的车载语音交互在近年来已经取得了很大的发展,但还有很多技术问题可以进行完善和提升。
在现实生活中,智能车载场景中的语音识别会受到各种车内外噪音的干扰,如车内的发动机声、空调声,车外的风声、音乐声等。为了降低噪音对车载语音识别的干扰,众多AI企业开始致力于训练数据的开发和技术的升级,研发出可以排除噪音影响的车载语音系统。使车载语音系统可以在车内外噪音嘈杂的环境中准确识别用户的语音指令。
车载语音识别成功“去噪”的关键在于使用大量车载语音数据用于AI模型的训练和调优,不断训练其语音识别能力。
景联文科技支持车载环境语音数据,覆盖多种车型、天气、道路类型、多种方言及噪音背景语音数据集采集。
针对车载环境语音采集数据量大,工时短的特点,景联文科技配备3年以上语音采集项目管理经验的项目经理和多人采集团队,严格控制关键时间节点;为满足多种音质需求,景联文科技购置各式多种规格类型的录音设备;针对录制时十几个麦克风同时运行,设备容易出现问题的情况,景联文科技对采集人员进行严格培训,一旦发现录音问题就直接叫停相关人员,重新录制,尽可能缩短时间;由于采集规则对地域口音多样性较高,需要在全国范围内建立采集渠道,景联文科技针构建全国27个省市直辖市的数据采集资源网络,及时反馈采集过程遇到的问题并准备多个解决方案。
景联文还提供《800小时麦克风手机采集车载噪音数据》、《1000小时粤语语音采集数据》、《1000小时四川语音采集数据》、《1000小时英语语音采集数据集》、《600小时远场语音数据集》等,为人工智能公司提供算法训练数据支持。
除此之外,景联文支持车载语音采集、粤语采集、四川话采集、多语种采集等;培养了930人的全职标注团队,针对数据定制标注服务建立了先进的数据标注平台,支持语音切割、ASR语音转写、语音情绪判定、声纹识别标注等;大力优化标注平台实现Al数据的全生命周期管理和供应链管理,项目协同,AI人机协同,自定义权限的数据处理能力,将数据处理效率提升8倍以上,赋予AI企业快速处理大规模感知数据的能力;平台拥有实时量化的可视化管理系统,包括数据集管理、项目管理、人员管理、供应链管理等内容;拥有全面的质检流程,能够有效提高人机协作效率,扩大产能,及时调整标注方案,做好逾期风险管控,准确把控数据质量问题;对全职采标团队建立完善的人员培训、管理体系,推出整套AI产业人才培养解决方案,分别开通理论课程、实训课程、结业考试等培养项目,通过理论与实践相结合为行业输送高素质数据采集标注员,推动人工智能在更多垂直场景实现落地应用。
景联文科技严格保障数据质量,总高质量的训练数据助力自动驾驶AI模型更加准确,创造出更加安全的驾乘体验。
景联文科技:为自动驾驶车载语音识别技术提供全方面的数据支持相关推荐
- 景联文科技:为扫地机器人AI训练提供数据采集标注解决方案
扫地机器人细分赛道近年来在家电行业表现尤为强劲,连续两年保持高速增长,奥维云网数据显示,2021年清洁电器全渠道零售额309亿元,同比增长28.9%. 除了行业Top2 科沃斯和石头科技的股价都攀升至 ...
- AI技术升级,景联文科技助力扫地机器人行业加快技术迭代,提供数据采集服务
近年来,机器人相关的产品和企业受到国家层面高度重视.<"十四五"规划和2035年远景目标刚要>指出,推动机器人产业创新发展和顺应居民消费升级趋势成为"十四五& ...
- 2022自动驾驶迎来商业化元年,景联文科技如何打造数据引擎?
2021年,自动驾驶领域格外热闹,互联网大厂.新造车势力和传统企业纷纷进场布局自动驾驶,很多自动驾驶车辆从封闭路测场地走向真实道路.2022年伊始,自动驾驶赛道仍充满速度与激情,伴随着商业化落地的快速 ...
- 景联文科技:数据标注如何在人工智能自动驾驶中发挥作用?
近年来,随着人们需求的推动,自动驾驶汽车领域取得了很多技术性的突破,吸引了越来越多的汽车厂商以及科技力量的投资,汽车智能化.网联化.电动化和共享化的发展趋势对汽车产业带来很多影响,数量的爆炸式增长.硬 ...
- 景联文科技—专业数据采集公司和智能数据管理执行一体化平台
随着人工智能的快速发展,2021年人工智能核心产业规模已达到了1300亿,预计相应规模将于2026年超过6000亿元.人工智能需要数据来建立起智能,特别是机器学习,人工智能用到的数据越多,其获得的结果 ...
- 景联文科技|浅谈常见的语音标注方法
语音标注是数据标注行业中一种比较常见的标注类型. 语音标注的主要工作内容是将语音中包含的文字信息.各种声音"提取"出来,再进行转写或合成,标注后的数据主要用于人工智能,应用在机器学 ...
- 景联文科技助力AI技术场景化落地|数据标注
"当前以机器学习为主的人工智能技术的高速发展主要依赖于底层数据的多样性.作为AI基础层,数据标注有着无法替代的重要性.景联文科技作为专业的数据标注公司,支持数据标注相关业务." 随 ...
- 景联文科技践行企业社会责任,为残障人士提供数据标注员工作岗位
小意坐在电脑屏幕前,给一张张道路图片上的车辆拉框打标签,他正在进行数据标注操作,"人工智能改变世界,谁会改变人工智能?"这就是数据标注员的工作.今年24岁的小意在初中时期遭遇意外, ...
- 提高扫地机器人避障能力,景联文科技提供专业数据采集服务
扫地机器人凭借消费升级和懒人经济相结合,深受消费者们喜爱,市场需求日益增加. GfK中怡康测算数据显示,2022年1-8月,中国扫地机器人市场销售额达到69亿元,在整体清洁电器市场中销售额占比高达39 ...
最新文章
- 拿来就能用!如何用 AI 算法提高安全运维效率?
- Android studio 4.1 不显示光标当前的类名、方法名
- GitLab CI/CD 基础教程(三)
- php与mysql基础教程第二版_PHP 和 MySQL 基础教程(二)
- mybatis学习(21):MySQL 字符串 转换 CAST与CONVERT 函数的用法
- 神经网络中BP(back propagation)到底在干些什么
- Jsp+Ssh+Mysql实现的简单的企业物资信息管理系统
- Python3机器学习工具包基础复习
- python赋值语句的一般格式为_Python语言有什么奇技淫巧?
- 刚被通用收编的这家创业公司,号称能把LiDAR成本降低近100%
- 简述mysql完全备份过程_【SQL】MySQL之使用mysqldump全备份及恢复过程详解_MySQL
- Java构建指定大小文件
- 带你细品Cookie、Session和Token的区别
- 【数字信号】基于matlab DTMF电话拨号音识别【含Matlab源码 218期】
- java 快逸报表_快逸报表V4.0功能说明
- Android 混淆配置
- wordpress 后台 文章管理列表 添加自定义栏
- 通过写《费用明细表》发现写sql的乐趣
- 计算机1M代表什么,1M网速是多少 Mbps是什么意思
- 5大巨头入场瓜分3万亿市场!加密世界vs.互联网史诗战争将打响!
热门文章
- Hankson的趣味题
- javaweb JAVA JSP药品销售管理系统JSP医药销售管理系统JSP购物商城系统JSP电子商务系统JSP购物系统
- Servlet生命周期及请求、响应
- javaScript进阶webAPI web前端api进阶DOM、BOM学习笔记day01
- python 语音转文字_python使用科大讯飞语音合成文字转语音
- 数字锁相放大器,得到的结果与采样率之间的关系
- cimcoeditv5怎样模拟刀路_CimcoEdit5使用教程 Cimco Edit5怎么启动使用
- 历年高考高校录取分数线
- ryu---北向接口(利用socket对外通信)
- 遗传算法求解一元函数最大值||python