随着数字经济时代的到来,数据正在发挥着越来越大的价值,为各行各业的智能化转型提供动能。

12月25日,以“技术驱动,释放数据要素价值”为主题的百度智能云 TechDay 暨百度技术开放日—数据众包专场在北京举行。

百度作为一家深耕人工智能技术多年的公司,同时也是 AI 数据采集和标注的先行者和推动者,百度智能云数据众包依托百度10年 AI 数据经验、领先的产品技术能力和业界最大的数据标注基地,正在为上百家领军企业提供 AI 数据服务,加速产业升级。

数据是人工智能技术发展的“燃料”。在今年,“数据”首次被中央纳入生产要素,这代表数字中国建设再次提速。

百度技术委员会理事长陈尚义表示:“2010年初,百度开始布局人工智能,是国内投入最早、技术最强、布局最完整的人工智能领军企业,也是最懂数据的企业。目前百度智能云数据众包已经成为业界规模最大、品牌和技术最强的 AI 数据服务商,可以为广大的 AI 开发者提供最专业、高质量的一站式数据采集标注等服务。”

百度技术委员会理事长 陈尚义

数据众包模式是群体智能的一种集中体现。北京航空航天大学计算机学院的孙海龙教授分享了面向大数据产业的群体智能遇到的机遇与挑战。

他表示,群体智能是国家新一代人工智能发展规划的核心内容之一,为大数据智能产业发展提供重要的理论与技术支撑。

特别是,数据众包广泛用于大数据感知、收集和分析等,已成为群体智能支撑大数据智能产业的重要形式,但仍面临着群智资源管理、任务调度分配以及结果汇聚等多方面的技术挑战,解决这些挑战性问题迫切需要学术界与产业界的深度合作。

北京航空航天大学计算机学院教授、博士生导师 孙海龙

一站式数据标注服务引领数据产业发展

百度智能云数据众包打造的 AI 数据标注平台,实现数据从采集、接入、清洗、标注,到质量管理、交付等各流程的一站式管理。

数据采集方面,百度智能云采集资源覆盖40多个国家地区,全国8大方言区。百度智能云数据众包已实现到业内最快的人像采集速度,每周可采集人像3万个,采集语音5万条。

数据标注方面,百度智能云数据众包已经形成四大关键能力:支持全场景的数据标注工具、全流程的流程平台管理能力、智能的标注技术以及庞大的资源支撑的能力,能够针对各类 AI 应用场景数据需求,提供一站式 AI 数据服务。

百度智能云数据众包沉淀了70余种数据标注的能力,近十年来已经为百度200多条产品线和业内上百家行业头部客户提供了近5万次 AI 数据服务,正确率最高达到99.99%。

会上,百度智能云数据众包团队揭秘了 AI 数据标注平台的核心技术。数据标注平台由工具平台、资源管理平台和任务分发管理平台组成:

  • 工具平台满足客户语音、图片、视频、文本、3D 点云等全类型、全场景数据标注,支持点、线、框、区域等多种元素拖拽配置,每年支持数千个不同规则项目需求;

  • 资源管理平台与任务分发管理平台,打造从数据接入、任务分配、资源调度、质量审核、任务结算等全流程支撑体系,实现对百万级任务和数十万用户实时管理。

借助机器决策,标注过程实现了人员和数据的自动流转,摆脱了人工干预,兼顾了效率和公平。

针对用户历史标注行为进行深度挖掘,结合百度自身的用户画像能力,系统能自动描绘出全面、精准、多维的用户画像体系,为每一个数据标注项目推荐最合适的标、审人员,确保使用最匹配的人员为客户释放数据最大的价值,在保证质量的同时更兼顾了效率。

数据标注平台以百度智能云 AI、大数据、云计算等能力为底座,基于领域驱动的微服务架构、插件化的微内核架构,保障平台快速高效运行,为客户创造大规模高质量数据标注服务保驾护航。

值得一提的是,百度智能云数据众包不断探索前沿智能标注技术,从0到1,构建强大算法能力。

目前,AI 算法已贯穿标注前、标注中、标注后全流程,广泛应用于预标注、辅助标注、质量检查、人员画像等各环节,累计提升标注效率超60%,标注错误自动检出占比达70%,极大提升标注效率与质量。

AI 辅助的智能标注引入后,实现人体骨骼点标注整体效率提升71%,OCR 的辅助标签效率提升20%,3D 连续帧障碍物预识别单帧效率提升28.8%。

此外,数据众包与百度研究院合作的基于深度学习的三维点云等前沿标注技术持续激发 AI 数据的潜能,目前已在自动驾驶领域取得不俗进展。

首发数据服务与资产管理平台

提效 AI 算法模型迭代

作为此次活动的一大亮点,百度智能云发布了业内首个智能驾驶领域数据服务与资产管理平台,为智能驾驶企业用户提供一体化智能数据服务解决方案。

数据服务与资产管理平台覆盖“数据采集、数据标注、数据管理、模型训练、模型评测”的人工智能开发全生命周期,帮助企业用户围绕数据打造 AI Pipeline,提升 AI 算法模型迭代效率,让数据更好的驱动模型开发。

数据服务与资产管理平台将以领先的数据服务,为客户打造 AI 数据闭环,加速客户数据价值实现。

数字经济时代,数据已经成为关键生产要素。现场的专家一致认为,未来数据质量、数据治理、人才培训、流程标准等将成为 AI 数据服务进一步发展的关键驱动,推动人工智能技术进入大规模应用。

百度智能云数据众包作为行业实践的先行者,将依托“百度(山西)人工智能基础数据产业基地”的专业标注人力,以业界领先的技术实力赋能各行各业,持续释放数据要素的深层价值。

以技术为驱动力,百度智能云数据众包专注做好“AI赋能者”相关推荐

  1. 5年为山西提供超5万岗位,2000万互联网众包用户,百度智能云数据众包高速增长

    新基建浪潮下,作为人工智能的动力和"灵魂",数据服务行业正在高速增长. 6月17日,百度智能云举办线上Techday技术分享日,畅聊AI基础数据服务行业新机遇.新增长和社会价值.百 ...

  2. 百度智能云数据众包,更安全、更优质的数据能力,打造自动驾驶超智“双眼”...

    自动驾驶技术近年来倍受资本和行业市场关注,越来越多的车企.零部件供应商和解决方案供应商投身其中.在资金和政策的双向加持下,行业发展迅猛,几成燎原之势. 而其中最大的技术瓶颈无疑是在感知能力上,除了算法 ...

  3. 领跑的百度智能云数据众包:新基建下再迎关键大机遇

    AI离我们有多远? 放在两年前,大概率会觉得遥不可及.但时至今日,进程可能超乎你的想象. "现在,每10个企业中就有1家使用10个或更多AI应用程序." 英国机构MMC Ventu ...

  4. 百度智能云大数据全景架构图如何赋能企业数字化

    当前,数字经济成为我国经济高质量发展的新引擎,企业面临着以大数据为核心的数字化转型重要机遇和挑战.如何打造安全可靠的数据基础设施和价值挖掘平台,发挥数据资产的核心价值是企业能否赢取未来的关键所在. 9 ...

  5. 百度智能云“游记” ABC助推AI工业化时代来临

    ▼ 更多精彩推荐,请关注我们 ▼ 8月29日,2019百度云智峰会现场.虽然只是一个固定的会场,但是置身其中,犹如在"ABC"的世界里自由翱翔--"媒体+AI" ...

  6. 王海峰发布百度智能云最新架构,推出AI中台和知识中台

    5月18日,在百度云智峰会上,百度CTO王海峰发布最新百度智能云架构规划. 首先,他分享了百度利用AI.大数据.云计算等技术帮助疫情防控.复工复产的成果:AI多人测温1周检测2700万人次,时空大数据 ...

  7. 百度智能云为何是“适合跑AI的云”?

    7月29日的智能经济高峰论坛上,百度CTO王海峰在致辞中提到了这样一个观点:"百度智能云的云,不仅为数字化转型提供安全稳定弹性灵活的云计算服务,同时也是适合跑AI的云." 按照中国 ...

  8. 百度智能云成中国跳水队独家AI合作伙伴圆梦东京!

    百度智能云与中国国家跳水队协同推进人工智能与体育跨界合作再进一步,正在为我国 AI+体育的应用探索开拓一片新的大陆. 4月22日,百度与中国国家跳水队举行合作启动仪式,百度智能云正式成为中国国家跳水队 ...

  9. AI助力圆梦东京!百度智能云成中国跳水队独家AI合作伙伴

    百度智能云与中国国家跳水队协同推进人工智能与体育跨界合作再进一步,正在为我国 AI+体育的应用探索开拓一片新的大陆. 4月22日,百度与中国国家跳水队举行合作启动仪式,百度智能云正式成为中国国家跳水队 ...

最新文章

  1. linux下logrotate配置和理解---转
  2. mini2440 u-boot linux 内核启动,u-boot.2012.10——mini2440(二、启动流程分析)
  3. css margin和border,Margin、Border、Padding属性的区别和联系
  4. 中秋水文 | 安利一发国漫
  5. C++11:using 的各种作用
  6. python删除第一行_Python删除文件第一行
  7. java基础案例教程试题,Java基础案例教程-中国大学mooc-试题题目及答案
  8. 高职考计算机基础知识,高职计算机基础及应用教程
  9. Redis--发布订阅
  10. python3内存分析_调试和分析 - tracemalloc —- 跟踪内存分配 - 《Python 3.7 标准库》 - 书栈网 · BookStack...
  11. Spark之UpdateStateByKey算子
  12. Protues 8.8 SP1 无需破解 可用直装版 指路
  13. Choerodon猪齿鱼1.0先行版已发布!
  14. 【系列1】使用Dockerfile创建带sshd服务的Centos Docker镜像
  15. 标准声纹采集终端,为声纹库建设提供标准支撑,为声纹鉴定和比对提供坚实的基础!
  16. python excel 读写,定义名称
  17. Dilated/Atrous Convolution
  18. 多功能噪音消除器支持多种场景模式
  19. 计算机接口IDE接什么,IDE接口硬盘数据线_IT /计算机_数据的正确连接方法
  20. 教你如何将网页上的视频下载到手机

热门文章

  1. 1071 小赌怡情 (15分)
  2. 生活轻哲学:【金钱哲学】和【择业哲学】
  3. 各种选址、点、路线、网要求
  4. 算法:阿克曼函数(C++)
  5. 如何解决浏览器弹出窗口的拦截
  6. Ruby 教程(一)
  7. 智云通CRM:做销售需要保持沟通的不紧迫感?
  8. 汉字转拼音的使用手册
  9. 有哪些性能优秀的无线蓝牙耳机值得推荐?便宜的蓝牙耳机推荐!
  10. 基于Qualcomm骁龙处理器的面部识别常见问题解答