2021-01-07 15:17:12

机器之心发布

机器之心编辑部

初创公司格物钛希望通过在公开数据集社区和数据管理工具领域的创新,从而推动数据定义软时代这一新时代背景下的全球创新,破局数据孤岛,赋能AI基础设施建设。

数据定义软件时代到来

回顾互联网发展历史,过去 30 年是开源软件生产数据的时代,这个时代诞生了 Google、Facebook、阿里、腾讯和字节跳动这样的互联网巨头,他们都在用软件生产海量的数据。但是不难发现这一趋势从近几年开始悄然发生了变化,实际上前 30 年的数字化变革已经产生了大量用于算法训练的非结构化数据,如何存储、管理以及利用现有的数据来完成更加高效的算法迭代和应用开发才是 AI 开发者在未来 30 年需要面对和解决的课题。伴随着 Snowflake 这样的数据处理软件公司进入了人们的视野,我们看到数据定义软件的时代已经到来。而初创公司格物钛希望通过在公开数据集社区和数据管理工具领域的创新来推动这一新时代背景下的全球创新。

破局「数据孤岛」成为关键

高质量的数据是支持 AI 算法的基础。以往数据大多以孤岛的形式存在,数据之间却并没有产生连接。不同企业、机构之间的数据标准规范并不统一,数据质量也参差不齐,就算进行共享也依然困难重重。伴随着各类 AI 应用场景落地的技术难点逐渐浮出水面,以无人驾驶领域为例,许多驾驶场景具有稀缺性,仅凭一家之力构建包含所有的交通场景的数据集将消耗巨额的数据采集成本,并且很难在短时间内一步到位,AI 企业认识到打破数据孤岛走向合作开放将是未来谋求发展的必然选择。

近年来行业中不少企业和高校研究机构已经陆续发布公开数据集,将自身积累的优质、庞大数据公开出来,为认知层、感知层的 AI 技术提供学习驱动,把更多的数据、算力、技术汇集在一起,帮助各领域的数据释放出其应有价值,为人工智能的产业化落地提供关键基础。

格物钛公开数据集平台

以开源数据集平台赋能 AI 基础设施建设

随着行业参与者们对数据的态度越来越开放,很多公开数据集应运而生。但是由于缺乏统一的行业规范与标准,用户搜索下载和使用这些公开数据集存在诸多困难。格物钛看到这一行业痛点后随即发起了 “寻集令” 项目的号召,希望发挥自己在数据管理上的技术优势,建立 AI 公开数据集平台。招募自动驾驶、互联网泛娱乐、新零售、智慧城市和在线教育等多领域的合作伙伴加入,打造最受开发者欢迎的公开数据集社区,为企业、机构和个人提供高质量的真值数据、推动人工智能行业场景落地。

格物钛公开数据集平台自去年九月份上线以来,用户数实现了 13 倍的爆发式增长。目前已有涵盖 8 个领域的 16 家企业与我们达成了战略合作,他们将会在格物钛公开数据集平台上开源自有的数据,赋能 AI,加速人工智能行业的快速落地和科研创新。

格物钛 CEO 崔运凯表示:“寻集令是一个永远不会终止的倡议。如果你是一个企业的决策者,如果你有大量的数据,还不知道如何发掘它的价值,或者还想探寻如何更好使用它们的创意,也许是时候开放它们其中的一小部分,给这个社区中的创新者们,让他们运用他们的智慧,来发现这其中无限的价值。这个价值被发现的过程,往往带来的是双赢。社区的力量是强大的,Graviti 希望今天的分享和倡议,可以激励你参与到我们的行动中来,因为只有我们携起手来,才能一起定义未来。” Graviti 公开数据集平台下一阶段还将持续投入研发,为人工智能企业和各类学术研究机构提供专业的一站式公开数据集发布及运营支持,同时完善社区功能为用户提供问题与需求的反馈渠道,有效解决用户提出的各类数据集需求。未来格物钛也希望可以携手更多 AI 生态的各类伙伴,一起用心去开源,建设人工智能数据领域的高地。

让炼丹师不再为数据集发愁,这家公司建了一个AI公开数据集平台相关推荐

  1. 1000+高质量数据集免费高速下载!一个好用又丰富的AI公开数据集平台

    数据.算力.算法被视为推动AI发展的三大要素,其中数据是决定模型质量的关键,更好的数据才能训练出更好的模型.因此,找到高质量数据集是炼丹的第一步. 然而,由于开源数据的质量参差不齐.预览困难,且数据量 ...

  2. eeg数据集_运动想象,情绪识别等公开数据集汇总

    本文来自脑机接口社区 运动影像数据 Left/Right Hand MI: http://gigadb.org/dataset/100295 Motor Movement/Imagery Datase ...

  3. 离线语音识别软件_从音乐识别软件起家,这家公司如何备战车载AI语音市场GGAI对话...

    加入高工智能汽车专业行业群(自动驾驶5群,车联网智能座舱3群,智能网联商用车2群),加微信:17157613659,出示名片,仅限智能网联汽车软硬件供应商及OEM厂商. 早在2016年,亚马逊推出的语 ...

  4. 看上华科,这家公司与其成立联合AI实验室

    3月30日,中国最大的企业通讯云--容联与华中科技大学共建的"人工智能联合实验室"在华中科技大学正式挂牌.该联合实验室是华中科技大学首次在人工智能领域与业界进行产学研合作,也是国内 ...

  5. 大家有用 hackerrank 刷过题吗,这家公司出了一个题来让大家测测自己有多牛

    技术大咖们来评估一下难度系数怎么样,链接如下: activity.lagou.com/topic/0408A- 转载于:https://juejin.im/post/5cac04bb6fb9a0685 ...

  6. 这家公司把聊天机器部署在安全平台

    由英特尔迈克菲的前工程师所创建的Demisto公司,巧妙地将聊天机器人移植到安全领域,从而替安全团队解决沟通问题. 聊天机器人早在60年代就已经存在,但是在新一代技术的大潮里,聊天机器人在经历一次涅 ...

  7. 干点大事!“覆盖25万人的AI资源对接平台”发布,找人、找技术不再难!

    点击上方↑↑↑"我爱计算机视觉"关注我 最近CV君和其他几个较大的AI原创公众号做了件大事. 背景 因为自己做公众号,所以能够接触到不同年龄阶段.不同行业.不同背景的人.后台经常遇 ...

  8. fNIRS 公开数据集整理

    关注"心仪脑"查看更多脑科学知识的分享. 关键词:数据整理.fNIRS 之前我们向大家推送了 Public Neuroscience Dataset 系列主题的第一期: <E ...

  9. 脑电(EEG)等公开数据集汇总

    目录 EEG-Datasets 运动影像数据 情绪识别数据 误差相关电位(ErrP) 视觉诱发电位(VEPs) 事件相关电位(ERPs) 慢皮质电位(SCPs) 休息状态 音乐与EEG 眨眼/眼动 M ...

最新文章

  1. 告别无止境的增删改查:Java代码生成器
  2. python知识点 07-11
  3. c sqlserver建表csdn_Oracle拉出在sqlserver建表的语句
  4. sqlmap自动扫描注入点_同天上降魔主,真是人间太岁神——SQLMAP 高级教程
  5. 使用 Django + Wusgi + Nginx 部署 Django
  6. 八、pink老师的学习笔记—— CSS用户界面样式(鼠标样式、轮廓线、防止拖拽文本域)
  7. 【英语学习】【Level 08】U04 What I love L6 Information overload
  8. php 显示html文件后缀,[求助]此jQuery在html后缀文件可用,在php后缀文件就用不了!...
  9. 火狐浏览器走局域网中的代理ip
  10. 转:zTree高级入门:如何通过扩展节点的属性来达到是否显示节点的删除编辑等图标(按钮)...
  11. 不容错过的30页超赞项目管理PPT
  12. Petalinux2019.1详细安装
  13. 某站的视频下载与合并,m4s的处理。
  14. 电脑版微信提示音mp3_安卓充电提示音修改教程,可以自定义哦~
  15. 瞧一瞧看一看啦“一段眼睛跟着鼠标转动的跟踪眼代码”
  16. 获取其他APP中素材
  17. Python使用traceback.print_exc()输出异常信息
  18. 太空互联网能否连接下一个10亿人?| 银河航天徐鸣访谈...
  19. Java毕业设计_基于SSM框架的图片素材管理系统的设计与实现
  20. unity android解析包失败,打包APK失败。求解释

热门文章

  1. 日志分析工具 LogParser
  2. python read函数返回值_python read()方法定义及使用(实例解析)
  3. python随机数生成_关于Python中的随机数生成步骤和随机数质量
  4. String中的hashcode缓存以及HashMap中String作key的好处
  5. cmake编译安装完成后 执行cmake --version报错 bash: /usr/bin/cmake: 没有那个文件或目录
  6. 基于朴素贝叶斯的垃圾分类算法(Python实现)
  7. HMM -GMM 理清不错
  8. java连接Excel数据库读取,写入,操纵Excel表格
  9. SQL2000 N' '的意思
  10. Python参考书籍