​​近日,每日互动(个推)CTO叶新江受邀出席WAIC世界人工智能大会,并于“大数据关联下的图数据库技术与应用”主题论坛上发表演讲,同与会专家、观众共同探讨“万亿级图下的数据智能”。

叶新江介绍,每日互动成立于2010年,以提供APP消息推送服务起家。十多年来,每日互动参与和见证了移动互联网行业的飞速发展,更依托自身海量数据资源和大数据、人工智能技术优势,构建了完整的数据智能服务生态,提供专业的大数据解决方案,推动移动互联网、品牌营销、金融、智慧城市等细分领域的数智化升级。

目前,每日互动已成长为将互联网、大数据、人工智能、云计算等新兴领域特点有机融合于一身的新经济综合体,并着力打造数据中台产品——“每日治数平台”,输出治数能力,为垂直行业的数字化创新增能提效。

数据智能的新发展:解决现实中不确定性大的问题

每日互动将“数据让产业更智能”作为自己的使命和愿景,对数据智能有着自己独到的理解。叶新江讲到,在信息化时代,我们主要通过数据来描述客观现实。比如,我们通过可视化的监控大屏描述道路状况,用不同的颜色代表道路的拥堵程度。后来,我们越来越多地使用数据进行诊断和因果分析,比如对道路拥堵进行归因。近年来,数据持续呈爆炸式增长,机器学习、图挖掘等前沿技术得到更广泛的应用,数据智能随之发展到一个全新的阶段。当下,人们对数据的应用已经不仅仅停留在描述和诊断的阶段,人们希望通过数据智能,解决现实中不确定性大的问题,并对未来进行预测,从而掌握态势,掌握动向,掌握主动。

正确的解题方式:本体建模和检索

叶新江提到,现实中不确定性大的问题,往往是开放环境下的问题,受到众多因素影响。为了解决这类问题,传统的基于神经网络的深度学习方法,需要大量的参数对环境建模,如最近流行的GPT-3模型包含了千亿级别的参数,一次训练所需的成本达到千万美元。即便如此,这种形式下的人工智能也很难达到人类的智能水平。

因此,我们判断人工智能的最终形态应该是 “人脑+电脑”人机共生的方式。如何实现“人机共生”,来解决这些不确定性大的问题呢?基于知识图谱的数据智能是一个具有前景的方向,一方面通过本体建模将已有的知识进行数据化,让电脑具有了人脑的思维方式;另一方面通过在知识图谱上进行检索和推理,让人脑可以利用电脑的计算能力。为了实现这个目标,底层基础设施需要符合建模架构要求,并具有快速检索和全局推导的能力。而综合了图查询系统和图计算系统的综合图数据库系统,能够满足这些特性和功能要求。

万亿级图下的数据智能实践:大数据抗疫

那么,如何基于综合图数据库系统开展数据智能应用,以解决现实中不确定性大的问题呢?叶新江以每日互动参与大数据抗疫为例,分享了每日互动在万亿级图下的数据智能实践。

2020年新冠肺炎疫情发生后,每日互动火速成立大数据抗疫团队——“个医”,并与李兰娟院士团队共同合作,投入到这场与新型冠状病毒的战斗中,在疫情态势研判、传播路径分析等方面进行深入研究,全面助力疫情精准防控。

为了帮助地方政府实现高效防疫,公司联合李兰娟院士团队提出“无意识密切接触者”概念,基于人时空大数据,帮助相关部门找到工作重点区域、重点人群和重点场景,实现智能防控。同时,为了方便地方政府综合了解疫情态势,我们通过大数据来反映和量化当前区域内的疫情风险,为高效开展疫情防控提供有力数据支撑。为了助力地方政府有序推进复工复产,我们还参与了健康码赋码引擎的开发,通过综合“空间、时间、人间”三个维度的信息来计算密接风险,再结合当前的防控策略,助力完成最终发码。

实际上,以上这些应用,都依赖于综合图数据库对人群在“空间、时间、人间”三个维度上的关系进行高效的建模、检索和推理,而三个维度的叠加形成了最终的万亿级图,拓展了数据智能在社会治理、智慧医疗等方面的应用场景。

总结

如今,经济发展呈现一种新的范式,数据成为一种新型生产要素,对未来发展起着重要的驱动作用。图数据库作为数据智能时代的一项重要基础设施,为我们在全域范围内,针对时间、空间等多维度进行动态检索、统计、关系推导等复杂计算创造了充分条件。

未来,每日互动还将基于图数据库、知识图谱等技术持续展开实践,通过挖掘数据潜能,释放数据互联的力量,推动解决现实中不确定性大的问题,为产业发展和社会进步贡献更大的力量。

个推CTO叶新江谈数据智能:基于万亿级图助力大数据精准防疫和健康码赋码引擎开发相关推荐

  1. 三天卖出153万双袜子,淘宝新制造驱动万亿级性价比市场大升级

    "通过天天特卖的数据,我们更精准的看到了用户的需求.像这样的女袜,我们按照消费者意愿,降低了筒高和皮筋弹性.消费者得到了更时尚和舒适的袜子,我们也省下了8%的成本.也创下了三天销售153万双 ...

  2. 美林数据“智能反窃电分析应用”荣获大数据星河奖

    2019年6月4日,由中国信息通信研究院.中国通信标准化协会主办,大数据技术标准推进委员会承办的"BDIC2019大数据产业峰会"在北京国际会议中心召开.美林数据提交的" ...

  3. 抓住工业互联网新风口,抢滩智能家居万亿市场

    随着全球联网设备数量高速增长,物联网的商业模式愈加成熟.物联网产业链涵盖端.边.管.云.用等多个层次,无论是芯片企业.模组厂商.设备生产商,还是电信运营商,都有能力更深入触及下游用户,提供更多的增值服 ...

  4. 万亿级日志与行为数据存储查询技术剖析

    http://www.sohu.com/a/126082450_355140 目前大数据存储查询方案大概可以分为:Hbase系.Dremel系.预聚合系.Lucene系,本文作者将就自身的使用经验说说 ...

  5. 万亿级日志与行为数据存储查询技术剖析(续)——Tindex是改造的lucene和druid...

    五.Tindex 数果智能根据开源的方案自研了一套数据存储的解决方案,该方案的索引层通过改造Lucene实现,数据查询和索引写入框架通过扩展Druid实现.既保证了数据的实时性和指标自由定义的问题,又 ...

  6. 万亿级日志与行为数据存储查询技术剖析——Hbase系预聚合方案、Dremel系parquet列存储、预聚合系、Lucene系...

    转自:http://www.infoq.com/cn/articles/trillion-log-and-data-storage-query-techniques?utm_source=infoq& ...

  7. 大数据时代第一部分思维导图_大数据时代总结思维导图模板分享

    现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物.数据涉及了方方面面,那主要介绍哪些呢?下面是分享的大数据时代思维导图模板 ...

  8. 【工业大数据】工厂大数据之数据源分析;如何挖掘并驾驭大数据的价值,成为“大数据企业”?

    众所周知,工业大数据是工厂智能化水平提升的关键路径,而数据源的分析和管理是工厂大数据的基础,理清理顺数据源也是实施工厂大数据的第一步.本文就对工厂的数据源进行简要分析. 数据源的划分 以下从两个维度对 ...

  9. 共话数据智能新经济,首届市北·GMIS 2019全球数据智能峰会隆重召开

    7月19日,上海市市北高新技术服务业园区(以下简称"市北高新")成功举办首届「市北·GMIS 2019全球数据智能峰会」(以下简称"市北·GMIS峰会").为期 ...

最新文章

  1. 协方差矩阵介绍及C++/OpenCV/Eigen的三种实现
  2. python空值填充_pandas | DataFrame基础运算以及空值填充
  3. flask 作为 three.js 的服务器
  4. 托马斯·弗里德曼:美政府应研究任正非的提议
  5. VS2017 ASP.NET MVC 5.0 开部署问题汇总
  6. Algs4-1.1.21打印表格
  7. 传统网站性能优化的三种手段
  8. PHP中array_merge函数与array+array的区别
  9. 本地搭建Dubbo监控中心的安装步骤
  10. 网络IPC:套接字之建立连接
  11. CLIENT系列、OFFSET系列、SCROLL系列
  12. Blazor Day
  13. Docker最全教程之Go实战,墙裂推荐(十九)
  14. 矿井水质在线监测系统
  15. target ajax,jQuery target - jquery事件
  16. 要把人工智能提速50倍的ARM,却依然坚持做“通用的计算架构”
  17. mac 查看环境变量_Mac开工利器Homebrew介绍
  18. 祝刘冬冬十八周岁快乐
  19. linux下驱动程序数字签名,64位Windows操作系统为驱动程序添加测试数字签名
  20. 提取SHP格式文件折点(拐点)地理坐标(经纬度)

热门文章

  1. 判断一个字符是西文字符还是中文字符
  2. 手机短视频应用 --用户行为分析和优化指南
  3. 攻防世界:C++复刻MISC掀桌子
  4. 瑞芯微RK3399K简单介绍及烧写镜像
  5. Dubbo剖析-Netty粘包与半包问题(一)
  6. 九省联考2018 一双木棋
  7. ribbon源码分析之自定义配置、全局配置
  8. Python读取DJI无人机拍摄照片中的DJI自定义EXIF信息
  9. Java 读取excel文件内容插入到数据库
  10. 双链笔记葫芦笔记综合评测:优点、缺点、建议