信息爆炸时代,我们还好吗?

不知道大家生活中有没有这样的一些感受,就是买东西越来越难了。并不是因为买东西的途径变少了,而是因为买东西的途径太多了。已经不知道从哪个渠道去买,从哪个渠道听大家的测评是最合适自己的。你也不知道哪家的测评是最客观的。

举个例子,比如我们想去买一口电饭煲,你会有很多渠道,抖音有渠道,淘宝有渠道,然后京东也有渠道,包括微信里面的社区团购也有渠道。这些渠道都在向我们阐述不同的商品,然后这些商品有的上面的说法是真的,有的说法是假的。

主观和客观这些信息不断的交杂在我们身边,那我们如何去甄别我们究竟想要什么,什么东西是最适合我们的?这个要求我们去理解,从电饭煲这个例子要求我们去理解电饭煲的原理,电饭煲的评测标准,电饭煲的一些更深入的信息。

那这些信息对我们来说是一个负担,因为我们只想做一个简单的决策。我们每天要做大量这样的决策,如果每一个决策都要求我们花个几小时的时间在背后把一切原理搞明白。那我们每天的生活就崩溃掉了,我们没有办法每天每个决策都做这种深度决策,去做这种深度的研究和思考。这会导致我们可能一天做的决策里面绝大多数都不是特别明智。那如何能帮助我们在日常的生活中做出更明智的决策呢?其实人脑的算力是不够的,我们需要AI的介入,AI需要能够帮我们来进行辅助决策。

这个其实是新时代对AI的需求,也是新时代对AI的一个红利。十四五规划中有三次提到人工智能,这三次人工智能的阐述都强调了人工智能需要拥有学习推理和决策能力。这个其实就像苹果的siri,然后亚马逊的echo包括小米的小爱,百度的小度。他们在我们身边就是来回答我们的问题,帮助我们做辅助决策的,但是现在这个阶段他们还不是那么智能,他们需要向更智能的阶段去突破。

如何能够让它们变得更加智能,在这个过程中,我们能做哪些事情。从AI发展阶段来看,总共分四个阶段,我们现在处在什么阶段呢?只是处在感知和认知交界的阶段。我们现在只是对于图像识别、语音识别、人脸识别做得非常不错,但这些识别AI对于数据来说都是把数据当作黑盒在做。

你给我一个数据然后你告诉我他的输出,那你给我海量的这个输入和输出数据,AI就能够想到一个解决办法找到一个算法能够来帮你做一种拟合,这种拟合就是你给我这个输入我大概率能给你一个标注的输出。那我们算出来一个这样的拟合后,我们就可以给它提供一些新的数据。比如说我们给它大量的人脸标注的数据,我们就可以让它去来标注一些新的人脸。在这个过程中其实AI对于人脸这张图片的信息是不理解的,它只是当作一个个比特位的数据,二进制的数据在处理,这个是远远不够的。

所以我们现在是处在一个感知到认知智能进化的阶段,在认知智能阶段,我们需要让AI对于我们的输入数据有认知和推理能力。那这个认知和推理能力从哪里来呢?

人类各领域的专家是需要向AI去传道的,为什么需要传道呢?

举一个简单的例子,给大家提一个问题,我们作为一个中国人,大多数人都看过三国演义。大家看过三国演义后,其实我们可以得出一个结论,这个结论叫做曹操是喜欢寡妇的。那为什么我们能够得出这样一个结论呢?为什么能够推理出这样一个知识点呢?取决于一些前提的条件,首先我们要知道曹操是谁,其次我们需要知道寡妇是什么意思。第三我们需要知道喜欢有哪些外在表现。

通过我们只有掌握这三个知识点,才有可能在阅读三国演义的时候推理出曹操是喜欢寡妇的。整个这个过程向我们阐述一个很朴素的道理,叫做举一反三和类比学习,它背后的原理都在于我们基于一个已经存在的背景知识库去学习新的知识。所以这个背景知识库很重要,这个背景知识库质量越高越完整,我们学习到新知识的能力就会变得越强,我们学习到新知识的质量就会变得越高。

那这个背景知识库如何获取呢?对于人类来说这个事情很简单,虽然我们不知道人脑是一个什么样的构造,但是我们就在人脑里通过我们每天的阅读听觉视觉我们就能在人脑里面构建出一个背景知识库,当我们想要去提取的时候随时可以提取。

但是,我们没有办法把人脑的工作原理复刻出来给机器人。我们现在能够尝试理解的就是需要有这样一个背景知识库,而且我们人脑能够去处理这样一个背景知识库。那我们先要做的事情就是让AI有能力去处理这样一个背景知识库。这里给我们提出一个全新的挑战,我们需要把人类所能够理解的知识转变成AI能够理解的知识的样子。

那AI能够理解的知识长成什么样子呢?它其实是一个非常结构化的数据,它最后变成了一个知识和知识彼此链接的一个大的图,我们把这个东西叫做知识图谱。所以知识图谱是什么?知识图谱是AI能够理解的人类知识的一种表达方式。他表达成了这样一种非常结构化的图数据,然后传递给AI,AI就能够借助这个数据去构建自己的背景知识库,然后进行下一步的举一反三和类比学习。

所以我们为什么说人类各领域专家需要向AI传道,就是因为我们需要把人类各领域的知识数据转变成AI所能理解的知识图谱的结构,然后让AI基于此去理解人类所掌握的知识,然后基于这个人类掌握的背景知识库去进行新的认知和推理学习,能够帮助我们在日常生活中做一些辅助决策。所以,整个过程变成了人类知识需要向AI所能够理解知识的表达方式做一种转化。

这种转化的过程就是把人类知识变成知识图谱的格式,这个转变的过程就需要各个领域这些人类知识的掌握者把这些知识梳理好之后,变成知识图谱的格式给到AI。这个就是我们现在要去做的一件事情。

这样一件事情放在这个具有红利的时代背景下面,自然会产生新的垄断。

在这样一个局面下,知识图谱的垄断存在哪呢?其实就存在于知识图谱本身,因为他的构建成本非常高。我们可以把他叠加成两个部分,第一个部分是我们说人类的知识其实非常的复杂,而且涉及的领域非常广。从我们最早最细微的日常生活如何去煮鸡蛋到更宏大的国家层面如何造一个原子弹,每个领域的知识都非常的细碎而且复杂。

但是,每一个领域都有这方面的专家,我们要把这些专家的知识转变成各个领域的知识图谱,我们就需要大量的专家协作,在这种协作过程中,由于信息太多单个领域的专家可能没有办法把他这个领域所有的知识全部梳理出来,他还需要一些NLP自然语言处理的工具做助手,同时这个过程需要大量的人工帮他去做一些判断和标记或者知识采集。这个人工的知识采集和验证的过程也非常的昂贵。如果你以我们的验证码把图片中涉及到的船只图片点出来这也是一类人工智能训练所需要的数据,这一类的数据,其实标注起来是相对比较容易的。

因为任何一个人都可以完成这样一个标注。他对于单一个体来去作标注的要求并不是很高,但是涉及到知识领域之后,你就会发现这个门槛会变高。比如医疗领域的知识可能就不是任何一个人都能标注的,法律方向的知识也不是任何人都可以标注,他对标注者提出了新的要求。那对于这样一个需求来说我们整体的成本,找专家的成本找能标注的人工的成本都变得极其的高昂。

极其高昂的成本会导致绝大多数的中小型公司没有办法独立的去完成某一个领域的图谱的标注。

被迫的去依赖一个第三方的一个背景知识库,也就是一个第三方的知识图谱的数据平台。这种第三方的数据平台,现在其实存在比如 google 、百度、头条他们都在做这样的事情,包括苹果也在做。他们其中的一部分像google和百度他们是对外提供这样的接口,但是这种接口其实在未来它存在一个巨大的隐患。

因为我们说我们这些知识图谱最常规最重要的一个应用其实就是面向问答系统,就像我们身边的siri。我问他一个问题他提供回答,在这个回答的过程中其实他能给我们一些角色上的建议。比如我们根据自身的情况告诉一个这样的问答系统,我们买一个什么样的保险比较好?他可能给我们一些决策上的建议。

根据他所具备的知识来给我们一些建议,拿着时候就会出现一个问题:如果说他背后依赖的那个背景知识库是有倾向性的,是有商业目的的,跟某些商业场景上有极其重大的竞争关系,甚至存在国与国之间的信息安全。那他给到我们的图谱信息有可能会被中间做篡改。然后导致所使用第三方知识图谱作为背景知识库的AI给我们的决策建议就可能会失真。这个百度其实做过这件事情竞价排名,你在搜索的时候让你得到一个可能不是非常公平的搜索结果。

如果未来我们身边的决策的AI,可能有各种各样围绕在我们身边,帮我们去挑礼物的,帮我们去挑保险的,帮我们去挑房子的,帮我们去选学校的,他们都有可能会给我们一个失真的决策建议,那这种决策建议对于我们全面走向一个认知智能时代,我们绝大多数的决策会依赖于AI辅助做决策的时候,那是一个极其危险的时代,那我们很有可能被那些掌控了算法,掌控了知识图谱的人去直接影响我们日常的生活。

我们觉得在现阶段,它没有那么明显,但是它已经显现出这种趋势。对于这样一种新的技术带来的新垄断的趋势,作为一个普通的人,我们该怎么办?只是在区块链出来之前,这件事是很无解,我们曾经寄希望于互联网能帮我们解决这种问题,但最后发现互联网其实也被垄断。

web3.0的时代,我们希望能有一些办法能帮助我们解决这样一些极其不对等的竞争关系。

web3.0时代,我们把区块链做一个很重要的工具,在这个工具的基础上,我们可以通过一个合理的激励机制,让大家在彼此不认识彼此的情况下通过合作的方式去共建一个的东西。

在原来只有比特币,只有以太坊的时代,我们的协作能力其实非常有限,因为我们能够协作的点,只有是我们一起协作去管理一个账本,这个账本其实没有办法跟我们落地的应用全方面的结合,因为结合的时候,会面临中间各种链上的账本和链下的行为要做结算的情况,这种情况就需要一个中心化的东西,把链下的一些行为收集起来之后在链上进行结算,这其实不算去中心化,在有了去中心化存储之后,我们可以把这种协作的网络变得更大,因为我们不仅仅可以一起协作来管理一个账本,我们还可以一起协作来管理一个数据库。

存在一个一起管理的数据库,我们能够协作的场景和规模就会变大,通过这种基础设施让大家一起协作管理的数据库,非常的垂直而且具体就是一个知识图谱的数据库,而且这个数据库大家一起参与共建,共建之后大家一起参与共享,在这个过程中每个人能够获取收益,这样一个覆盖各领域的知识图谱,至少是大家可以确信没有办法被篡改,可以去信任的。

所以,新致新知平台希望通过这样一种方式,希望能够创建一个协作的网络,在这个协作网络里,我们为大家提供足够的工具,每一个角色在这个网络里面可以使用他所需要的工具来完成他那个部分的协作所需要完成的工作。

我们的愿景:链接产业知识资源,为产业互联网提供深刻且易于发现的知识,帮助产业界实现进步、创新和思维的飞跃。

新致新知平台对于知识图谱的重大改进在于以“知识+区块链”的方式对数据资产确权,目前我们已经实现利用区块链数字资产确权技术从数字资产的确权、交易、流通等环节使用智能合约将数字资源通过区块链发布到网络上,实现数字资产被确权。

数字资源将成为区块链中被信任的数字资产,可以用于流通和交易。在知识图谱的构建方面,新致新知平台搭建了知识图谱一体化工具,包含了知识建模、知识获取、知识融合、知识存储四大模块。在知识图谱的构建方面,新致新知平台的目标是引导所有社区参与者共建共享各领域知识图谱数据,通过数据资产的确权和不可篡改,从而降低知识的转化成本,开启图谱赋能认知新篇章。

2022年的岁末,我们期望与世界上万万千千的你们一起构建人类超大知识图谱库,提升AI的智能。事实上,我们已迈出了重要一步。在这段时间里,新致新知平台已经完成知识生态1.0的初步搭建,我们正在让这个人类永恒知识库的宏伟目标变得一点点清晰起来。我们深知,在通往这个星辰大海的道路上,一定会遇到很多困难。所以,我们需要扩大共识,需要所有人一起参与进来。

ps:关注公众号【OpenKnowhow】,观看更多优质文章,可以私聊了解最新行业动态~

新致新知 | 开启图谱赋能认知新篇章相关推荐

  1. 新致新知 | ChatGPT+企业知识图谱

    作为史上最快获1亿用户的ChatGPT以及大语言模型展现了令人惊叹的广博知识.语义理解能力与创造能力,在会话中能投人所好地承认自身错误并进行改正,并能进行一定程度的逻辑推理,还有多语种翻译与多语言编程 ...

  2. 新致新知 | 共享.确权.开放式 知识图谱平台

    引言 近日, ChatGPT的爆火,正悄然引导着一场深刻的变革.AIGC拉开一个新时代的序幕,带来数字内容的生产方式和消费模式的重塑.各方都在全方位尝试如何通过AIGC-生成式AI,重新定义生产力,拓 ...

  3. LBS.token,开启奢侈品溯源的新篇章

    近年来,奢侈品也不再是小众高净值资产人士"专属消费品",随着奢侈品品牌在价格.定位上的进一步下沉,越来越多的普通消费者也能够成为奢侈品的买家,虽然他们的购买频次并不算高,但总的来看 ...

  4. 2020年中国面向人工智能“新基建”的知识图谱行业白皮书

    全文共计1379字,预计阅读时间8分钟 来源 | 艾瑞咨询(经授权转载) 编辑 | 蒲蒲 日前,认知智能国家重点实验室&艾瑞咨询联合发布<2020年面向人工智能"新基建&quo ...

  5. 新致云产品运营的那些小事

    小编是一个90后的互联网用户,在十年前见证着互联网的出现和崛起,隶属资深用户一族,目前在新致云负责产品运营,在公司做了两年的运营之后,突然想给自己的这个行业总结点什么. 首先,我和大家谈谈用户这个词, ...

  6. 肖仰华:知识图谱与认知智能

    今天跟大家分享的主题是<知识图谱与认知智能>. 知识图谱自2012年提出至今,发展迅速,如今已经成为人工智能领域的热门问题之一,吸引了来自学术界和工业界的广泛关注,在一系列实际应用中取得了 ...

  7. 复旦大学肖仰华教授:知识图谱与认知智能 | 附PPT下载

    关于作者:肖仰华博士,复旦大学计算机科学与技术学院教授,博士生导师,知识工场实验室负责人. 报告摘要:人类社会已经进入智能化时代.各行各业纷纷踏上智能化升级与转型的道路,各类智能化应用需求大量涌现.这 ...

  8. CNCC 技术论坛 | 知识图谱赋能数字经济

    2018中国计算机大会(CNCC2018)将于10月25-27日在杭州国际博览中心(G20会场)举行,大会主题为「大数据推动数字经济」(Big Data Drives the Digital Econ ...

  9. 肖仰华 | 知识图谱与认知智能

    本文转载自公众号:知识工场. 肖仰华教授1万5千字雄文带您深度剖析知识图谱与认知智能,对知识图谱技术与落地应用中的一系列关键问题做了系统梳理与解答. 肖仰华博士,复旦大学计算机科学与技术学院教授,博士 ...

最新文章

  1. axios 参数对象的值为数组时,后端无法接收(待解决)
  2. jQuery学习笔记——事件
  3. python获取用户输入的数字_Python 将用户输入的数字 提取整数谢谢
  4. SAP ABAP OData gateway缓存表的存储逻辑 - cache table logic
  5. flowable 任务节点多实例使用
  6. Windows下配置Mysql免安装版
  7. Mysql排序添加名词_记面试中问到的MySQL的SQL调优问题
  8. android.mk local_cppflags,android.mk中LOCAL_CFLAGS 介绍
  9. php折半查找算法,PHP如何实现折半查找算法
  10. Redis学习笔记(3)-XShell连接CentOSMini,并安装Redis
  11. Pytest学习-如何在用例代码中调用fixtrue时传入参数
  12. Spring Data 起步
  13. QNX系统的IDE拷贝文件
  14. fit into用法
  15. 普通话考试是从题库里抽吗_普通话考试试题有哪些
  16. 获取Orcal编码格式为US7ASCII中文数据乱码问题;
  17. 【Jquery】Jquery操作table表格详细说明
  18. 基于知识图谱推荐系统
  19. 与智能汽车相见恨晚的SOA到底是什么?
  20. 共享内存shmget传输数据

热门文章

  1. 计算机专业的研究生专业方向
  2. JAVA 二叉树 常见操作合集(前中后序递归非递归遍历 层序遍历 求深度宽度 判断兄弟结点 堂兄弟节点)
  3. emplace 和 emplace_back
  4. 细数数据科学团队中的十大关键角色
  5. BUG的定义、分类、要素、生命周期
  6. FastDFS为什么要用Nginx做代理
  7. ArcGIS Server出图之Dynamic Layers
  8. 华为OD机试真题2023(JavaScript)
  9. Nginx使用及配置
  10. linux给红米note4x刷机,红米Note4X 刷机LineageOs 14.1全过程讲解