本文由学者史蒂文·豪斯曼、奥沙尼·塞尼维拉特、于晨等联合发表

主要内容:
网络上食谱和其他食品信息的快速增长为饮食相关知识的知识图谱提供了进一步的发展机遇。目前,有几个与食物相关的本体论,但类型单一且相互无联系。该图谱面向想要健康饮食的人群,会包括每天的食物和食谱以及信息来源。我们使用基于语义的提取—转换—加载过程,利用本体论和社区术语构建食品知识,并链接到相关食品和营养资源。这些资源的链接是使用词法相似度和字符匹配技术来查找数据集之间的非完美匹配。系统提供有用的食物建议,促进更健康的生活方式。

目前现状:
推荐的膳食指南应用的障碍之一是个性化指南,需要观察热量,脂肪,盐和糖的摄入量等,还需要建议个人食用各种营养丰富的食物。一个解决方法就是提供智能自动的方案推荐食物。尽管食物推荐对人的生活很重要,但与其他领域相比,研究仍然不足,目前只涉及语义学。

数据采集
从多个来源收集和集成数据带来的一致性、准确性和完整性的挑战:

  1. 无效数据—部分文本数据包含在基于RDF的图谱中是非法字符,需要转义。而转义本身会给实体识别和解决造成问题;
  2. 数据不完整—缺少原料或提供非标准的计量单位营养数据可能不完整。
  3. 模糊实体—许多成分很难联系一个特定食品项目。
  4. 额外信息—成分有时会有复杂单位或不必要信息。

主要数据来源:
菜谱、配料营养成分和组织配料的食品本体,使用Ontofox从本体提取术语和公理。
菜谱:在线食谱网站允许用户浏览和分享食谱。
营养物质:使用美国农业部的国家营养标准参考数据库
食物本体:菜谱列表和营养表提供了数百万和数千个实体的大量信息,但缺乏意义。

图谱的构建
包括具有属性和实体资源,资源之间的关系及用于表达有关资源的元数据的注释资源。完整图谱包含几个关键部分:
(i)食谱及其成分,(ii)每种食物的营养数据
(iii)有关食物的其他知识,以及(iv)以上概念的联系。

  • 菜谱:每个食谱都描述一道菜所需配料,具有唯一标识符,包含名称和一组成分。每种成分都有其名称、单位和数量。通常删除第一个逗号之后的所有文本,因为它通常描述了该成分的其他性质。从字符的开头删除并按数量保存。将单元列表与字符中的第一个单词进行比较;如果匹配,则将其删除并作为单元存储。其余文本用自然语言工具包进行标记,不是描述颜色的形容词被消除。动词和副词也被删除,连接词后面的文本被删除。结果文本作为名称保存。
  • 营养:根据食谱,建立一个食物及其配料的联系网。使用语义数据字典,从非三重数据源生成RDF三元组,将表格数据集成到图谱。将数据转换为图谱中的概念。根据数据,通过语义关系定义结果知识图谱的形状。

图谱扩充
构建的第二阶段是链接,利用实体解析技术自动地将各种概念连接一起。

  1. 实体解析:名称是在食谱、营养和食物的各个领域之间最明显的共享属性。
  2. 实体选择:限制概念域可以最大限度地提高性能的准确性,具体方式取决于所比较的数据集。

使用RDF纳米化规范为图谱中每个声明提供明确来源,通过关联数据表达知识,使用四个命名图:
(i)断言图包含提出的断言。对于食谱,包括标题,标签和配料。成分由其名称,单位和数量来描述。
(ii)来源图包含有关断言来源。
(iii)出版物信息图说明了谁创建了纳米出版物。
(iv)头图将前三个图联系在一起,从而可以找到三个组成部分。

食品图谱的应用

  • 在SPARQL中回答能力问题:每个问题可通过使用 SPARQL査询底层本体来回答,因为像食谱和配料之间的关系的信息是直接在本体中编码,具体例子参考请自行参考原论文。

  • 用自然语言回答能力问题:通过图谱回答自然语言问题,由于不存在与配料、营养和食谱相关的食品问答数据集,我们创建了三种类型的能力问题,并使用不同的模板来增加复杂性。为创建数据集,首先采样FoodKG中的几个子图。然后,对每个子图,我们从预定义的模板库随机抽取问题模板,并用KG实体和关系填充空位。

  • 问答系统由问题类型分类器、主题实体预测器和KBQA模型三部分组成。问题类型分类器用于确定在这种情况下“简单”的问题类型。然后使用主题实体预测器来检测问题中提到的主题实体,并将其链接到图谱。最后,调用KBQA模型从围绕主题实体的KG子图中检索答案。

实验中,评估KBQA模型,比较了一个简单的基于字袋向量的方法(BOW)和最新的基于神经网络的方法(BAMnet)。这两种方法在围绕主题实体的KG子图中将问题和每个候选答案编码到相同的嵌入空间,然后使用点积计算它们之间的余弦相似度评分。相似度得分高于某一阈值的候选答案将作为预测答案返回。两种方法之间的主要区别在于,在BOW中问题和候选答案的编码独立于预训练词嵌入的平均值,而在BAMnet中,考虑到两者之间的双向交互作用,使用更复杂的神经网络模块对它们进行联合编码。即使问题使用预定义模板创建,并且问题和KG之间没有词汇上的差距(即我们使用准确的实体名和关系名来填写问题模板),BOW方法表现不佳。Bamnet方法在数据集上执行效率高。在三种类型的问题中,带有约束的问题最具挑战性。

FoodKG- A Semantics-Driven Knowledge Graph for Food Recommendation相关推荐

  1. Unifying Task-oriented Knowledge Graph Learning and Recommendation

    Unifying Task-oriented Knowledge Graph Learning and Recommendation ABSTRACT 背景 将知识图纳入推荐系统(知识感知推荐),以辅 ...

  2. 【论文阅读】Unifying Knowledge Graph Learning and Recommendation

    Unifying Knowledge Graph Learning and Recommendation: Towards a Better Understanding of User Prefere ...

  3. [转发]知识图谱 (Knowledge Graph) 专知 荟萃

    知识图谱 (Knowledge Graph) 专知 荟萃 入门学习 大规模知识图谱技术 王昊奋 华东理工大学 [http://history.ccf.org.cn/sites/ccf/xhdtnry. ...

  4. 什么是知识图谱(Knowledge Graph)(上)

    本文参考了Mayank Kejriwal的新著<Domain-Specific Knowledge Graph Construction>(2019年) 最近几年,knowledge gr ...

  5. RKGE:Recurrent Knowledge Graph Embedding for Effective Recommendation 论文

    emm-图片复制过来显示不了(因为我太懒了0.0),要看图的话可以去我的博客瞅瞅,嘿嘿嘿 对了,有些英文短句假如翻译成中文,阅读的时候就太搞脑子了,所以我干脆就不翻译了 这篇论文的模型跟我上一篇发布的 ...

  6. 【kg推荐->精读】Learning Intents behind Interactions with Knowledge Graph for Recommendation

    KGIN Learning Intents behind Interactions with Knowledge Graph for Recommendation Abstract 基于GNN的端到端 ...

  7. tensorflow从入门到精通100讲(五)-知识图谱( Knowledge Graph)关系抽取之PCNN

    前言 知识图谱( Knowledge Graph)以结构化的形式描述客观世界中概念.实体及其关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织.管理和理解互联网海量信息的能力.上 ...

  8. 学习Knowledge Graph Embedding Based Question Answering代码笔记

    前言 最近被导师安排学习一下[Knowledge Graph Embedding Based Question Answering] 这篇paper,这篇paper的重点在于运用了Knowledge ...

  9. KnowIME: A System to Construct a Knowledge Graph for Intelligent Manufacturing Equipment-学习笔记

    KnowIME: A System to Construct a Knowledge Graph for Intelligent Manufacturing Equipment 构建智能制造设备知识图 ...

最新文章

  1. 响应式编程笔记(二):代码编写
  2. POJ 3691 DNA repair AC自动机 + DP
  3. 马斯克放话,星链率先从SpaceX分拆上市,曾预计带来300亿美元营收
  4. HID接口设备-简介
  5. Fragment之一:Fragment入门
  6. Canvas学习:封装Canvas绘制基本图形API
  7. html5访问电脑或手机摄像头
  8. 在 Apex 中得到 sObject 的信息
  9. 千寻位置 开发demo_CICV2019:博世相对高精度定位与千寻绝对高精度定位
  10. samba部署和优化
  11. linux shell 数字计算详解
  12. 模型压缩_模型压缩:
  13. 计算机工具栏文件夹选项在哪里,windows10系统下工具栏里找不到文件夹选项如何解决...
  14. 超全整理:程序员都在用什么工具?
  15. 2022 水花走向哪里?中概 / 恒生 / 投顾 / 中证 500 / 传媒?
  16. java 水印排版_java图片加水印代码 最好有实例!!!先谢了!!
  17. 2020度小满java方向笔试题
  18. 网易云 短信验证码+验证+tp5
  19. 提示由于电脑中MSVCP100.dll丢失导致程序无法启动的解决方案
  20. 读书笔记--《初等数论(第三版)》(闵嗣鹤 严士健 编)第三章 同余(Part I)

热门文章

  1. 世界主要电信运营商总结
  2. 目标检测算法综述—— One-Stage方法
  3. 极狐GitLab 和 ArgoCD 的集成实践
  4. Android 面试文档分享
  5. python3编程实战_生信编程实战第3题(python)
  6. Symmetrix GK盘介绍
  7. QT实现简单的贪吃蛇小游戏
  8. ASCII码的大小写转换
  9. echarts map 地图做出立体效果
  10. html那些事-----------2