为什么80%的码农都做不了架构师?>>>   

本文由码农场同步,最新版本请查看原文:http://www.hankcs.com/nlp/cs224n-visual-dialog.html


术语Visual Dialog,大致这么翻译(通俗理解为斗图)。你可以给聊天机器人发送图片,它能理解图片的意思,你们可以就图片内容展开对话;除了文本之外,让图片也成为交流的一部分;这可以帮助盲人理解周围或社交媒体上的信息。这是自然语言处理与计算机视觉的交叉应用。相关工作已经有很多工作在为图像和文本搭建桥梁了。图像视频自动标题虽然效果有限,比如右边这只猫实际上在与一只貂戏耍,而不是一个玩具。图像语义对齐也就是将一个图片中的各个物体自动框出来,自动输出物体之间的语义联系:图像QA这种应用已经快要接近图像对话了,...

继续阅读:码农场 » CS224n研究热点5 图像对话

原文链接:http://www.hankcs.com/nlp/cs224n-visual-dialog.html

感谢阅读本文,欢迎 查看原文或访问 码农场 获取更多内容

转载于:https://my.oschina.net/hankcs/blog/994459

CS224n研究热点5 图像对话相关推荐

  1. CS224n研究热点11 深度强化学习用于对话生成

    为什么80%的码农都做不了架构师?>>>    本文由码农场同步,最新版本请查看原文:http://www.hankcs.com/nlp/cs224n-deep-reinforcem ...

  2. CS224n研究热点8 谷歌的多语种神经网络翻译系统

    为什么80%的码农都做不了架构师?>>>    本文由码农场同步,最新版本请查看原文:http://www.hankcs.com/nlp/cs224n-google-nmt.html ...

  3. CS224N研究热点2_Linear Algebraic Structure of Word Senses, with Applications to Polysemy(对于一词多义的向量表示研究)

    Paper:Linear Algebraic Structure of Word Senses, with Applications to Polysemy 源代码 词向量编码的相似性 相似的单词的词 ...

  4. 贾珈:自然语言处理中9个不可不知的研究热点(附视频)

    2020 年 5 月 23 日上午,在中国中文信息学会青年工作委员会主办.北京智源人工智能研究院和美团点评承办的"ACL-IJCAI-SIGIR 顶级会议论文报告会(AIS 2020)&qu ...

  5. 2019 年ML NLP领域十大研究热点

    导语:NLP 知名博主 Sebastian Ruder 的年度报告! 2019 年过去了,对于 AI 界而言,过去的一年可谓是"激流勇进"的一年,一方面,整个 AI 界的研究情绪高 ...

  6. 未来计算机的研究热点主要有人工智能,人工智能的发展及其影响研究

    于龙飞 [摘 要]人工智能狭义上指 AI,因为它被设计来执行的任务范围比较狭窄.比如,其仅执行面部识别或只进行互联网搜索.驾驶汽车.有人将人工智能称为第四次工业革命,它已经渗透到很多领域,与人们的生活 ...

  7. 邓力、何晓冬深度解读:多模态智能未来的研究热点

    2020-06-13 01:21:01 作者 | 邓力.何晓冬 编辑 | 丛末 基于深度学习的机器学习方法已经在语音.文本.图像等单一模态领域取得了巨大的成功,而同时涉及到多种输入模态的多模态机器学习 ...

  8. 【自动驾驶感知领域目前研究热点】

    1.1感知领域目前研究热点: 动作识别.行人手势识别.人体姿态估计(骨架提取) 复杂道路场景语义理解与场景识别(模式识别)(城市道路路口.郊区直行路段--) 动态场景理解和多目标跟踪(MOT):目标外 ...

  9. 计算机图形学当前研究热点和发展方向,微软亚洲研究院网络图形组深入解释了图形学的现状、发展和未来...

    计算机图形学是支持各种影视特效.三维动画影片.计算机游戏.虚拟现实以及大家手机上各种照片视频美化特效背后的技术基础,在本文中,微软亚洲研究院网络图形组深入解释了图形学的现状.发展和未来. 谈及&quo ...

最新文章

  1. Python使用matplotlib函数subplot可视化多个不同颜色的折线图、自定义数据点的形状、自定义折线图的颜色
  2. LeetCode 709 To Lower Case -- java,python解法
  3. Functional Programming Contest - September'14
  4. 配置mysql-cluster群集高可用(三)
  5. 迅雷启动不了,提示Atl71.dll文件丢失
  6. 软件测试与评估:Keep/悦跑圈
  7. UVa 11806 Cheerleaders
  8. 计算机连接拒绝访问,Win10系统下Windows无法连接到打印机,拒绝访问的解决办法...
  9. 美国之旅-出发前的准备
  10. Android查看支持硬编解码器(十五)
  11. Passive Aggressive Alogrithm
  12. 多维泰勒网matlab,非线性定常系统的多维泰勒网优化跟踪控制
  13. 08-HTML5详解(二)
  14. Android仿微信图片编辑处理:文字,马赛克,裁剪,涂鸦,旋转图片等
  15. arcgis 线自动构面的方法一例
  16. 用Scheme打开网址方法
  17. 快递企业玩转微信扫一扫教程
  18. wxpython 右键菜单_使用wxPython打造印象笔记(14)笔记本管理
  19. 【高德地图API】绘制大地线 Geodesic/Great Circles
  20. 『运筹OR帷幄』CSDN官方账号正式上线啦| 运筹学/优化理论/人工智能/数据科学的学习交流社区

热门文章

  1. CI框架发送邮件(带附件)
  2. Hibernate初探之单表映射——jar包的导入
  3. SQL Server CTE 递归查询全解
  4. Beam概念学习系列之SDKs
  5. Android Learning:数据存储方案归纳与总结
  6. 用ASP.NET编写一个在线RSS新闻聚合器
  7. Can't connect to local MySQL server through socket '/var/lib/mysql/mysql.sock' 的解决办
  8. 诗与远方:无题(八十八)
  9. Spring Boot 介绍、入门
  10. PostgreSQL常用SQL