【深度学习】实验6布置:图像自然语言描述生成(让计算机“看图说话”)
DL_class
学堂在线《深度学习》实验课代码+报告(其中实验1和实验6有配套PPT),授课老师为胡晓林老师。课程链接:https://www.xuetangx.com/training/DP080910033751/619488?channel=i.area.manual_search。
持续更新中。
所有代码为作者所写,并非最后的“标准答案”,只有实验6被扣了1分,其余皆是满分。仓库链接:https://github.com/W-caner/DL_classs。 此外,欢迎关注我的CSDN:https://blog.csdn.net/Can__er?type=blog。
部分数据集由于过大无法上传,我会在博客中给出下载链接。如果对代码有疑问,有更好的思路等,也非常欢迎在评论区与我交流~
实验6:图像自然语言描述生成(让计算机“看图说话”)
1 任务和数据简介
本次案例将使用深度学习技术来完成图像自然语言描述生成任务,输入一张图片,模型会给出关于图片内容的语言描述。本案例使用 coco2014 数据集[1],包含 82,783 张训练图片,40,504 张验证图片,40,775 张测试图片。案例使用 AndrejKarpathy[2]提供的数据集划分方式和图片标注信息,案例已提供数据处理的脚本,只需下载数据集和划分方式即可。
图像自然语言描述生成任务一般采用 Encoder-Decoder 的网络结构,Encoder采用 CNN 结构,对输入图片进行编码,Decoder 采用 RNN 结构,利用 Encoder编码信息,逐个单词的解码文字描述输出。模型评估指标采用 BLEU 分数[3],用来衡量预测和标签两句话的一致程度,具体计算方法可自行学习,案例已提供计算代码。
2 参考程序及使用说明
模型输入
图像统一到 256×256 大小,并且归一化到[−1,1]后还要对图像进行 RGB 三通道均值和标准差的标准化。语言描述标签信息既要作为目标标签,也要作为Decoder 的输入,以开始,结束并且需要拓展到统一长度,例如:<
【深度学习】实验6布置:图像自然语言描述生成(让计算机“看图说话”)相关推荐
- 深度学习搞CV?图像数据不足咋办?看这里!
本文来自小白算法,给大家聊一聊搞视觉研究的时候如何解决数据不足问题呀~ 今天就来一招搞定数据增强(data_Augmentation),让你在机器学习/深度学习图像处理的路上,从此不再为数据不够而发愁 ...
- 【毕业设计_课程设计】基于深度学习的甲状腺超声图像良恶性诊断算法研究
文章目录 0 项目说明 1 引言 1. 1 甲状腺超声图像自动良恶性诊断及其意义 1.2 深度学习在甲状腺超声图像良恶性诊断中的应用 2 理论部分 2.1 数据集 2.2 工作站环境 2.3 预处理 ...
- 一文探讨可解释深度学习技术在医疗图像诊断中的应用
2020-10-20 14:39:24 机器之心分析师网络 作者:仵冀颖 编辑:Joni 本文依托于综述性文章,首先回顾了可解释性方法的主要分类以及可解释深度学习在医疗图像诊断领域中应用的主要方法.然 ...
- RSE2020/云检测:基于弱监督深度学习的高分辨率遥感图像精确云检测
RSE2020/云检测:Accurate cloud detection in high-resolution remote sensing imagery by weakly supervised ...
- 【干货】深度学习实验流程及PyTorch提供的解决方案
转载自:[干货]深度学习实验流程及PyTorch提供的解决方案 [导读]近日,专知小组博士生huaiwen创作了一系列PyTorch实战教程,致力于介绍如何用PyTorch实践你的科研想法.今天推出其 ...
- 基于深度学习的x射线图像骨龄自动特征提取
基于深度学习的x射线图像骨龄自动特征提取 Automatic Feature Extraction in X-ray Image Based on Deep Learning Approach for ...
- 深度学习实验总结:PR-曲线、线性回归、卷积神经网络、GAN生成式对抗神经网络
目录 0.前言 1.实验一:环境配置 (1)本机 1.Jupyter 2.Pycharm (2)云端 2.实验二:特征数据集制作和PR曲线 一.实验目的 二.实验环境 三.实验内容及实验步骤 3.实验 ...
- 深度学习 实验三 logistic回归预测二分类
文章目录 深度学习 实验三 logistic回归预测二分类 一.问题描述 二.设计简要描述 三.程序清单 深度学习 实验三 logistic回归预测二分类 一.问题描述 学会使用学习到的逻辑回归的 ...
- 计算机视觉的深度学习实战四:图像特征提取
更多精彩内容请关注微信公众号:听潮庭. 计算机视觉的深度学习实战四:图像特征提取 综述: 颜色特征 量化颜色直方图.聚类颜色直方图 几何特征 Edge,Corner,Blob 基于关键点的特征描述子 ...
最新文章
- MyBatisPlus中进行通用CRUD全局策略配置
- framework调试
- Weblogic调试延长时间
- java判_java中判空
- 敏捷开发需求文档_需求的长期,敏捷文档
- 【hdu 6396】Swordsman
- 对于模拟交易所引发的思考
- solr学习篇(三) solr7.4 连接MySQL数据库
- Cucumber常用关键字
- android架构图示
- php使用redis实例,php中使用redis队列操作实例代码
- Win10系统安装SQL2008 R2详细步骤+图片+常见问题及解决方法
- 分布式系统如何保证数据一致性
- gmoj 6841. 【2020.11.5提高组模拟】淘淘蓝蓝之树林
- python实现抠图_python和opencv实现抠图
- 解空间树搜索及最优解
- Codeforces 919C--Seat Arrangements
- win7触摸板怎么关闭_笔记本fn键失灵怎么办?
- 浙江大学《概率论与数理统计》
- 大数乘法(快速傅立叶变换)下
热门文章
- PHP File 文件格式
- 我的Java开发技术总结
- ORACLE ORA-01653: unable to extend table 的错误处理
- VM ware 启动时坏掉了的解决方法:Runtime error opening,big_linux.vbox' for reading: -102 (File not found.).
- Unity 解决远距离模型闪烁(Z-Fighting )方案
- 迅视资管 华为哈勃入股中蓝电子,持股7.83%
- 关键词提取(三种免费工具)
- ubuntu18.04分辨率最高只有1024*768
- 【转载】华为荣耀V9手机如何设置WiFi热点共享
- 前端标注工具标你妹啊与马克鳗小对比