自然场景中文汉字数据集

  本数据集包括3273类汉字,共47万张汉字图片,每类汉字归类在一个文件夹下,各图像尺寸不一,包含在自然场景下能见到的各种字体。
  本人由于需要大量的自然场景中文汉字数据集,而手头只有少部分汉字数据集,但是如果自己生成汉字数据集,这数据集的汉字和我项目需要的自然场景汉字数据集并非同分布,在我自己的项目数据集下识别效果特别差。因此,从网上搜来大量标注的自然场景图片数据集,处理之后得到汉字数据集。使用这些汉字数据集进行训练之后,在我自己的项目数据上也能识别很好。
  如需下载该数据集,请移步至:https://download.csdn.net/download/u011754972/11236720
[汉字数据集文件夹展示]:

[灰度图片展示]:

[灰度图片展示]:

[彩色图片展示]:

  另附上自然场景下的特定场景下的汉字数据集,即,不包含自然场景下的手写体、过度扭曲图、以及艺术体,可以参考道路交通路标上的规范字体,此数据集包含2602类汉字,如需下载该数据集,请移步至:https://download.csdn.net/download/u011754972/11237131

【深度学习】自然场景中文汉字数据集下载相关推荐

  1. 深度学习 - MPII Human Pose Database数据集下载

    原数据集下载网页:http://human-pose.mpi-inf.mpg.de/#download 转载于:https://blog.51cto.com/396732/2072239

  2. python描述图片内容_深度学习实现图像中文描述

    im2txt_Chinese 深度学习实现图像中文描述项目实践 image caption Chinese Deep Learning 简介 基于tensorflow的深度学习项目.实现了输入一张图片 ...

  3. 深度学习-自然语言模型

    数据娃掘的技术博客 专注ML.DL.NLP技术知识: 新浪微博:http://weibo.com/4liuzhuang 目录视图 摘要视图 订阅 移动信息安全的漏洞和逆向原理   [观点]世界上最好的 ...

  4. 转载 | 深度学习中的遥感影像数据集

    本文转载自博主GISer_Lin原创文章<深度学习中的遥感影像数据集> 点击此处转跳原文 以下数据集均为网上开源数据集,若有遗误或不慎涉及侵权,烦请评论或留言联系 目前本项目共整理 场景分 ...

  5. “智源-MagicSpeechNet 家庭场景中文语音数据集挑战赛”上线

    2019 年 12 月,北京智源人工智能研究院联合爱数智慧和数据评测平台 Biendata,共同发布了"智源 MagicSpeechNet 家庭场景中文语音数据集",其中包含数百小 ...

  6. 在深度学习中处理不均衡数据集

    在深度学习中处理不均衡数据集 hard negative mining online hard sample mining https://blog.csdn.net/jacke121/article ...

  7. DL之Keras: Keras深度学习框架的注意事项(默认下载存放路径等)、使用方法之详细攻略

    DL之Keras: Keras深度学习框架的注意事项(自动下载存放路径等).使用方法之详细攻略 目录 Keras深度学习框架的注意事项 1.Keras自动下载默认数据集/模型存放位置 Windows系 ...

  8. 基于深度学习的场景分割算法研究综述

    基于深度学习的场景分割算法研究综述 人工智能技术与咨询 来自<计算机研究与发展> ,作者张 蕊等 摘 要 场景分割的目标是判断场景图像中每个像素的类别.场景分割是计算机视觉领域重要的基本问 ...

  9. 深度学习中的遥感影像数据集

    [转载]深度学习中的遥感影像数据集 收集网络上公开的遥感数据集,欢迎补充 Ref: https://blog.csdn.net/weixin_36670529/article/details/8458 ...

最新文章

  1. 迁移学习(Transfer learning)、重用预训练图层、预训练模型库
  2. 独家 | 手把手教你用Python的Prophet库进行时间序列预测
  3. crt linux切换用户,不同连接终端通过密钥方式登录 Linux
  4. python游戏代码示例_练习项目20:使用python制作游戏(中)
  5. .Net软件测试指南 第一章 用.net自动测试软件
  6. commit git 删除文件夹_Git-git删除文件夹/文件(删除/不删除本地文件/文件夹)
  7. 可控硅型号怎样识别_可控硅是什么_可控硅型号_可控硅分类及判别_可控硅种类...
  8. 科研 | 中英文期刊分区介绍及查询方法
  9. win10设置linux虚拟网卡,win10系统安装虚拟网卡的详细步骤
  10. 浅谈微积分以及泰勒展开
  11. 中国金茂销售表现亮眼,资金杠杆率进一步下降
  12. 移动支付服务商加盟/微信支付宝扫码支付代理加盟
  13. 计算机快捷键大全常见的,电脑快捷键大全_计算机常用技巧
  14. java-net-php-python-japm中小学生课堂评价系统查重PPT计算机毕业设计程序
  15. Permute mac版 v3.7.2 文件格式转换器
  16. 无基础怎么学习java虚拟机,0基础学习Java ——Java 虚拟机结构(上)
  17. 产品经理小技术(三):二维码这把利刃,产品应该用到极致
  18. 4口极简USB2.0 HUB方案SL2.1A
  19. 海盗分金子的原题及答案
  20. GBase 8s V8.8 SQL 指南:教程-1.4

热门文章

  1. encodeURIComponent的用法
  2. 阿里异地多活与同城双活的架构演进
  3. 千万级规模高性能、高并发的网络架构经验分享--转
  4. Linux curl命令参数详解--转载
  5. Linux 的启动流程--转
  6. Apache+tomcat+mod_jk+centos6.2负载均衡集群配置--转载
  7. Hyperledger Fabric Rest API服务开发教程【含源码】
  8. 这年头,老赖没得混了!大数据式追债,你见过吗?
  9. 纲:散户炒股存两大弱势 我自己不炒也不建议小散炒
  10. 传统企业向产业互联网转型的两条路径