如是古籍数字化工具平台介绍---自动秒级识别古籍OCR
平台介绍
如是古籍数字化工具平台是由北京如是人工智能技术研究院打造的开放式古籍数字化系统,由古籍OCR、自动标点、标点迁移、多文本比对等工具套件组成。
平台网址 https://guji.rushi-ai.net:800 (海外镜像网址https://guji.world.rushi-ai.net )
(一)古籍OCR工具:古籍图片文字识别及校对
功能一:用户上传古籍图片到系统,系统调用人工智能OCR引擎对图片进行文字识别。
功能二:用户可以对识别结果进行文字校对,系统提供“按列校对”和“按页校对”两种校对模式。
功能三:如果用户发现自动识别有字符检测(漏框、多框或者切错)或者字序(文字顺序)的问题,可以在“切分校对”页面对字框和字序进行修改。系统提供了丰富的可视化人机交互,可快速定位问题。
功能四:用户上传的所有图片和识别结果统一在“我的图片”中进行管理,并且可以将识别结果存储为.json文件进行“导出”。
(二)自动标点工具:古籍文本自动标点
功能一:用户提交待标点的古籍文本到系统,系统调用人工智能自动标点引擎对文本进行标点,系统提供“现代标点”和“句读”两种标点方式,并支持标点结果的保存和复制。
功能二:用户保存的所有文本和标点结果都可以在“我的标点”中进行查看、更新、删除等管理。
(三)标点迁移工具:已有标点迁移至另一文本
功能:针对两份相似文本,一份有标点一份没有标点的情况,用户可以将一份文本的标点符号迁移至另一份文本,并将迁移结果复制导出。
(四)多文本比对工具:多份相似文本的差异比对
功能:用户可以对多份相似的古籍文本进行比对,并将比对结果复制导出。
平台使用规则:个人用户
用户注册后,即成为平台的普通用户,可以免费使用平台的所有工具;
对于古籍OCR工具,普通用户每日免费识别的不超过10张图片,累积识别不超过300张图片;
对于自动标点工具,普通用户每日免费处理字数没有限制,但累积处理字数不超过10万字(不含标点);
对于标点迁移和文本比对工具,原则上没有字数和次数限制。
如果需要处理更多的图片或文本,请与我们联系申请成为会员用户。
平台使用规则:团队用户
如果您是一个机构或组织,请跟我们联系,进行团队用户以及团队管理员的设置。团队管理员可以对整个团队用户、图片及标点数据进行管理。
团队管理员还可以将数据指派给团队其他人,从而实现分工协作。
对于特殊版面及大批量古籍数字化业务,如是研究院还提供更专业的数字化生产平台解决方案,可实现聚类校对、全流程质量管控等功能。
期待与您共同推进古籍数字化事业!
欢迎联系我们
如是研究院邮箱:rushi_ai@qq.com
如是研究院企业微信:
如是研究院微信公众号:
如是古籍数字化工具平台介绍---自动秒级识别古籍OCR相关推荐
- 云产品测试软件,云测试工具平台介绍
CloudAutoRunner 黑盒测试工具 云自动化测试工具CloudAutoRunner基本介绍 AutoRunner是黑盒测试工具.可以用来完成功能测试.回归测试,可以提高测试效率,降低测试人工 ...
- Freeline - Android平台上的秒级编译方案
Freeline 技术揭秘 Freeline是什么? Freeline是蚂蚁金服旗下一站式理财平台蚂蚁聚宝团队15年10月在Android平台上的量身定做的一个基于动态替换的编译方案,5月阿里集团内部 ...
- ClickHouse留存分析工具十亿数据秒级查询方案
作者:陈璐,腾讯 CSIG 高级数据分析师 本文实践了对于千万级别的用户,操作总数达万级别,每日几十亿操作流水的留存分析工具秒级别查询的数据构建方案.同时,除了留存分析,对于用户群分析,事件分析等也可 ...
- java按秒查询数据_ClickHouse留存分析工具十亿数据秒级查询方案
作者:陈璐,腾讯 CSIG 高级数据分析师本文实践了对于千万级别的用户,操作总数达万级别,每日几十亿操作流水的留存分析工具秒级别查询的数据构建方案.同时,除了留存分析,对于用户群分析,事件分析等也可以 ...
- linux性能监控工具perf,Linux性能分析中常用的工具perf介绍
今天小编要跟大家分享的文章是关于Linux性能分析中常用的工具perf介绍.系统级性能优化通常包括两个阶段:性能剖析(performance profiling)和代码优化.性能剖析的目标是寻找性能瓶 ...
- Android秒级编译方案-FreeLine
Freeline 是什么? Freeline 是一款 Android 平台上的秒级编译方案,能够显著地提高 Android 工程的编译速度 为什么使用FreeLine 随着Android app 工程 ...
- 中国少数民族古籍数字化平台研究进展
中国少数民族古籍数字化平台 目录 中国少数民族古籍数字化平台 1. 背景介绍 2. 总体框架 3. 技术路线 4. 成果简介 1. 背景介绍 中国是一个拥有 56 个民族的统一的多民族国家,中国自古以 ...
- 最好用的_古书制作工具_古籍排版工具_古文排版_自动生成古书_多种古书风格_古籍制作工具
古书制作工具_古籍排版工具使用方法 前言 最好用的古书制作工具, 最好用的古籍排版工具, 最好用的古籍制作工具, 最好用的古文排版, 自动生成古书, 多种古书风格 一.看下源图片见最后面 二.使用步骤 ...
- CCKiller:Linux轻量级CC攻击防御工具,秒级检查、自动拉黑和释放
CCKiller:Linux轻量级CC攻击防御工具,秒级检查.自动拉黑和释放 一.功能申明 二.功能介绍 三.工具安装 四.攻防测试 五.更多说明 文章目录 很久以前分享过一个CC攻击的防御脚本,写得 ...
最新文章
- android 显示yuv数据格式,YUV数据格式的理解
- 摄像头YUV图像常见数据格式介绍
- Wireshark非标准分析port无流量
- 盘点一下全网最有趣的代码注释
- ffmpeg录制屏幕并推流ffmpeg+nginx-http-flv-module+flv.js
- H3C 5510 交换机DHCP设置
- Avalonia跨平台入门第十二篇之动画效果
- 信息学奥赛一本通 2042:【例5.10】稀疏矩阵
- python代码大全和用法用量_python零基础入门命令方式汇总大全,快速恶补你的Python基础...
- iPhone 12全系渲染图曝光:还有无数果粉期待的小屏神机
- android xml 多行注释,C#中的XML多行注释 - 我做错了什么?
- TokenInsight:反映区块链行业整体表现的TI指数较昨日同期下跌2.77%
- iOS 深拷贝、浅拷贝、自定义对象拷贝简介
- centos怎么启动linux系统时间,查看Centos系统最近一次启动时间和运行时间
- Spring Framework 4.0相关计划公布---包括对于Java SE 8 和Groovy2的支持
- [HTML5]块和内联元素的嵌套
- Linux最常用的20个命令
- 后缀为axd 的文件
- KALI2021安装teemo的一些问题
- Kinect for Unity检测身高方法