古文字识别助手与众包平台——项目博客一
古文字识别助手与众包平台——项目博客一
项目背景:
从目前的考古发掘看,尚未明确证实发现有关夏代的文字资料。但种种迹象表明,夏朝的文字是存在的。山东大学考古美学研究所刘凤君教授在2005年在山东等地发现了诸多刻画在兽骨上的符号,将其命名为骨刻文,并认定刻画工具为玛瑙等锐角宝石,形成约在4600~3300年之间,若该符号能被证明为是文字,将会为中国古代文字研究以及甲骨文的发展提供重要的考古资料。
技术创新:
此前采用基于数字图像处理的技术,从骨刻文上提取出字符,对于被虫蛀、腐蚀过的雕纹的提取效果不佳;本项目计划采取众包算法以及EM算法,采用人工描绘雕纹形状并取最吻合的真值,提取出雕纹的字符库。
工作内容:
- 1.完善骨刻文网页,完成展示及提取等功能;
- 2.搭建一个众包平台,通过小游戏的形式收集用户对雕纹图片的手绘(PC端及安卓端);
- 3.采用EM算法,经过多次迭代,在众多样本中,选择出最优的最接近于真值的痕迹;
- 4.将字符库的字符根据主笔画进行分类;
- 5.将字符库的字符与甲骨文、小篆的字库尝试进行对比;
技术路线:
采用数字图像处理技术将图片分割成包含单个字符的图片,通过众包平台收集用户对于图片的手绘数据,通过EM算法,经过多次迭代,在众多样本中,选择出最优的最接近于真值的痕迹,形成字符库。
实施方案:
采用迭代式开发。第一个月完成平台网页的开发以及小游戏的制作;第二个月搜集手绘数据并设计算法得到字符库;第三个月完善平台和小游戏,同时对字符进行分类。
项目的具体分工:
- 采用结对编程进行软件开发
- 聂笑宇负责安卓APP的编写以及算法的设计;
- 郝龙负责安卓APP的编写以及算法的设计;
- 牛毅群负责后端的代码编写以及网页前端的代码编写;
- 陈楚芸负责网页前端的代码编写以及对图像的处理;
- 刘康负责后端的代码编写和系统设计。
实施计划:
- 初期,开发相应的web平台和app平台,同步研究后期需要使用的算法,众包算法,图像识别,特征提取算法等。
- 中期,完善web和app平台,并推广,用于手收集众包算法的原始数据,并根据算法对骨骼文字进行真值提取。
- 后期,根据前中期的成果,对文字进行主笔画分类,时间富足的情况下,将文字与小篆,甲骨文进行对比研究。
古文字识别助手与众包平台——项目博客一相关推荐
- 古文字识别助手与众包平台——项目博客五
古文字识别助手与众包平台--项目博客五 背景: 由于本项目算法部分为使用python编写,所以需要在springboot中调用外部的python程序进行计算本项目算法评分模块. 在登录功能和社区功能的 ...
- 古文字识别助手与众包平台——项目博客二
古文字识别助手与众包平台--项目博客二 背景: 由于众包算法的系统是为了让更多的人通过描绘图像而获取更多的原始数据,所以在手机端的功能流程不能做的太复杂,否则用户会直接被过于复杂的流程劝退,于是,经过 ...
- 古文字识别助手与众包平台——项目博客三
古文字识别助手与众包平台--项目博客三 背景: 由于骨刻文项目存在许多骨刻文的静态图片,为了前端能够快速获取到相应的图片,后端打算再部署一个nginx静态服务器,用来存取在项目中客户上传的各种图片.同 ...
- 基于 abp vNext 和 .NET Core 开发博客项目 - 博客接口实战篇(五)
基于 abp vNext 和 .NET Core 开发博客项目 - 博客接口实战篇(五) 转载于:https://github.com/Meowv/Blog 上篇文章完成了文章详情页数据查询和清除缓存 ...
- 基于 abp vNext 和 .NET Core 开发博客项目 - 博客接口实战篇(四)
基于 abp vNext 和 .NET Core 开发博客项目 - 博客接口实战篇(四) 转载于:https://github.com/Meowv/Blog 上篇文章完成了文章增删改的接口和友情链接列 ...
- 基于 abp vNext 和 .NET Core 开发博客项目 - 博客接口实战篇(三)
基于 abp vNext 和 .NET Core 开发博客项目 - 博客接口实战篇(三) 转载于:https://github.com/Meowv/Blog 上篇文章完成了分类和标签页面相关的共6个接 ...
- 基于 abp vNext 和 .NET Core 开发博客项目 - 博客接口实战篇(二)
基于 abp vNext 和 .NET Core 开发博客项目 - 博客接口实战篇(二) 转载于:https://github.com/Meowv/Blog 上篇文章完成了两个接口:文章列表页.文章详 ...
- 基于 abp vNext 和 .NET Core 开发博客项目 - 博客接口实战篇(一)
基于 abp vNext 和 .NET Core 开发博客项目 - 博客接口实战篇(一) 转载于:https://github.com/Meowv/Blog 现在博客数据库中的数据是比较混乱的,为了看 ...
- 04. 项目博客之日志
项目博客之日志 系统没有日志,就等于人没有眼睛 第一,访问日志 access log(server 端最重要的日志) 第二,自定义日志(包括自定义事件.错误记录等) 1. nodejs 文件操作 文件 ...
最新文章
- git 服务器搭建,在自己服务器上搭建私有仓库
- 不要使用Android Studio的Git Commit了----记一次debug
- beyond compare类似软件_你用过最好用的截图软件是哪一款
- 再说变体结构 - 回复 彬 的问题
- 专场介绍 | 第12届中国R会议(北京)生物信息专场
- 计算机网络第七版答案
- python导入鸢尾花数据集_2020-11-01 鸢尾花数据集Python处理
- LINUX下汉化CodeBlocks
- 【CF 513F2】
- 【PMAC学习笔记——第0篇】初识PMAC运动控制卡以及 Microsoft Visual C++ 2019,PeWin32 PRO2环境搭建
- 时序数据库基本概念学习
- 2020年12月特许金融分析师CFA考试难度分析!
- 11kw星三角启动延时几秒_星三角时间继电器延时时间
- 服务器被黑该如何查找入侵、攻击痕迹又该如何防御攻击呢?
- 论文排版图片一栏设置与文献引用的超链接设置-论文投稿经验总结-第3期
- Fla制作元件导出SWC
- 【报表开发】:BI---新视界---请休假个人报表
- ncr管理系统_项目管理信息平台
- 词霸天下---142词根 【-scape- 形状 】
- (四)Java游戏部署在BlackBerry仿真器上(RIM)