简介

这两天我看见一个galgame机翻工具 MisakaTranslator,它类似VNR,使用C#编写并且支持Hook和OCR(图像识别)两种方法提取文本。

我在MisakaTranslator的基础上进行了一些改动,去除了所有的机翻的功能,转而支持了加载本地汉化补丁的功能,并把它重命名为MisakaPatcher。通过这个工具,即使我们在解包封包上遇到困难,理论上我们还是可以用外挂的方法(手工)汉化任意一款文字游戏。

本项目Github主页

主要功能

  • Hook + OCR提取文本
  • 智能模糊匹配。匹配最有可能的原句,并显示对应翻译。
    • 这个算法在提取到的文本与补丁里的原文相差很大的情况下依然可以正确匹配。
  • 全透明的窗口,美观的字体,更好的游戏体验

效果展示



(注:图里的翻译是我手工翻译的)

制作补丁

我们把游戏原文本提取出来(或者用手打出来)后,改成如下格式(通常需要自己写一个脚本),放到一个文本文档里面,编码按UTF-8保存,就是我们的汉化补丁了:

<j>
原句1
<c>
翻译1
<j>
原句2
<c>
翻译2
...

这其实就是一个键值对的词库,注意两种标签数量必须一致。建议使用EmEditor,写脚本的时候注意encoding。补丁目前只支持单个文本文件,如果有多个文件,请先合并。之后我可能会加一些简单的加密功能来保护补丁里的文本不被随意提取改动(但是毕竟是开源的,实际意义不大)。

加载补丁

打开MisakaPatcher,右下角设置 -> 翻译相关设置 -> 通用设置 -> 选择本地汉化补丁为翻译源 然后再 翻译相关设置 ->本地汉化补丁 -> 选择汉化补丁的路径 然后就可以开始游戏了

使用

如果使用Hook,就根据向导设置就好了,挺简单的我不讲了。
如果使用OCR,首先需要在OCR设置里选择OCR方法,可以用百度OCR API,但是比较麻烦,这里建议直接用离线的Tesseract。程序自带了Tesseract3的dll和dataset,但是如果觉得效果不够理想,可以安装Tesseract5(见Github README)。

使用OCR时的注意点:

  • 窗口截取目前在屏幕显示放大率不为100%的时候有bug,建议使用全屏截取
  • 对话框不透明度建议调到最高
  • 使用Tesseract必须使用预处理,建议使用提取纯白色文本处理,并且选择正确的参数,把截图转换为白纸黑字的样子,最有利于OCR识别。
  • 文字速度尽量调到最高,不然可能会截不全
  • 翻译的文本框不要和截屏区域放在一起,不然会把中文翻译一起截进去,导致无法正确识别原文本

智能模糊匹配原理

  • 根据编辑距离,算出两句句子粗略的相似度
  • 用一个sigmoid函数把粗略相似度转换为两句句子匹配的概率(0-1之间)
  • 建立HMM模型,提取到的文本就是我们每一个时间点的观察(样本)
  • 使用Viterbi算法,根据前一句所处位置的概率分布,从前一句转到当前句的概率,以及当前句的匹配程度,综合判断当前句匹配的概率
  • 保存当前最有可能匹配的8个结果,并且返回其中最有可能匹配的那句话的翻译
  • 因为我们知道大多数的句子都是不匹配的(整个模型是稀疏的),整个计算过程可以被简化,时间效率可以提升到每一步O(N)(N是整个补丁的句子总数)
  • 详见代码里的注释

使用MisakaPatcher制作Galgame外挂汉化补丁相关推荐

  1. MATLAB 汉化补丁下载

    ======================================================================== :::::: 欢迎使用 junziyang 制作的 M ...

  2. galgame 游戏汉化和galgame 游戏翻译入门经典教程

    最近有人问起来 galgame 游戏汉化和galgame 游戏翻译问题,这类问题不再一个一个回答了写本文给 galgame 游戏爱好者好了 希望大家喜欢 翻译galgame 游戏 核心软件就是agth ...

  3. Sexy Beach PR 汉化补丁+新手教程

    [遊戲名稱/Name]:Sexy Beach PR  [遊戲廠商/Company]:Illusion [發售日期/Sale date]:2015-9-11 〓补丁说明:〓 ※本补丁为 Illusion ...

  4. 暗夜ト星ノ冥土馆~ぷにゅぷりXX 汉化补丁

    [名称]:暗夜ト星ノ冥土馆-ぷにゅぷりXX 基于Flash的伪3D游戏(官方语为2.5D).你要做的只是点击下一句按钮,然后便可轻松地达到所谓的"通关".但好处是你可以欣赏到极其华 ...

  5. 价值100大洋的简体中文汉化补丁下载

    这 真逗我啊..... 要我怎么说呢...... 总之今天是DT才搞这个汉化补丁 说明两点: 1 基于繁体中文版,我只是改了简体字库,感谢制作繁体中文的大大(难不成官方做的??) 2 字库有点挫,我写 ...

  6. クリムゾンガールズ 汉化补丁(BUG修正)

    [游戏名称]: クリムゾンガールズ [游戏语言]: 日语 [游戏类型]: AVG [发售日期]: 2009/03/01 [游戏厂商]: クリムゾン 一个吃饭游戏 我就不多说了 就简单搞了下剧情汉化 我 ...

  7. 77 ~And, two stars meet again~ RC汉化补丁[BUG修正]

    [遊戲名稱/Name]:77 -And, two stars meet again- [遊戲廠商/Company]:Whirlpoor [發售日期/Sale date]:2009/07/31 Whir ...

  8. PS朋友们有福了 PhotoShop CS2 最新汉化补丁出炉

    PS朋友们有福了 PhotoShop CS2 最新汉化补丁出炉 使用PS一族的朋友们 由于CS2版本出来后一直沿用CS汉化补丁 导致汉化不完全 官方中文版又遥遥无期 今天终于发现有朋友给作了一个针对C ...

  9. LOVE×EVOLUTION 汉化补丁

    [遊戲名稱/Name]:LOVE×EVOLUTION [遊戲廠商/Company]:evee [發售日期/Sale date]:2009/08/18 介绍: 这个好像就是所谓GALGAME之极的游戏. ...

  10. steam植物大战僵尸汉化补丁使用教程

    植物大战僵尸作为小时候印象最深的游戏之一,上线便收获了一大波人的喜爱与好评,仍至今日,还有许多小伙本们沉浸其中,不过steam版本并不支持简体中文语言,网络上面虽然一大堆但都是很久之前的,会出现一些黑 ...

最新文章

  1. STM32时钟树解析
  2. 如何使用Create React App DevOps自动化工作中所有无聊的部分
  3. 火狐、IE、Chrome已进入三国时代
  4. P2911 [USACO08OCT]Bovine Bones G (python3实现)
  5. redistemplate hash 过期时间_redisTemplate的使用以及和stringRedisTemplate的区别
  6. jsp+servlet+mysql简单实现用户登陆注册
  7. L1-052 2018我们要赢-PAT团体程序设计天梯赛GPLT
  8. R语言中样本平衡的几种方法
  9. 安装wget 、 wget命令
  10. 论能逼疯一个人的nvidia显卡驱动在ubuntu16.04上的安装
  11. jpeg图片太大怎么办?一分钟轻松搞定
  12. graphql_GraphQL简介
  13. 和异性合租是什么样的体验?
  14. 如何学好 java?
  15. python代码说明文档怎么写_Python写完代码怎么用
  16. Mac电脑远程连接Windows桌面Microsoft Remote Desktop
  17. java的字节码文件是什么后缀_【Java虚拟机1】Java字节码文件格式入门
  18. 医学案例统计分析与SAS应用(笔记)一
  19. excel用python数据分析_(转载)像Excel一样使用python进行数据分析
  20. 4、输入一元二次方程的三个系数,求根。

热门文章

  1. python怎么用反三角函数_反三角函数怎么用
  2. c语言视频教程全集(c语言视频教程 谭浩强)
  3. 电子器件系列二十一:混频器
  4. app上显示服务器数据加载失败,APP中的6种常见数据加载
  5. php视频教程bt下载,LAMP 兄弟连原创视频光盘镜像下载—精品PHP Linux高清WMV格式视频教程全集...
  6. Java程序调用linux脚本-简单版
  7. 机器视觉算法(系列一)--机器视觉简短入门
  8. 新库上线 | CnOpenData中国工业企业绿色专利及引用被引用数据简介
  9. android urldecode解码,URLDecoder异常解决方法
  10. 《简明微积分》(第四版)学习笔记