游戏饭饭玩家社区  
  
查看: 13393|回复: 39

[教程] 游戏饭饭PSP汉化破解教程之三:尝试第一次破解(文本初级篇)

    [复制链接]

发表于 2009-8-15 01:08:02 | 显示全部楼层 |阅读模式
在PSP游戏中,有文字冒险类、角色扮演类、动作类等等各种游戏类型之分。其中,不论何种类型,游戏的文本都至关重要,系统文本也好,剧情文本也好,能否导出都决定了这个游戏能否成功汉化。因此,本次教程就来交大家使用现有的软件工具——WQSG(点此下载)来导出游戏中的日文文本。

     首先来回忆一下在第一篇教程中对游戏内部资源文件的一些内容。我们知道,ISO是可以用WINRAR进行解压的,解压后我们可以从中得到很多游戏内部文件,其中包括了一些游戏预览图片,声像,还包括了游戏启动文件,和游戏资源文件。之前我曾提到在SYSDIR文件夹中有一个非常重要的游戏启动文件——BOOT.BIN,因为很多时候一些系统文本或者其他一些内容就保存在其中,那么为了判定其中是否有文本内容,就需要做一次检验,也就是利用WQSG来进行导出测试,看能不能导出一些有用的文本句子。

首先,打开WQSG


     我们先来了解一下一个新的名词——码表
     我们知道,一个记事本中如果你写入“我”这个字,那么你就直接能在上面看到这个“我”字,而对于计算机来说,它可不认识中文,它只认识数字,因此,不要被表象所迷惑住。事实上,你刚刚输入的并不是“我”,而是16进制的2个数字“CE”和“D2”,为什么你看到的明明是我而不是CE和D2呢?因为计算机已经在你输入的时候将这些只有它看得懂的“天书”转换成了你看得懂的文字了,所以,那些16进制数字是被计算机隐藏起来的(如何查看隐藏起来的“天书”我会在后面的教程中告诉大家)。学过计算机基础的人都知道,一个中文字符等于2个字节,而1个字节可以是16进制的00到FF的任一数字,比如,2D是一个字节,F2也是一个字节。因此,刚刚你输入的“我”就是由2个字节组成,分别是16进制的CE和D2。现在问题就来了,为什么“CED2”=“我”呢?计算机有这么一个问题,它虽然可以把16进制的“天书”变成文字,但是,至少它也要知道什么数字对应什么文字才可以转换,也就是需要一个参照物,那么,计算机根据这个参照物就知道,CED2=我,而C3C7=们等等。。。这个参照物我们就称他为码表。比如我们经常看到GBK这个东西,大家都知道这个代表简体中文,其实GBK2312就是一套计算机用来做参照物的一个完整的大型中文码表。

     知道了什么是码表后,我们就知道这个软件是做什么的了,其实它就是帮助我们直接将游戏文件中的隐藏“天书”通过码表转换成我们可以看得懂的文字然后显示出来。

     那么,我们要选择什么码表来做文本导出呢?码表有很多种,比如国际标准的Unicode、UTF-8、ASCII,还有中文的GBK、日文的Shift-JIS。而这个游戏的码表取决于该游戏开发商使用哪种码表来输入文字,就好象你用GBK输入“我”,你也就必须用GBK来查看“我”=“CED2”,如果你用UTF-8来查看就变成了乱码了(这也是为什么你在中国版的WINDOWS系统中输入的文章到了国外版的WINDOWS系统中查看就变成乱码的原因,两者所用来读取的码表不一样。)。因此,我们只能去一一尝试看游戏开发商到底用了哪种码表来输入日文的。在这里我可以告诉大家,日本的公司嘛,大部分当然用的是日文码表啦,因此很多游戏都是使用了Shift-JIS这套日文码表的,当然也有碰到一些用了国际标准的UTF-8或者其他,不过也是少数派了。

     现在我们知道了要尝试使用各种码表先判定游戏所使用的码表是哪一套,那么既然Shift-JIS(以下简称JIS)可能性最大,我们就从它开始。

     点此下载常用码表

     接下来我们来看软件,首先我们点击ROM按钮,选择我们需要尝试导出的那个游戏文件BOOT.BIN。然后选择JIS码表,下面的控制码表对于初学者来说可以暂时不管,因此不用选择。然后直接看下面的开始地址和结束地址,这个是软件要你告诉它从“天书”的哪个位置开始到哪个位置结束是你要导出的部分,一般情况,我们也不知道文本在这个文件的哪个位置,因此,开始地址填写0,而结束地址一般就点击下面的取段最大按钮来自动获取,这样,你就是相当于让软件将整个文件完完全全的导出来。另外请将字节过滤中的小于等于0改成2,因为,字符都是2个字节嘛,那小于2字节的当然没有必要导出来啦,肯定不是文本的了。

     然后,点击开始按钮,选择输出目录后,一会儿软件就会提示导出成功,然后你去输出目录中查看那个导出的记事本文件,双击打开,你会看到一行空一行的排列着很多乱码文字,然后你拖动滚动条,从头检查到尾部,如果你突然发现了有一行行的日文出现了,恭喜你,文本导出成功,而且我也可以提前告诉你,导入测试90%以上是成功的。如果检查了发现没有出现类似的日文句子,那就再尝试另一套码表,而假如所有的码表尝试了都没有文本出现,那就代表这个游戏文件中根本就没有文本,也可能是文本是被压缩在这个文件内部的,要解决这样的问题就留待高级篇中讲解。

     接下来还是老步骤,导入测试。首先当然是在导出的文本中找到一句可以在游戏一开始就看到的日语,然后把这句日语随意的修改一下,比如将其中的两个字替换成“我們”(必须是修改成JIS码表中存在的字,你可以打开JIS码表然后随便挑两个字出来),然后保存。回到WQSG,什么都不用变,点击导入标签,去掉验证码表重复的勾,选择“用单双字节填充”,在“单”中输入20,在“双”中输入8140,

这样写是因为假如一个文本中一行日文字有24个字节限制,但是翻译成中文后,只有20个字节了,剩余的字节是不能没有的,因此必须填充进去空格,空格在单字节中是用16进制的20表示的,双字节是16进制的81和40表示的(当然也要看码表行事啦)。然后点击开始按钮,它会让你选择你刚刚修改的新文本,然后,它便会提示你导入成功。

      这样,新的文本就返回到了这个游戏文件中,然后请打开UMDGEN v4.0(点此下载)这个ISO打包软件,打开后选择OPEN按钮,然后选择你要进行导入测试的游戏ISO(记得提前去别的盘备份一份),然后在下面的Explorer窗口中找到那个BOOT.BIN,接着把那个你导入成功的新的BOOT.BIN拖进去,它就会提示你是否替换,确定后,点击SAVE按钮,保存为ISO文件到你指定的目录。待保存完成后,你就可以把那个新的ISO文件拷贝到PSP中运行游戏,当你发现如果那个你刚刚改动的句子正常的显示了你编辑的“我們”2个字,那代表你大获成功,如果死机了,很不幸,中间出现了导入问题,可能需要用高级篇中的方法来重新尝试。当然,还有可能出现“我?”或者“我  ”这样某个字无法显示或者表现成一个问号,那说明,游戏使用的字模(容后介绍)中没有你修改的那个字,因此需要进一步的破解。。。

    不管怎么说,利用上述的软件和方法,你可以尝试BOOT.BIN和游戏中其他任何一个文件(第一篇中所指的游戏资源所保存的文件夹,也就是说去尝试所有SYSDIR文件夹和USRDIR文件夹内的文件),当你导出发现了日文的时候那种喜悦是不言而喻的。当然,我也说这个也是有成功率的(因为很多游戏开发商学会压缩文件了,因此一旦其中的文本被压缩了,那么不论你用WQSG尝试多少文件,都一定不会找到文本,这样的处理方法今后高级篇中见吧),不过成功率应该还是相对在50%以上的。因此,也是各个汉化组破解肯定会用的手段。

     这次大家学会了导出文本。下次我会教大家如何看“天书”以及介绍一下字模是什么,同时,从下一篇开始,我们也要开始转入高级篇的入门了。



游戏饭饭汉化组成员招募

本教程为游戏饭饭汉化组雷雷原创贴,转载请注明出处。。!!

下一篇:游戏饭饭PSP汉化破解教程之四:看懂天书(高级入门篇)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入饭饭  

x

点评

雷雷给力啊  发表于 2012-12-12 03:48

发表于 2009-8-15 12:16:50 | 显示全部楼层
竟然有SF坐??
强力支持

发表于 2009-8-16 14:39:17 | 显示全部楼层
感覺已經有點像天書了(炸)
是我太愚昧了??><
看不太懂
「CED2=我」←這個是指我們要輸入CED2才行,還是直接輸入「我」?電腦就可以直接轉入了??
因為字太多,看的我眼花了

发表于 2009-8-16 17:42:36 | 显示全部楼层
哇~~~又学到新知识了~~~试着导出了文本,不过字模貌似没法涵盖全部,很大一部分是乱码,貌似是角色名字设定的字库?看来必须期待高级篇了。。。

发表于 2009-8-16 18:31:30 | 显示全部楼层
本帖最后由 沙拉 于 2009-8-17 11:20 编辑

3# 凌子鳶

「CED2=我」←意思是对于电脑来说它只识别16进制,也就是CED2这类数字语言,那么你要给它一个码表让它可以转换成我们的语言“我”,雷雷已经解释过了,所以对于中文来说,比如常用的GBK码表,就能告诉电脑CED2=我,所以当它读取到程序中的16进制CED2时,就会自动识别显示给我们“我”,这样清楚么?

这是我的理解啊,我觉得雷雷的教程已经很清楚明了了啊。。。

发表于 2009-8-16 18:44:07 | 显示全部楼层
555555555555555,看来我用来做实验的游戏文字是进行了压缩编译的。。。导出了一点点像是菜单文字的部分,可是修改了导入运行ok却不显示我改动的文字,另外其他的文字都无法直接用雷雷你提供的字模导出,我估计要学习高级篇来自行编译导出字模了。。。

p.s.我重新导入文字后压缩的iso文件比原先的小。。。即使之改动了几个字。。。运行却没有问题?而且完全无变化。。。

 楼主| 发表于 2009-8-17 03:07:37 | 显示全部楼层
一般重新打包的ISO都会减小,这个无碍的,主要是要找到文本所在位置和所用码表,这个过程本身就是痛苦的,遥三导出后有几万个文件,也增加了寻找的难度

 楼主| 发表于 2009-8-17 03:14:34 | 显示全部楼层
大家应该都知道计算机是只看数字的,数字化时代就是这个概念,但是人看不懂数字,因此电脑要和人交流就必须将数字变回我们看得懂的字,因此码表就是一个用来让我们看得懂的文字和电脑看得懂的数字进行互换的一个转换器

发表于 2009-8-18 11:10:31 | 显示全部楼层
WQSG的工具已经更新很多次了啊
WQSG 导出(导入)_v2009.06050
这是他的网盘
http://e.ys168.com/?wqsg

 楼主| 发表于 2009-8-18 16:38:59 | 显示全部楼层
对用法来说,新旧版本没有多大区别,同样的码表同样的ROM导出的内容都是一样的。
您需要登录后才可以回帖 登录 | 加入饭饭  

本版积分规则

快速回复 返回顶部 返回列表