VNR共享辞书中翻译的转码和代理
源地址:http://sakuradite.com/topic/724 优先进入官网看,官网不行再观看本文 坏掉的功能 由于共享辞书的变更,部分以前的功能变得不那么好用了。 后缀:兄=>哥哥 VNR改为使用和VTrans相同的SynCFG的来处理词条。 共享辞书中所有翻译、姓名、前缀、后缀、读法的词条都会被编译为SynCFG的语法。下边是一些SynCFG语法的例子: 翻译:こんにちは=>你好 SynCFG:x|||こんにちは|||你好 姓名:ゆい=>由依 SynCFG:m|||ゆい|||由依 后缀:ちゃん=>酱 SynCFG:m|||[[m]]ちゃん|||[[m]]酱 m|||[[m]]ちゃん|||[[m]]酱 v|||殺す|||杀死 x|||[[m]]を[[v]]||[[v]][[m]] x|||[[m,n]]を[[v]]|||[[v]][[m,n]] 另外当role只有一个时,翻译中的role的表达式是可以省略的。比如下边的规则都是等价的: adj|||[[m,n#1]]の=>[[m,n#1]]的 不要用字母Z。VNR内部保留Z做别的拥堵。自定义的role请用至少两个字母表示。单个的字母还是保留给VNR以后可能的用途吧。 添加了新的代理词条,可以用来定义编码特定翻译Role的方法。 比方说:如果为m(姓名)定义了"佐藤=>佐藤"的词条。 那么VNR在编码m词条时,就会用佐藤来替代姓名了。 这样就可以避免姓名翻译词条会扰乱翻译的问题了。 要注意的是,代理词条的添加会是很危险的,词条提交后,VNR默认总是设定为私有的。大家一定要debug,debug,再debug,毫无问题后,再设定代理词条为公开才好。 另外,代理词条最好要避免出现简体字才好。比如:斉藤=>齐藤,由于齐是简体字,设定为代理词条可能会扰乱正体中文的翻译的。要选择那些比如:佐藤那样,不包含简体字的+翻译器认识的+一一对应的姓名作为代理词条才好。 再比如:"ゆい=>由依"就不是一个好的代理词条。因为有些其他姓名(比如:ユイ、由依)的翻译也可能是由依。翻译和原始的姓名不是一一对应的。
另外,这样也可以让VNR鼠标查词的时间复杂度从O(N)降到O(1)(N为字典的容量),来实现瞬时的取词,不用像现在这样还要等待五秒钟。
回答: 刚刚添加语法可以用比如吧:[[m,x]]来代表一个m和x的set。
回答: 其实那个代理主要就是为了修正名字的。通过使用代理可以是的替换自定义人物姓名变得non-intrusive,机器翻译不会被替换后的1234.567之类的影响到了。
回答: 恩,后缀规则可以被迭代。比如:如果定义了「さま=大人」和「の=的」的后缀,那么「さまの」就会被翻译成【大人的】。 然而,「のさま」也会被翻译成【的大人】,而这应该不是我们想要的。我觉得【の】最好先不要定义为后缀。比如,如果像下边这样定义: m|||[[m]]さな|||[[m]]大人 adj|||[[m]]の|||[[m]]的 那么就只有「さなの」会被翻译为形容词,而「のさな」不会被翻译了。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |