加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

由写Grails过滤不良信息的Service引发的中文乱码问题

发布时间:2020-12-14 17:00:39 所属栏目:大数据 来源:网络整理
导读:? 由写Grails过滤不良信息的Service引发的中文乱码问题 在一个Grails项目里面,我想写一个过滤不良信息的Service,而将过滤的规则放置在xml文件之中。 以下xml文件放置不良信息,包含单词、词组和句法,支持正则表达式: filter ? words ?? word fuck / word

?由写Grails过滤不良信息的Service引发的中文乱码问题

在一个Grails项目里面,我想写一个过滤不良信息的Service,而将过滤的规则放置在xml文件之中。

以下xml文件放置不良信息,包含单词、词组和句法,支持正则表达式:

< filter >

?
< words >

??
< word > fuck </ word >

??
< word > 反人民 </ word >

??
< word > 去死吧 </ word >

??
< word > kill </ word >

??
< word > bitch </ word >

?
</ words >

?
< phrases >

??
< phrase > ass?hole </ phrase >

??
< phrase > beat?you </ phrase >

?
</ phrases >

?
< grammars >

??
< grammar > 杀死*你 </ grammar >

??
< grammar > kick?.*ass </ grammar >

??
< grammar > impud.nce </ grammar >

?
</ grammars >

</ filter >

然后是一个完成过滤功能的Service:

class ?FilterService? {

????????def?
private?static?node?=?new?XmlParser().parse(new?File('./config/filter.xml'))

????
static?String?filter(String?source)?{


????????def?substitution?
=?node.substitution.text()

????????def?sensitive?
=?[node.words.word*.text().join('|'),

?????????????????????????node.phrases.phrase
*.text().join('|'),

?????????????????????????node.grammars.grammar
*.text().join('|')].join('|')


????????
if(!source?||?!sensitive)return?source

????????
return?source.replaceAll(sensitive,substitution)


????}

}

就这样的代码,结果在Grails运行时出现中文问题,并且不止是页面,在filter方法里面就已经无法正确显示中文,而Service中同样的代码在普通Groovy应用程序中就没有中文问题。

按照以前J2EE开发的经验,尝试使用如下方法:

String?resultString? = ? new ?String(testString.getBytes( " iso-8859-1 " ), " UTF-8 " )

依旧乱码……

再次尝试:增加定义的运行参数-Dfile.encoding=UTF-8
无效……

xml文件中加入

<? xml?version="1.0"?encoding="UTF-8" ?>

仍然无效……

?


?

琢磨了半天,得出解决方案:

譬如打算将整个项目编码统一成UTF-8格式的,我使用Eclipse开发,我的Eclipse默认的的编码是GBK的,那么这个可以保持不变,在项目上单击右键,选择Properties中的Resource,将Text file encoding设置成UTF-8。

注意:这样的后果是项目groovy等文件中原本使用GBK的中文会变成乱码!因此请选择合适的编码。

之后删除运行参数-Dfile.encoding=UTF-8,为什么使用了自定义运行编码参数反而出乱码,我也不知道。

再做一则改动

// 将原来的

def?node? = ? new ?XmlParser().parse( new ?File( ' ./config/filter.xml ' ))

// 改为

def?node? = ? new ?XmlParser().parseText( new ?File( ' ./config/filter.xml ' ).getText())

最后,页面上面老规矩,加上<meta http-equiv="Content-Type" content="text/html; charset=GBK" />就可以了。

如果你的编码是GBK的,一样处理。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读