加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

Groovy高效编程——统计单词频率

发布时间:2020-12-14 16:56:29 所属栏目:大数据 来源:网络整理
导读:摘要: Groovy横空出世,她几乎兼容Java的所有语法,Groovy至少已经具备了继承未来主流语言王位的必要条件--语言本身是利用当前主流语言所编写,并与当前主流语言的语法相似,且能够结束当前主流语言的弊

摘要:Groovy横空出世,她几乎兼容Java的所有语法,Groovy至少已经具备了继承未来主流语言王位的必要条件--语言本身是利用当前主流语言所编写,并与当前主流语言的语法相似,且能够结束当前主流语言的弊病。

在搜索引擎,语音识别等领域常会统计单词的出现频率,下面给出Groovy实现,打印出现频率最高的6个单词以及相应的出现次数:

?

 def content    =   
     """
    The Java Collections API is the basis   for   all the nice support that Groovy gives you
    through lists and maps. In fact,Groovy not only uses the same abstractions,it
    even works on the very same classes that make up the Java Collections API.
     """
 
def words  =  content.tokenize()

def wordFrequency  =  [:]

words.each {
    wordFrequency[it]  =  wordFrequency.get(it,0 )  +   1  
} 

def wordList  =  wordFrequency.keySet().toList()

wordList.sort {wordFrequency[it]} 

def result  =   ''  

wordList[ - 1 .. - 6 ].each {
    result  +=  it.padLeft( 12 )  +   " :  "   +  wordFrequency[it]  +   "  /n  "  
} 
 
println result  

运行结果:

?

             the: 5
   Groovy: 2
          that: 2
 Collections: 2
         Java: 2
        same: 2   

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读