加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

Python nltk 之 snowball 提取词干的简单示例

发布时间:2020-12-17 17:51:43 所属栏目:Python 来源:网络整理
导读:对python这个高级语言感兴趣的小伙伴,下面一起跟随编程之家 jb51.cc的小编两巴掌来看看吧! 机器学习中很重要的应用场景就是机器自动分类,而分类的关键是词干提

对python这个高级语言感兴趣的小伙伴,下面一起跟随编程之家 52php.cn的小编两巴掌来看看吧!

机器学习中很重要的应用场景就是机器自动分类,而分类的关键是词干提取。所以我们要用到snowball。

下面说一下snowball 提取词干的两种方法。

两种方法:

方法一:


# 来自52php.cn 
>>> from nltk import SnowballStemmer
>>> SnowballStemmer.languages # See which languages are supported
('danish','dutch','english','finnish','french','german','hungarian','italian','norwegian','porter','portuguese",'romanian','russian','spanish','swedish')
>>> stemmer = SnowballStemmer("german") # Choose a language
>>> stemmer.stem(u"Autobahnen") # Stem a word
u'autobahn'

# End www.52php.cn
但是当你知道你使用的语言场景的时候可以使用下面的方法直接调用:

方法二:

# 来自52php.cn 
>>> ps = nltk.stem.snowball.PortugueseStemmer()
>>> ps.stem('celular')
u'celul'
>>> ps.stem('celular')
u'celul'

# End www.52php.cn

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读