加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – 将单词添加到WordNet的本地副本

发布时间:2020-12-20 13:39:07 所属栏目:Python 来源:网络整理
导读:我正在使用WordNet,通过 Python的NLTK访问,以比较来自社交媒体的单词的同义词.其中许多单词不在NLTK连接的WordNet版本中. 当我说出我的话时,我指的是特定领域的术语,而不是缩写词或表情符号. 我编译了这些单词的列表,并希望将该列表与WordNet合并. 搜索先前
我正在使用WordNet,通过 Python的NLTK访问,以比较来自社交媒体的单词的同义词.其中许多单词不在NLTK连接的WordNet版本中.

当我说出我的话时,我指的是特定领域的术语,而不是缩写词或表情符号.

我编译了这些单词的列表,并希望将该列表与WordNet合并.

搜索先前的努力开始尝试开发自动更新WordNet的方法.

我想象的步骤是:

>克隆WordNet数据库
>编写寻找本地副本的WordNet模块的扩展
>更新本地副本.

这听起来有多合理?

解决方法

我自己还没有改变过WordNet,但是我在使用 Multilingual Central Repository时有很好的经验,我相信你应该能够用你想做的事情.

它包含几种语言(包括英语)的WordNet 3.0数据文件,这些语言通过所谓的语际索引(ILI)相互联系.数据文件可以加载到MySQL或PostgreSQL数据库表中,从这一点来说,不仅要使用SQL命令查询它,而且要插入新项目,维护表之间的对应关系应该相对容易.您当然可以导出已更改的数据库,例如如果使用SQL不足以达到您的目的,则转换为CSV文件.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读