text – 哪里可以获得几乎所有英语单词的列表?
我想得到一些随机文本.
我尝试编写一个基本的Java程序, int nowords = r.nextInt(2000); int i,j; for (i = 0; i < nowords; i++) { int lengthofword = r.nextInt(10) + 2; for (j = 0; j < lengthofword; j++) { int ch = r.nextInt(26); System.out.print(alphabet[ch]); } System.out.print(" "); } 结果如下:
如果文本至少是可读的而不是这样,那将会很有帮助. 我正在考虑使用英语单词并从中随机选择来制作句子. 解决方法
自然语言处理的黄金标准是Word000在
http://wordnet.princeton.edu/.它有一个活动的用户组,具有与单词相关的语义和语法,以及与其他NLP工具的接口.如果您正在考虑使用单词进行计算,那么您一定要看看.
然而,随机选择单词并不会产生有用的句子,我怀疑你会对结果感到失望.看看OpenNLP等工具包,其中有许多工具,包括你肯定需要的词性(POS). 即使你的句子可能有有效的语法,你也需要阅读乔姆斯基和其他人的作品.他的“无色的绿色想法疯狂地睡着”http://en.wikipedia.org/wiki/Colorless_green_ideas_sleep_furiously说明了这个问题. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |