加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > MySql教程 > 正文

php – 计算趋势主题

发布时间:2020-12-11 23:50:49 所属栏目:MySql教程 来源:网络整理
导读:假设我正在根据各种标准从twitter收集推文,并将这些推文存储在本地mysql数据库中.我希望能够使用计算机热门话题,比如twitter,可以是1-3个单词的长度. 是否有可能编写一个脚本来做这样的PHP和mysql? 我已经找到了在你能够获得术语计数后如何计算哪些术语“热

假设我正在根据各种标准从twitter收集推文,并将这些推文存储在本地mysql数据库中.我希望能够使用计算机热门话题,比如twitter,可以是1-3个单词的长度.

是否有可能编写一个脚本来做这样的PHP和mysql?

我已经找到了在你能够获得术语计数后如何计算哪些术语“热”的回答,但我坚持第一部分.如何将数据存储在数据库中,如何计算数据库中1-3个字长的术语频率?

最佳答案 来自我的热门话题收据:
1.获取推文
2.将每个推文按空格分成n-gram(如果你想要3个字长,最多3克)数组
3.从url,@ username,常用词和垃圾字符中过滤掉每个数组
4.统计所有独特的关键字/短语频率
5.静音一些垃圾词/短语

是的,你可以在php& mysql;)

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读