加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

postgresql – 如何在Postgres中执行简单的map reduce?

发布时间:2020-12-13 16:07:57 所属栏目:百科 来源:网络整理
导读:我在postgres中使用trigrams进行全文搜索,如下所示: SELECT * FROM "Users" users WHERE 'search_text' % ANY(regexp_split_to_array(users.name,E's+')) 上面的查询检查search_text是否匹配User.displayName中的任何单词(由空格分割).这可行,但结果不按
我在postgres中使用trigrams进行全文搜索,如下所示:

SELECT * 
FROM "Users" users 
WHERE 'search_text' % ANY(regexp_split_to_array(users.name,E's+'))

上面的查询检查search_text是否匹配User.displayName中的任何单词(由空格分割).这可行,但结果不按实际“得分”排序.

分数可以通过相似性(文本,文本)函数来计算.

问题是我必须按顺序排序User.name中每个单词的所有相似之处.因此,如果用户名是“A B C”,则其分数应为:

similarity('search_text','A') + similarity('search_text','B') + similarity('search_text','C')

所以我需要将用户名字映射到分数,然后对它们求和(减少).我怎样才能在postgres中做到这一点?

解决方法

而不是拆分为分裂为集合的数组,然后重新组合相似性的总和

with users as (
    select user_id,name
    from (values (1,'John Smith')) t(user_id,name)
)
select user_id,sum(similarity('smth',name_part))
from (
    select user_id,regexp_split_to_table(name,E's+') as name_part
    from users
) users
where 'smth' % name_part
group by user_id
order by 2 desc
;
 user_id |  sum  
---------+-------
       1 | 0.375

我不确定你想要消除相似度低于阈值的那些名称部分.如果不是省略where子句

顺便说一下,你为什么需要拆分这个名字?为什么不将整个名称与搜索字符串进行比较?

with users as (
    select user_id,name)
)
select similarity('jon smth',name),*
from users
order by 1 desc
;
 similarity | user_id |    name    
------------+---------+------------
   0.333333 |       1 | John Smith

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读