从具有加权行概率的PostgreSQL表中选择随机行
发布时间:2020-12-13 16:28:56 所属栏目:百科 来源:网络整理
导读:示例输入: SELECT * FROM test; id | percent ----+---------- 1 | 50 2 | 35 3 | 15 (3 rows) 你如何编写这样的查询,平均50%的时间我可以得到id = 1的行,35%的时间行id = 2,15%的时间行id = 3? 我尝试像SELECT id FROM测试ORDER BY p * random()DESC L
示例输入:
SELECT * FROM test; id | percent ----+---------- 1 | 50 2 | 35 3 | 15 (3 rows) 你如何编写这样的查询,平均50%的时间我可以得到id = 1的行,35%的时间行id = 2,15%的时间行id = 3? 我尝试像SELECT id FROM测试ORDER BY p * random()DESC LIMIT 1,但它给出错误的结果. 10,000次运行后,我得到一个分布,如:{1 = 6293,2 = 3302,3 = 405},但我预计分布接近:{1 = 5000,2 = 3500,3 = 1500}. 有任何想法吗?
这应该是诀窍:
WITH CTE AS ( SELECT random() * (SELECT SUM(percent) FROM YOUR_TABLE) R ) SELECT * FROM ( SELECT id,SUM(percent) OVER (ORDER BY id) S,R FROM YOUR_TABLE CROSS JOIN CTE ) Q WHERE S >= R ORDER BY id LIMIT 1; 子查询Q给出以下结果: 1 50 2 85 3 100 然后我们在范围[0,100]中简单地生成一个随机数,并选择该数字以上的第一行(WHERE子句).我们使用通用表表达式(WITH)来确保随机数仅计算一次. BTW,SELECT SUM(percent)FROM YOUR_TABLE允许您以百分比表示任何权重 – 它们不会严格需要百分比(即加起来为100). [SQL Fiddle] (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |