加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

nosql – Cassandra CQL时间范围查询

发布时间:2020-12-13 13:28:31 所属栏目:百科 来源:网络整理
导读:我有一个Cassandra列系列,我每月存储大量(数十万)个事件,时间戳(“Ymdhisu”)作为行键.它有多列为每个事件捕获一些数据.我尝试检索特定时间范围的事件数据.例如,对于Jan,我使用了以下CQL查询: a)2013年1月1日至1月15日之间的查询 select count(*) from Test
我有一个Cassandra列系列,我每月存储大量(数十万)个事件,时间戳(“Ymdhisu”)作为行键.它有多列为每个事件捕获一些数据.我尝试检索特定时间范围的事件数据.例如,对于Jan,我使用了以下CQL查询:

a)2013年1月1日至1月15日之间的查询

select count(*) from Test where Key > 20130101070100000000 and Key <
20130115070100000000 limit 100000; Bad Request: Start key’s md5 sorts
after end key’s md5. This is not allowed; you probably should not
specify end key at all,under RandomPartitioner

b)2013年1月1日至1月1日范围内的查询

select count(*) from Test where Key > 20130101070100000000 and Key <
20130110070100000000 limit 100000; count – 73264

c)2013年1月1日至1月1日范围内的查询

select count(*) from Test where Key > 20130101070100000000 and Key <
20130102070100000000 limit 100000; count – 78328

似乎范围搜索根本不起作用!我的Columnfamily的架构是:

Create column family Test with comparator=UTF8Type and default_validation_class=UTF8Type and key_validation_class=UTF8Type AND compression_options={sstable_compression:SnappyCompressor,chunk_length_kb:64};

要提取数据,有什么建议?我是否需要使用密钥验证类重新定义我的模式作为TimeUUID类型?有没有其他方法可以有效地查询而不更改架构?
我在这个专栏系列中每月处理至少100-200K行的数据.如果此模式不能用于此目的,那么存储和检索此处描述的数据类型的Cassandra模式是什么?

解决方法

您可以创建二级索引,例如“日期”和“月”,并将每个事件的日期和月份与其他数据一起存储在这些列中.查询数据时,您可以获取指定月份或天数的所有行.

我不认为Keys上的范围查询会起作用.也许你将分区器从RandomPartitioner更改为ByteOrderedPartitioner?

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读