关于时间序列事件的数据库建议
对于我的一个项目,我必须输入一个大的事件集合到一个数据库中进行后续处理,并且我试图决定哪个DBMS最适合我的目的.
我有: >目前约有400,000,000个离散事件 这些事件有各种格式,但我估计个人属性的数量约为5000.大多数事件只包含大约100个属性的值.属性值被视为任意字符串,在某些情况下也被视为整数. 这些事件最终将被整合成一个单一的时间序列.虽然它们有一些内部结构,但是没有其他事件的引用,我相信这意味着我不需要一个对象DB或一些ORM系统. 我的要求: >开源许可证 – 我可能需要调整一下. 我的理想数据库将允许我使用单个查询从指定的时间段检索所有事件. 到目前为止我已经发现/考虑过 > Postgresql增加的页面大小可以显示每个表中最多6000列.如果我对属性计数的估计不是关闭的,那可能会. 可能有其他的数据库可以做到这一点,所以请随时让我知道 – 我会感谢任何可能帮助我的建议或评论. PS:我只有DB管理员的经验很少,所以我对任何误解都表示歉意. 解决方法使用数千列的表是疯狂的.特别是当他们大多数为零时,就像你说的那样.您应该首先考虑从以下转换您的数据结构: table_1 ------- event_id attribute_1 attribute_2 [...] attribute_5000 变成这样的东西: table_1 event_values attributes -------- ------------ ---------- event_id event_id attribute_id attribute_id attribute_type attribute_value 可以与任何RDMS一起使用(您的唯一约束将是数据库的总体规模和性能) (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |