数据库 – Google BigQuery底层架构
所以我在大约10分钟前开始搞乱Google BigQuery,我想知道是否有人知道他们用来存储数据的底层架构?例如,这只是他们自己的BigTable基础设施的下一代吗?
此外,它是否清楚他们用于索引,索引重建等的各种策略?我只是想分析一下这是否足够成熟,你可以100%确定你的数据端到端的情况,或者是否有一些黑盒子区域“事情正常工作“? 解决方法没有索引……每个查询都是表扫描.查询体系结构描述为 here.您的数据以Colossus(GFS的后继者)上名为ColumnIO的专有列式格式存储. Colossus会复制数据中心内的数据,您的数据也会复制到其他地理区域,以确保即使Google数据中心脱机也能保持可用状态. 回答你的具体问题 >虽然数据可能暂时存储在Bigtable中,但所有数据都会在Colossus中长期存储(目前为止!). 如果您对有关BigQuery如何在幕后工作或如何有效使用它的更多细节感兴趣,这里是关于该主题的book的无耻插件,将于6月份发布. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- sql-server – 如何在SQL Server中生成GUID?
- ADO.NET Entity Framework中自增长列问题 (Identity)
- SQLServer 按装错误大全
- sqlserver 2008 R2 删除重复数据
- sqlserver 2005 高可用性架构 日志传送
- SQL SERVER性能优化综述(很好的总结,不要错过哦)第1/3页
- sql – 这两个查询是否相同 – GROUP BY与DISTINCT?
- sql-server – 启用触发器时缓慢删除记录
- sql – 如何使用存储过程使用while选择一个值
- sql-server – 以十六进制显示的时间戳字段中的值(0x000000