第五十一课 NoSQL基础概念及MongoDB应用、数据库分配概念
一、NoSQL基础概念 NoSQL(Not Only SQL),是一种技术流派,非关系型数据库;适合用在大数据领域,各种nosql有各自的查询语句,这也是nosql的缺点之一。 大数据(BigDate)也称海量数据是一个模糊的概念,像Google、百度收集大量数据,分析现在、预测未来;这些数据通过某些特定的特征和算法得出某些预测的结果,这些数据为大数据。 大数据的四种形式: 1、 并行数据库:关系型数据库水平切割,分区查询 2、NoSQL数据库管理系统:非关系模型,分布式,不支持ACID数据库设计范式成为NoSQL 优点:简单数据模型、元数据和数据分离、弱一致性、高吞吐量、高水平扩展能力和低端硬件群集 缺点:数据模型没有经过验证、不支持ACID特性、功能简单、没有统一的查询语言 3、NewSQL数据库管理系统:代表产品Cluterix、GenieDB、ScaleBase、NimbusDB、Drizzleyun 4、云数据管理系统: 大数据的分析处理: MapReduce 最终一致性细分: 因果一致性、读自己写一致性、会话一致性、单调读一致性、时间轴一致性 ACID: 强一致性、隔离性、采用悲观保守的方法、难以变化; BASE:弱一致性、可用性优先、采用乐观的方法、适应变化、更简单、更快 数据一致性的实现技术:NRW、2PC、Paxos、Vector Clock 数据存储模型: www.nosql-databases.org 列式存储模型 、文档数据模型 、 键值数据模型 、图式数据模型 列式模型: 应用场景:在分布式文件系统之上提供支持随机读写的分布式数据存储 典型产品:Hadoop/HBase、Hypertable(Facebook研发)、Cassandra(Facebook) 数据模型:以“列”为中心进行存储,将同一列数据存储在一起 优点:快速查询、高可扩展性、易于实现分布式扩展 文档模型: 应用场景:非强事务需求的web应用 典型产品:MongoDB、ElasticSearch、CouchDB、CouchBase Server 数据模型:键值模型,存储为文档 优点:数据模型无须事先定义 键值模型: 应用场景:内容缓存,用于大量并行数据访问高负载场景 典型产品:DynamoDB(亚马逊研发)、Riak、Redis、MemcacheDB(新浪研发) 数据模型:基于哈希表实现的key-value 优点:查询迅速 图式模型: 应用场景:社交网络、推荐系统、关系图谱 典型产品:Neo4j、Infinite Graph、TiTan 数据模型:图式结构 优点:适应于图式计算场景 二、MongoDB (官方下载站点 www.mongodb.org/downloads/) MongoDB是Nosql的一种,文档数据存储模型,jons数据模型,功能次于MySQL,性能强于MySQL。 CentOS RPM包下载地址:http://downloads-distro.mongodb.org/repo/redhat/os/x86_64/RPMS/ 安装mongodb:三个包 (mongo-org-server.rpm、mongol-org-shell.prm客户端、mongol-org-tools.rpm工具) #rpm -ql mongodb 查看mongodb配置文件为/etc/mongod.conf #mkdir -pv /mongodb/data 自定义数据库存放路径(默认/var/lib/mongo) #chown -R mongod:mongod /mongodb/ (系统默认创建mongod用户来运行mongod,修改目录权限) #vi /etc/mongod.conf 修改配置文件中定义的数据库路径 #配置文件打开http接口: httpinterface=true (添加rest=true) #service mongod start #ls /mongodb/data (查看数据库初始化话的数据,非常大) #du -sh /mongodb/data/ 显示3.1G #ss -tnl #查看监听的27017和28017端口 #mongo --host 172.16.100.7 #连入数据库 >show dbs #无需创建数据库,创建collections(容器,相当于表)后自动延时创建数据库! >db.stats() #查看数据库信息 >db.serverstats() #查看服务器状态 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |