NoSQL学习之路(四):创建、读取、更新、删除(CRUD)
本文地址:http://www.cnblogs.com/egger/archive/2013/05/01/3053239.html 欢迎转载 ,请保留此链接??? ????! 本文介绍数据库的4个基本操作:创建、读取、更新和删除(CRUD)。 MongoDB没有类似sqlserver 的manager studio、mysql的workbench等工具。接下来的数据库操作演示,我们只能使用MongoDB自带简洁但功能强大的JavaScript shell,MongoDB shell是一个独立的DB客户端(它也是功能完备的JavaScript解释器 可以运行任何JavaScript程序),MongoDB shell的使用介绍请阅读博文《NoSQL学习之路(三):MongoDB Shell的使用》。 CRUD1.C 创建insert函数添加一个文档到集合里面。 直接将文档作为参数: >db.post.insert({"title":"Ex.1"}) 或者将文档赋值给变量,变量作为方法的参数。 下面我们添加一篇文章。首先,创建一个局部变量post,JavaScript对象作为文档的内容的赋值给post。里面会有"title","author","content"和"date"等键值。
使用count()查询集合中文档条数:
当我们成功的插入一条文档到集合中后,我们会发现多了一个键"_id"和自动生成的ObjectId类型值。[详情:MongoDB的ObjectID] 当插入多个文档到一个集合的时候,请使用批量插入会快一些。批量插入能传递一个由文档构成的数组给数据库。这样避免了许多零碎的请求所带来的开销。 要是只是导入原始数据(例如,从MySQL中导入 ),可以使用命令行工具,如mongoimport,而不是使用批量插入。另一方面,可以用它在存入MongoDB之前对数据做一些小的修整(转换日期成为日期类型,或添加自定义的"_id"所以批量插入对导入数据来说也是有用的。 当执行插入的时候,使用的驱动程序会将数据转换成BSON的形式,然后将其送入数据库。数据库解析BSON,检验是否包含"_id"键并且文档不超过4MB。要查看doc文档转为BSON的大小(以字节为单位),在shell中运行 Object.bsonsize(doc)即可。 2.R读取find会返回集合里面所有的文档。findOne(注意大小写 findone 是无效的)查看一个文档。 find和findOne可以接受査询文档形式的限定条件。这将通过査询限制匹配的文档。使用find时,shell自动显示最多20个匹配的文档,但可以获取更多文档。
3.U更新更新操作是原子的:若是两个更新同时发生,先到达服务器的先执行,接着执行另外的。 update接受(至少)两个参数:第一个是要更新文档的限定条件,第二个是新的文档。 注意:若是集合中有多个文档匹配查询条件,更新时会查询条件匹配了,然后更新的时候由于第二个参数的存在就产生重复的"_id"值,数据库会报错。限定条件尽量只能筛选出一条文档记录来。 假设决定给我们先前写的文章增加标签,则需要增加一个新的键,对应的值是存放标签的数组。
shell输入post回车,post变量中文档值已经包含了tags数组了。
使用update方法更新文档后,文档中便有了"tags"键的内容。 4.D删除remove用来从数据库中永久性地删除文档,不能回复和撤销。 在不使用参数进行调用的情况下,它会删除一个集合内的所有文档,不会删除集合本身,原有的索引也会保留。。 >db.posts.remove() 它也可以接受一个文档以指定限定条件作为参数。现在集合中只有一条文档记录,我们指定限定条件进行删除操作::
如果要清除整个集合,直接删除集合(然后重建索引)会更快,使用drop_collection函数。 >>db.drop_collection(collection_name) Objectld官方wiki:http://docs.mongodb.org/manual/reference/object-id/ 当我们成功的插入一条文档到集合中后,我们会发现多了一个键"_id"和自动生成的ObjectId类型值。通常会在客户端由驱动程序完成。原因如下:
集合中每个文档都有唯一的"_id"值,来确保集合里面每个文档都能被唯一标识。Objectld是"_id"的默认类型,它是一种轻量型的,不同的机器都能用全局唯一的同种方法轻量的生成它。mongodb从开始设计就被定义为分布式数据库,处理多个节点是一个核心要求。若采用传统的自增主键策略,在多台服务器上同步自动增加主键既费力又费时。
ObjectId占用12字节的存储空间,每个字节两位十六进制数字,是一个24位的字符串。由“时间戳” 、“机器名”、“PID号”和“计数器”组成。使用机器名的好处是在分布式环境中能够避免单点计数的性能瓶颈。使用PID号的好处是支持同一机器内运行多个mongod实例。最终采用时间戳和计数器的组合来保证唯一性。
2.机器名 3个字节。所在主机的唯一标识符。通常是机器主机名的散列值,机器名通过Md5加密后取前三个字节。 3.PID 2个字节。为了确保在同一台机器上并发的多个进程产生的Objectld是唯一的,所以加上进程标识符(PID).注意到每次重启mongod进程后PID号通常会发生变化就可以了。 前9字节保证了同一秒钟不同机器不同进程产生的Objectld是唯一的。 4.计数器 3个字节,表示的取值范围就是256*256*256=16777216。一个自动增加的计数器,确保相同进程同一秒产生的Obj ectld也是不一样的同一秒钟最多允许每个进程拥有2563 (16 777 216)不同的Objectld。 MongoDB的Python驱动python环境下载:http://www.python.org/download/ pymongo驱动下载:https://pypi.python.org/pypi/pymongo/ window环境下,pymongo选择类型为MS Windows installer。同时注意对应的python版本和系统(32or 64bit).需事先安装好python环境,pymongo检测到python安装路径,只需下一步到完成即可。
然后打开python命令行控制台程序。
下面是官方提供的基本示例: 创建连接
下面我们使用python语言往集合中插入1000000条文档记录,然后再清空该集合,并显示清空操作花费时间。 下面演示将使用Python shell.
新建.py文件。 import pymongo client = pymongo.MongoClient("localhost",27017) db = client.test #查看test数据库中集合信息 print (db.collection_names()) #连接到my_collection集合 print (db.my_collection) #清空my_collection集合文档信息 db.my_collection.remove() #显示my_collection集合中文档数目 print (db.my_collection.find().count()) #插入1000000条文档信息 for i in range(1000000): db.my_collection.insert({"test":"tnt","index":i}) #显示my_collection集合中文档数目 print ('插入完毕,当前文档数目:') print (db.my_collection.find().count()) 通过Python shell打开该文件,然后按“F5”或者点击“run”->"run module",运行该文件,执行操作。
运行后,python shell 光标闪烁,因为数量较多,等待片刻。
文档成功插入后:
运行下面的代码,执行清空集合操作。 import time from pymongo import Connection db=Connection().test collection = db.my_collection start = time.time() collection.remove() collection.find_one() total = time.time()-start print ("删除1000000条文档共计耗时:%d seconds" % total) 结果如下:
参考:1.MongoDB权威指南 2.MongoDB的ObjectId 3.理解MongoDB默认的ObjectID 4.pymongo 使用小结 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |