MongoDB 基础_全栈工程师笔记

一、数据类型

1.1 BSON

文档 (Documents) 是 MongoDB 中数据的基本单元，它是键值对的有序集合，在数据结构上类似于 JSON，但是由于 JSON 只支持基本的 6 种数据类型：null，布尔，数字，字符串，数组和对象，因此其表达能力有限，所以 MongoDB 基于 JSON 拓展出新的数据格式 BSON 。BSON (Binary JSON) 是类似 JSON 文档的二进制编码序列化格式，与 JSON 类似，但支持更多的数据类型。当前 MongoDB 4.0 的 BSON 支持以下所有的数据类型：

Type （类型）	Alias （别名）	Notes （注释）
Double	“double”	双精度型
String	“string”	字符串类型，默认的编码类型为 UTF-8
Object	“object”	对象类型
Array	“array”	数据类型
Binary data	“binData”	二进制数据
Undefined	“undefined”	该数据类型已经废弃
ObjectId	“objectId”	对象 id
Boolean	“bool”	布尔值
Date	“date”	日期类型
Null	“null”	空
Regular Expression	“regex”	正则表达式
DBPointer	“dbPointer”	该数据类型已经废弃
JavaScript	“JavaScript”
Symbol	“symbol”	该数据类型已经废弃
JavaScript (with scope)	“javascriptWithScope”
32-bit integer	“int”	32 位整型
Timestamp	“timestamp”	时间戳类型
64-bit integer	“long”	64 位整型
Decimal128	“decimal”	3.4 版本新增的数据类型，类似 Java 中的 BigDecimal 类型，用于解决浮点型丢失精度的问题
Min key	“minKey”
Max key	“maxKey”

1.2 ObjectId

在上面的表格中有一个比较重要的数据类型是：ObjectId 。存储在 MongoDB 集合中的每个文档都有一个唯一的 _id 字段作为主键，可以在插入的时候手动指定，或者由程序自动生成，这个字段可以是任何的数据类型，默认是 ObjectId 类型。ObjectId 使用 12 字节的存储空间，是一个由 24 个十六进制数字组成的字符串，每个字符串可以存储两个十六进制数字：

前 4 个字节是从标准纪元开始的时间戳，单位为秒；
中 5 个字节是由两个部分组成：前 3 个字节是所在主机的唯一标识，通常是主机名的散列值，用于保证不同主机生成不同 ObjectId ，后两个字节是进程标识符 (PID) ，用于保证同一主机上不同进程产生不同的 ObjectId。
最后 3 个字节是一个自动增加的计数器，确保相同主机上相同进程在同一秒产生的 ObjectId 也是不同的，即每个进程一秒最多可以拥有 16777216 个不同的 ObjectId (16777216 = (2**8)**3，1 个字节等于 8 位二进制) 。

二、新增数据

db.collection.insert()

在 MongoDB 3.2 之前，插入数据的语法如上，可以用于插入单条或者多条数据。在 3.2 之后，MongoDB 为了增强 API 的语义，增加了如下两个 API ，分别用于显示表达插入单条数据和多条数据的行为：

db.collection.insertOne() 
db.collection.insertMany()

新增单条数据的示例如下。额外需要说明的是，在插入文档前，文档所属的集合不必预先创建，程序会自动创建：

db.user.insertOne({
    name: "heibai",
    age: 26,
    birthday: new Date(1998,08,23),
    createTime: new Timestamp(),
    Hobby: ["basketball", "football", "tennis"]
})

新增多条数据的示例如下：

db.user.insertMany([
    {
        name: "hei",
        age: 32,
        birthday: new Date(1989,08,23),
        createTime: new Timestamp(),
        Hobby: ["basketball", "football", "tennis"]
    },
    {
        name: "ying",
        age: 46,
        birthday: new Date(1978,08,23),
        createTime: new Timestamp(),
        Hobby: ["basketball", "football", "tennis"]
    }
])
# 此时会返回新插入的数据的ObjectId
{
    "acknowledged" : true,
    "insertedIds" : [
        ObjectId("5d3d0489ad38cd3becc7b03b"),
        ObjectId("5d3d0489ad38cd3becc7b03c")
    ]
}

三、查询数据

3.1 基本 API

查询数据的基本语法如下：

db.collection.find(<query>, <projection>)

<query>：用于指定查询条件，不加任何条件则默认查询集合中全部数据；
<projection>：可选操作，用于过滤返回字段，1 表示对应的字段包含在返回结果中，0 表示不包含，示例如下：

db.user.find({},{name: 1, ObjectId:-1})}

3.2 等值查询

想要查询某个字段等于指定值的数据，可以使用如下语法：

db.user.find({name:"heibai"})

上面的语法实际上是 $eq 操作的简写形式，如下：

db.user.find({name: {$eq: "heibai"}})

所以如果你想要进行非等值查询，则可以使用 $ne 操作符，代表 not equal ，示例如下：

db.user.find({name: {$ne: "heibai"}})

特别的，如果你想允许某个字段等于多个值，可以使用 $in 操作符，示例如下：

db.user.find({name: {$in:["heibai","ying"]} })

3.3 范围查询

MongoDB 提供了比较操作符 $lt、$lte、$gt 和 $gte ，分别对应和 >= ，主要用于范围查查询，示例如下：

db.user.find({age: {$gt: 20, $lt: 40}})

3.4 逻辑查询

MongoDB 提供了逻辑操作符 $or、$and、$not、$nor ，用于处理多个条件间的逻辑关系，示例如下：

查询姓名为 heibai 或者年龄大于 30 岁的所有用户，此时可以使用 $or 操作符：

db.user.find( { $or: [{ name: "heibai" }, { age: { $gt: 30 } }] })

查询姓名不是以 hei 开头的所有用户，此时可以使用 $not 操作符来配合正则表达式：

db.user.find({name: {$not: /^hei*/}})

如果要求 name 字段的值不能为 heibai， age 字段的值不能大于 30，则对应的查询语句如下：

db.user.find( { $nor: [{ name: "heibai" }, { age: { $gt: 30 } }] })

$and 操作符的使用率比较低，因为此时更好的方式是把多个条件写到同一个对象中，从而减少额外嵌套。

3.5 集合查询

如果需要查询个人爱好中有 football 的所有用户，即集合 Hobby 中存在 football 即可，对应的查询语句如下：

db.user.find({Hobby: "football"})

如果想要获取集合中指定位置等于指定值的文档，对应的查询语句如下：

db.user.find({"Hobby.2": "football"})

如果想要约束集合必须包含多个指定值，此时可以使用 $all 操作符：

db.user.find({Hobby:{ $all: ["football", "tennis"]}})

查询时如果只想返回集合的部分内容，则可以使用 $slice ，$slice 接收一个参数 n，正数表示获取集合的前 n 个参数，负数表示获取集合末尾的 n 个参数，示例如下：

db.user.find({name: "heibai"},{Hobby:{$slice: 2}})

3.6 额外操作

在查询操作之后，MongoDB 还提供了三个额外的函数 skip、sort 和 limit ，分别用于表示跳过一定量的数据、按照指定规则对数据进行排序和限制返回数据的量，示例如下：

db.user.find({})
   .skip(1)
   .sort({_id:-1})
   .limit(10)

四、修改数据

4.1 基本 API

MongoDB 提供了以下三个 API，分别用于修改单条数据、多条数据和执行单条数据替换：

db.collection.replaceOne(<filter>, <update>, <options>)
db.collection.updateOne(<filter>, <update>, <options>)
db.collection.updateMany(<filter>, <update>, <options>)

<filter>：过滤条件，用于查询需要修改的数据；
<update>：更改操作或新文档数据；
<options>：可选操作，常用的可选操作是 upsert ，当其为 true 时，代表如果按照过滤条件没有找到对应的文档，则将待更改的数据插入到集合中；当其为 false 时，如果没有找到数据，则不执行任何操作。示例如下：

db.user.replaceOne(
    { _id: ObjectId("5d3d00a4ad383d3becc7b03a")},
    {
        name: "danrenying",
        age: 32,
        birthday: new Date(1995,08,23),
        createTime: new Timestamp(),
        Hobby: ["basketball", "football", "tennis"]
    },
    {upsert : true}
)

4.2 常规修改器

想要对数据进行修改，必须明确表达修改行为，在 MongoDB 中这是通过修改器来实现的，常用的修改器如下：

1. $set

用于修改具体的字段，如果待修改的字段不存在，则会新增该字段。示例如下：

db.user.updateOne(
    { name: "danrenying"},
    { $set: {age: 66} }
)

2. $inc

用于对指定字段的值进行增加或减少，示例如下：

db.user.updateOne(
    { name: "danrenying"},
    { $inc: {age: -10} }
)

4.3 数组修改器

在修改操作中，比较复杂的是对数组数据的修改，为了解决这个问题，MongoDB 提供了一系列的数组修改器，用于数组操作：

1. $push

用于往数组中新增数据，示例如下。使用 $each 可以一次添加多个元素：

db.user.updateOne(
    { name: "danrenying"},
    { $push: {"Hobby": {$each: ["film","music"]}} }
)

2. $addToSet

该修改器可以把数组当做集 (set) 来使用，即只能添加当前数组中不存在的数据，示例如下：

db.user.updateOne(
    { name: "danrenying"},
    { $addToSet: {"Hobby": {$each: ["film","music"]}} }
)

3. $pop

该修改器可以从数组任意一端删除元素，-1 代表从数组头删除元素，1 代表从数组尾删除元素，示例如下：

db.user.updateOne(
    { name: "danrenying"},
    { $pop: {"Hobby": -1} }
)

4. index

用于直接修改指定下标位置的元素，示例如下：

db.user.updateOne(
    { name: "danrenying"},
    { $set: {"Hobby.0": "Cooking"} }
)

五、删除数据

MongoDB 提供了以下两个 API 用于删除操作：

db.collection.deleteMany()
db.collection.deleteOne()

使用示例如下：

db.user.deleteOne(
    { name: "danrenying"}
)

参考资料

官方文档：MongoDB CRUD Operations
Kristina Chodorow . MongoDB权威指南（第2版）. 人民邮件出版社 . 2014-01

下一节：单字段索引、复合索引、多键索引、哈希所有、地理空间索引、文本索引；唯一索引、稀疏索引、部分索引、TTL 索引