MongoDB分片管理基础入门 - 摩柯技术社区

什么是 MongoDB 分片

MongoDB 分片是一种将大型数据集分布在多个服务器（即分片）上的技术。随着数据量的不断增长，单个服务器可能无法存储所有数据，或者无法满足高并发读写的性能需求。分片技术通过将数据划分到多个物理服务器上，不仅可以扩展存储容量，还能提升读写性能。

从本质上来说，分片的核心是数据的划分与分布。MongoDB 把数据按照一定的规则（如基于某个字段的值）分割成不同的块（chunks），每个块都有一个范围。这些块被分布到不同的分片服务器上。当客户端进行读写操作时，MongoDB 的路由进程（mongos）会根据数据的键值确定数据所在的分片，然后将请求转发到相应的分片服务器。

为什么要使用 MongoDB 分片

应对数据量增长

当数据量增长到单个服务器的存储容量极限时，分片是必然的选择。例如，一个社交媒体应用，每天产生大量的用户动态、消息等数据。如果数据都存储在一台服务器上，很快这台服务器的磁盘空间就会被耗尽。通过分片，可以将数据分散到多台服务器，每台服务器只存储部分数据，从而解决存储瓶颈。

提升读写性能

在高并发读写场景下，单个服务器的处理能力有限。分片可以将读写请求分散到多个分片服务器上。比如，一个电商网站在促销活动期间，大量用户同时进行商品查询（读操作）和下单（写操作）。通过分片，不同的读写请求可以并行处理，提高整体的系统响应速度。

MongoDB 分片组件介绍

分片服务器（Shards）

分片服务器是实际存储数据的地方。每个分片可以是一个单独的 MongoDB 实例，也可以是一个副本集（推荐使用副本集以保证数据的高可用性和容错性）。每个分片负责存储一部分数据块。例如，假设有两个分片 shard1 和 shard2，数据按照用户 ID 进行分片，ID 为偶数的用户数据可能存储在 shard1，ID 为奇数的用户数据可能存储在 shard2。

配置服务器（Config Servers）

配置服务器存储了整个分片集群的元数据。这些元数据包括数据块的分布信息、每个分片的状态等。配置服务器对于分片集群的正常运行至关重要，因为 mongos 路由进程需要从配置服务器获取这些信息来正确地路由请求。通常建议使用三个配置服务器组成一个副本集，以保证元数据的高可用性。

路由进程（mongos）

mongos 是客户端与分片集群交互的接口。客户端连接到 mongos，而不是直接连接到分片服务器。mongos 接收客户端的请求，根据配置服务器中的元数据信息，确定请求的数据所在的分片，然后将请求转发到相应的分片服务器。之后，mongos 收集分片服务器的响应，并将结果返回给客户端。从客户端的角度来看，它无需关心数据实际存储在哪个分片，就像操作一个普通的 MongoDB 实例一样。

搭建 MongoDB 分片集群

环境准备

假设我们使用三台服务器来搭建一个简单的分片集群，操作系统为 Linux（这里以 Ubuntu 为例）。每台服务器都需要安装 MongoDB。可以通过以下命令在 Ubuntu 上安装 MongoDB：

sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 9DA31620334BD75D9DCB49F368818C72E52529D4
echo "deb [ arch=amd64,arm64 ] https://repo.mongodb.org/apt/ubuntu bionic/mongodb-org/4.2 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org-4.2.list
sudo apt-get update
sudo apt-get install -y mongodb-org

配置分片服务器

创建数据目录：在每台分片服务器上创建数据目录，例如：

sudo mkdir -p /var/lib/mongodb-shard1
sudo chown -R mongodb:mongodb /var/lib/mongodb-shard1

配置文件：编辑 MongoDB 配置文件（通常位于 /etc/mongod.conf），添加或修改以下内容以将其配置为分片服务器：

sharding:
  clusterRole: shardsvr
systemLog:
  destination: file
  path: /var/log/mongodb/mongod.log
  logAppend: true
storage:
  dbPath: /var/lib/mongodb-shard1
  journal:
    enabled: true
net:
  bindIp: 0.0.0.0
  port: 27017
replication:
  oplogSizeMB: 1024
  replSetName: shard1-rs

这里假设该服务器作为 shard1 的副本集成员，replSetName 为 shard1 - rs。重复上述步骤配置其他分片服务器。

初始化副本集：启动 MongoDB 服务后，登录到 MongoDB shell 并初始化副本集：

rs.initiate({
  _id: "shard1-rs",
  members: [
    { _id: 0, host: "server1:27017" }
  ]
})

将 server1 替换为实际的服务器地址。对其他分片服务器的副本集也进行类似的初始化操作。

配置配置服务器

创建数据目录：在每台配置服务器上创建数据目录，例如：

sudo mkdir -p /var/lib/mongodb-config1
sudo chown -R mongodb:mongodb /var/lib/mongodb-config1

配置文件：编辑 MongoDB 配置文件，添加或修改以下内容以将其配置为配置服务器：

sharding:
  clusterRole: configsvr
systemLog:
  destination: file
  path: /var/log/mongodb/mongod.log
  logAppend: true
storage:
  dbPath: /var/lib/mongodb-config1
  journal:
    enabled: true
net:
  bindIp: 0.0.0.0
  port: 27019
replication:
  oplogSizeMB: 128
  replSetName: config-rs

这里假设配置服务器组成一个名为 config - rs 的副本集。重复上述步骤配置其他配置服务器。

初始化副本集：启动 MongoDB 服务后，登录到 MongoDB shell 并初始化副本集：

rs.initiate({
  _id: "config-rs",
  configsvr: true,
  members: [
    { _id: 0, host: "server1:27019" },
    { _id: 1, host: "server2:27019" },
    { _id: 2, host: "server3:27019" }
  ]
})

将 server1、server2、server3 替换为实际的服务器地址。

配置路由进程（mongos）

创建配置文件：在运行 mongos 的服务器上创建一个配置文件，例如 /etc/mongos.conf：

sharding:
  configDB: config-rs/server1:27019,server2:27019,server3:27019
systemLog:
  destination: file
  path: /var/log/mongodb/mongos.log
  logAppend: true
net:
  bindIp: 0.0.0.0
  port: 27018

这里 configDB 指向配置服务器副本集的成员地址。

启动 mongos：使用以下命令启动 mongos：

mongos -f /etc/mongos.conf

添加分片到集群

连接到 mongos 的 MongoDB shell，然后使用以下命令添加分片：

sh.addShard("shard1-rs/server1:27017")
sh.addShard("shard2-rs/server2:27017")

将 shard1 - rs、shard2 - rs 替换为实际的分片副本集名称，server1、server2 替换为实际的服务器地址。

分片键的选择

分片键的重要性

分片键是决定数据如何分布到各个分片的依据。一个好的分片键可以确保数据均匀分布，避免出现数据倾斜（即某些分片存储的数据量远大于其他分片）。同时，合理的分片键选择还能优化读写性能。例如，如果经常按照某个字段进行查询，选择该字段作为分片键可以使得查询请求直接定位到相关的分片，减少不必要的跨分片查询。

选择分片键的原则

基数：分片键的基数（即不同值的数量）应该足够大。如果基数太小，数据可能会集中在少数几个分片上。例如，以性别字段（只有“男”“女”两个值）作为分片键，数据必然会严重倾斜。理想情况下，分片键应该有大量不同的值，比如用户 ID、时间戳等。
分布均匀：分片键的值应该在数据集中均匀分布。以订单金额为例，如果大部分订单金额集中在某个区间，而选择订单金额作为分片键，可能会导致数据分布不均。可以考虑对订单金额进行一定的处理，如按照金额区间进行分片。
读写模式：结合应用的读写模式来选择分片键。如果读操作主要基于某个字段，那么选择该字段作为分片键可以提高读性能。例如，电商应用中经常根据商品类别查询商品信息，选择商品类别作为分片键可以加快查询速度。

示例代码

假设我们有一个存储用户信息的集合 users，包含字段 user_id、name、age 等。如果我们希望按照 user_id 进行分片，可以在创建集合时指定分片键：

sh.enableSharding("mydb")
sh.shardCollection("mydb.users", { user_id: 1 })

这里 mydb 是数据库名称，users 是集合名称，{ user_id: 1 } 表示以 user_id 字段作为分片键，1 表示升序排列。

数据迁移与平衡

数据迁移过程

当 MongoDB 分片集群中的数据分布发生变化，或者有新的分片加入、旧的分片移除时，会发生数据迁移。数据迁移由 MongoDB 的平衡器（Balancer）负责。平衡器会定期检查各个分片的数据分布情况，如果发现某个分片的数据量或负载过高，就会将部分数据块迁移到其他分片。

数据迁移的基本过程如下：

平衡器检测：平衡器定期扫描配置服务器中的元数据，计算每个分片的数据量、负载等指标。
确定迁移计划：根据检测结果，平衡器确定需要迁移的数据块以及目标分片。
迁移执行：源分片将数据块传输到目标分片，同时更新配置服务器中的元数据，以反映数据块的新位置。

手动触发平衡

在某些情况下，我们可能需要手动触发平衡操作，比如在新的分片加入集群后，希望尽快让数据分布均匀。可以通过以下命令手动触发平衡：

sh.startBalancer()

如果希望停止平衡操作，可以使用：

sh.stopBalancer()

数据平衡策略

MongoDB 的平衡器使用基于范围的平衡策略。它根据数据块的范围来决定迁移哪些数据块。例如，如果一个分片上有一个数据块的范围是 [1, 100]，而另一个分片负载较低，平衡器可能会将这个数据块迁移到负载低的分片。这种基于范围的策略可以保证数据在逻辑上的连续性，同时尽量使数据分布均匀。

分片集群的维护与监控

查看集群状态

可以使用 sh.status() 命令在 mongos 的 MongoDB shell 中查看分片集群的状态。该命令会显示各个分片的信息、配置服务器的状态、数据块的分布情况等。例如：

sh.status()

输出结果类似如下：

--- Sharding Status ---
  sharding version: {
    "_id" : 1,
    "minCompatibleVersion" : 5,
    "currentVersion" : 6,
    "clusterId" : ObjectId("5f8f9c2a95a7f4665d3a110c")
  }
  shards:
        {  "_id" : "shard1-rs",  "host" : "shard1-rs/server1:27017" }
        {  "_id" : "shard2-rs",  "host" : "shard2-rs/server2:27017" }
  active mongoses:
        "3.6.3" : 1
  balancer:
        Currently enabled:  yes
        Currently running:  no
        Failed balancer rounds in last 5 attempts:  0
        Migration Results for the last 24 hours:
                No recent migrations
  databases:
        {  "_id" : "admin",  "partitioned" : false,  "primary" : "config" }
        {  "_id" : "mydb",  "partitioned" : true,  "primary" : "shard1-rs" }
                mydb.users
                        shard key: { "user_id" : 1 }
                        chunks:
                                shard1-rs      1
                                shard2-rs      1
                        { "user_id" : { "$minKey" : 1 } } -->> { "user_id" : 100 } on : shard1-rs Timestamp(1, 0)
                        { "user_id" : 100 } -->> { "user_id" : { "$maxKey" : 1 } } on : shard2-rs Timestamp(1, 1)

监控性能指标

使用 MongoDB 自带工具：MongoDB 提供了 mongostat 和 mongotop 等工具来监控性能。mongostat 可以实时显示 MongoDB 实例（包括分片服务器、mongos 等）的各种统计信息，如插入、查询、更新、删除操作的频率，以及内存使用等情况。例如，在分片服务器上运行 mongostat：

mongostat -h server1:27017

mongotop 则用于显示每个集合的读写操作耗时，帮助我们找出性能瓶颈。例如：

mongotop -h server1:27017

使用第三方监控工具：也可以使用第三方监控工具，如 Prometheus + Grafana。Prometheus 可以收集 MongoDB 的各种指标数据，Grafana 则用于将这些数据可视化。通过配置 Prometheus 的 MongoDB exporter，可以将 MongoDB 的性能指标暴露给 Prometheus。例如，在 Prometheus 的配置文件 prometheus.yml 中添加以下内容：

scrape_configs:
  - job_name:'mongodb'
    static_configs:
      - targets: ['server1:9216']
    metrics_path: /metrics
    params:
      module: [mongodb]
    relabel_configs:
      - source_labels: [__address__]
        target_label: __param_target
      - source_labels: [__param_target]
        target_label: instance
      - target_label: __address__
        replacement: server1:9216

这里假设 MongoDB exporter 运行在 server1:9216。然后在 Grafana 中导入 MongoDB 相关的仪表盘模板，就可以直观地查看 MongoDB 分片集群的性能指标。

故障处理

分片服务器故障：如果一个分片服务器（副本集成员）发生故障，MongoDB 的副本集机制会自动将该成员从副本集中移除，并选举出一个新的主节点（如果原主节点故障）。如果是整个分片的副本集都不可用，可以尝试重启相关服务器，检查网络连接等。如果故障无法恢复，可以考虑将该分片的数据迁移到其他分片，然后移除故障分片。例如，使用以下命令移除故障分片：

sh.removeShard("shard1-rs")

配置服务器故障：配置服务器故障较为严重，因为它存储了整个集群的元数据。如果一个配置服务器副本集成员故障，副本集机制会自动选举新的成员。但如果所有配置服务器都故障，集群将无法正常工作。此时，应尽快恢复配置服务器的运行，确保元数据的完整性。可以通过从备份中恢复数据等方式来修复配置服务器。
mongos 故障：mongos 故障相对容易处理，因为它本身不存储数据。只需重启故障的 mongos 进程，客户端会自动重新连接到可用的 mongos。为了提高 mongos 的可用性，可以部署多个 mongos 实例，客户端可以连接到任意一个 mongos。

常见问题与解决方法

数据倾斜问题

现象：部分分片存储的数据量远大于其他分片，导致负载不均衡，影响整体性能。
原因：通常是由于分片键选择不当，分片键的基数小或者分布不均匀。例如，以一个只有少数几个值的字段作为分片键。
解决方法：重新评估分片键，选择基数大、分布均匀的字段作为分片键。如果无法更改分片键，可以考虑使用哈希分片。哈希分片通过对分片键进行哈希运算，将数据均匀分布到各个分片。例如，在创建集合时指定哈希分片：

sh.enableSharding("mydb")
sh.shardCollection("mydb.users", { user_id: "hashed" })

写入性能下降问题

现象：随着数据量的增加或者并发写入的增多，写入操作的响应时间变长。
原因：可能是由于网络延迟、磁盘 I/O 瓶颈、分片键不合理导致写入集中在某些分片等。
解决方法：检查网络连接，确保网络稳定。对于磁盘 I/O 瓶颈，可以考虑升级磁盘（如使用 SSD）或优化存储配置。如果是分片键问题，调整分片键以分散写入负载。同时，可以适当增加分片服务器的数量，以提高写入性能。

读取性能下降问题

现象：查询操作的响应时间变长，特别是跨分片查询时。
原因：可能是索引不合理、数据分布不均匀导致跨分片查询过多、网络延迟等。
解决方法：优化查询语句，确保使用了合适的索引。对于数据分布不均匀问题，通过平衡器或手动调整数据分布。检查网络连接，减少网络延迟对查询性能的影响。

通过以上对 MongoDB 分片管理的基础介绍，包括组件、搭建、分片键选择、维护监控以及常见问题解决等方面，相信读者对 MongoDB 分片技术有了较为深入的理解和掌握，可以在实际应用中根据需求搭建和管理高效、稳定的 MongoDB 分片集群。