【DevOps】深入剖析Elasticsearch的分片与副本对性能的影响

在 Elasticsearch 中，分片（Shards）和副本（Replicas）是确保数据分布和高可用性的核心概念。正确地配置分片和副本对于优化搜索和索引性能至关重要。以下是对这两个概念的详细解释以及它们如何影响 Elasticsearch 的性能。

一、分片 (Shards)

1、什么是分片？

分片是 Elasticsearch 中数据存储的基本单位。当你创建一个索引时，你可以指定它被分割成多少个分片。每个分片本身是一个完全功能的、独立的 "Lucene" 索引。这些分片允许 Elasticsearch 将数据分布式存储，提供数据的水平扩展和并行处理能力。

2、分片的类型

主分片（Primary Shards）：- 主分片负责存储数据和处理写操作（如索引或更新文档）。- 索引创建时设置的分片数量决定了主分片的数量，创建后这个数字不能更改（除非重新索引）。
副本分片（Replica Shards）：- 副本分片是主分片的拷贝，用于提供高可用性和负载均衡。- 副本分片可以处理读请求（如搜索和检索文档），并提供数据冗余以防主分片失败。

3、分片对性能的影响

写入性能：- 写入性能（索引、更新、删除）主要受主分片的数量影响。- 更多的主分片可以提高写入吞吐量，因为操作可以并行化到多个分片上。但是，每个分片都会消耗资源（CPU、内存、磁盘），过多的分片会导致资源竞争，反而降低性能。
读取性能：- 读取性能（搜索、检索）可以通过增加副本分片来提高，因为更多的副本可以处理更多的并发读请求。- 副本分片还可以减少单个分片的读负载，因为请求可以在多个副本之间均匀分配。
容错和可用性：- 增加副本分片数量可以提高系统的容错能力。如果一个节点或分片失败，Elasticsearch 可以从副本中恢复数据。- 在分布式环境中，副本是保证数据不丢失和持续可用的关键。
资源使用：- 无论是主分片还是副本分片，都需要计算和存储资源。分片数量的增加会直接增加内存和CPU的使用，因为每个分片都有自己的索引结构和缓存。- 分片过多会导致小文件问题，增加文件系统的压力，并降低 I/O 效率。

二、副本 (Replicas)

1、什么是副本？

副本是数据的冗余拷贝，存储在副本分片中。在 Elasticsearch 中，你可以指定每个主分片有多少个副本分片。这些副本分片可以在不同的节点上，以支持高可用性和扩展性。

2、副本对性能的影响

读取性能提升：- 副本最直接的性能提升是在读操作上。因为 Elasticsearch 可以从主分片或任何副本分片中读取数据，多个副本分片意味着可以处理更多的并发读请求。
写入性能影响：- 每次写入（索引、更新、删除）不仅要在主分片上执行，还要在所有副本分片上重复。因此，副本分片数量增加会增加写操作的负担，每次写操作需要同步到更多的副本上。
系统资源使用：- 更多的副本意味着更多的数据拷贝和更多的索引结构，这会增加对资源（如内存和CPU）的需求。在资源有限的情况下，过多的副本可能会降低性能。
高可用性和故障恢复：- 副本的主要目的是提供高可用性。在某个分片或节点失败时，Elasticsearch 可以从副本中恢复数据，几乎不影响用户查询。- 更多的副本可以更快地恢复数据，因为 Elasticsearch 有更多选项来重新分配和平衡网络中的数据。

三、最佳实践

1、主分片数量的选择

主分片的理想数量取决于数据量、硬件资源和使用场景。通常建议将每个主分片的大小保持在几十GB到几百GB之间。
对于静态数据或只增加不修改的数据，更大的分片（接近50GB）通常更有效。
对于需要频繁更新或删除的数据，较小的分片（10GB-20GB）可能更合适，因为这样可以减少段合并的开销。

2、副本分片的设置

副本分片的数量通常根据读取负载来调整。如果系统是读取密集型的（例如，搜索或分析应用），增加副本分片可以提供更好的读取性能。
在决定副本数量时，也要考虑集群的节点数量。至少应该有足够的节点来分配这些副本，而不是所有副本都在同一个节点上。

3、监控和调整

使用 Elasticsearch 的监控工具（如 Elastic Stack 中的 Kibana）定期检查分片的健康和性能。
如果检测到性能瓶颈，可以根据具体情况调整分片和副本的数量。

4、考虑使用 Shrink 和 Split API

对于需要减少分片数量的旧索引，可以使用 Shrink API 来减少分片数量。
对于需要增加分片以支持更多数据的场景，可以使用 Split API 来增加分片数量。

通过合理配置分片和副本，可以显著提高 Elasticsearch 的性能和可靠性。这需要根据你的具体数据量、查询类型和硬件资源来动态调整和优化。

四、优化实战

在一个包含 3 个节点的 Elasticsearch 集群中，合理配置副本数量取决于数据的可用性需求和性能要求。对于数据量较小的情况，副本数量的合理配置考虑如下：

1、副本数量配置建议

1.1、副本数设置为 1：

可用性： 保证每个主分片有一个副本分片。如果一个节点故障，其他两个节点仍有完整的数据副本。
性能： 副本可以分担读请求，提高查询性能。
优点：- 提供高可用性。- 提高读性能。
缺点：- 写入性能略有下降，因为每次写入都需要同步到副本分片。
适用场景： 数据量较小，需要高可用性和良好的读取性能。

1.2、副本数设置为 2：

可用性： 每个主分片有两个副本分片，即每个节点都持有一份数据。在这种配置下，即使两个节点故障，剩余节点仍然可以提供服务。
性能： 可以平衡读请求，提高查询性能。
优点：- 最高级别的高可用性。- 最佳的读性能。
缺点：- 写入性能会受到更明显的影响，因为写入操作需要同步到两个副本分片。
适用场景： 数据量较小，但对高可用性要求极高，并且查询请求量大。

2、推荐配置

在 3 节点的集群中，通常建议将副本数量设置为 1。这意味着每个主分片将有一个副本分片，实现数据的高可用性和读取性能的平衡。

示例配置：

PUT /your_index/_settings
{
  "number_of_replicas": 1
}

3、其他注意事项

分片数量： 对于数据量较小的情况，主分片数量不宜过多。建议设置主分片数量为 1 或 2。
数据均衡： 确保主分片和副本分片在 3 个节点之间均匀分布，以避免负载不均衡问题。
监控与调整： 使用监控工具（如 Kibana Monitoring 或 Prometheus/Grafana）持续监控性能并根据负载调整配置。

通过合理配置副本数量和分片数量，可以在确保高可用性的同时优化性能。

标签： devops elasticsearch 运维

本文转载自: https://blog.csdn.net/benshu_001/article/details/138533608
版权归原作者 Coder加油! 所有，如有侵权，请联系我们删除。