← 返回
未分类

Elasticsearch搜索分析设计

帮助Agent为项目进行Elasticsearch索引设计、Mapping设计、搜索查询设计,并提供场景化使用指南。当用户需要设计搜索引擎Schema、优化全文搜索、规划日志/APM/向量搜索方案时触发。
帮助Agent为项目进行Elasticsearch索引设计、Mapping设计、搜索查询设计,并提供场景化使用指南。当用户需要设计搜索引擎Schema、优化全文搜索、规划日志/APM/向量搜索方案时触发。
Adodo
未分类 community v1.0.1 2 版本 100000 Key: 无需
★ 0
Stars
📥 15
下载
💾 0
安装
2
版本
#latest

概述

Elasticsearch 设计与使用助手

触发条件

当用户出现以下意图时激活本 Skill:

  • 设计 Elasticsearch 索引 / Mapping
  • 全文搜索 / 向量搜索方案
  • 日志分析 / APM 数据建模
  • 索引模板 / ILM 生命周期设计
  • 搜索性能优化
  • "如何设计 xxx 的搜索"

设计流程(Agent 执行路径)

0. 版本检查 → 加载 references/version-major.md 对比用户版本,识别废弃项和重大变更。同时加载所有 version-X.Y.md(X.Y ≤ 用户目标版本),后续设计过程中 Agent 从已加载的上下文中自主匹配深度特性
1. 需求分析 → 理解搜索场景(全文/向量/混合/聚合)、写入吞吐、数据量级
2. 索引设计 → 索引命名、分片数/副本数、刷新间隔、ILM 策略
3. Mapping 设计 → 字段类型、分词器、动态模板、运行时字段
4. 查询设计 → Query DSL / ES|QL / 混合搜索(BM25 + kNN)
5. 写入设计 → 批量写入、管道预处理、别名切换
6. 使用指引 → 加载 references/usage-guide.md,给出场景化操作
7. 生产建议 → 加载 references/best-practices.md,给出集群/高可用/监控建议
8. 模板参考 → 加载 references/patterns.md,匹配业务索引模板

快速参考

索引命名铁律

规则示例反例
------------------
格式:<项目>-<数据类型>-<时间粒度>app-logs-2026.06logs
小写+连字符ecom-products-v1ecom_Products_V1
按时间滚动必须带日期后缀metrics-system-2026.06.09固定索引名
版本后缀(别名指向当前版本)search-products-v2(别名 search-products别名混乱

分片设计速查

维度推荐值说明
--------------------
主分片数1(优先按单分片 10-50GB 计算)分片数过多导致开销,过少限制并行度
单分片大小10-50GB超过 50GB 考虑拆分索引或增加分片
副本数1(生产)/ 0(开发)至少 1 个副本保高可用
每 GB 堆的分片数≤ 20每个节点不超过 1000 个分片

核心字段类型速查

类型使用场景Mapping 示例
----------------------------
text全文搜索(会分词)"type": "text", "analyzer": "ik_max_word"
keyword精确匹配/聚合/排序"type": "keyword"
long / integer整数"type": "long"
float / double / scaled_float小数;金额用 scaled_float"type": "scaled_float", "scaling_factor": 100
boolean布尔值"type": "boolean"
date时间(ISO 8601 / epoch)"type": "date", "format": "yyyy-MM-dd HH:mm:ss"
geo_point经纬度坐标"type": "geo_point"
dense_vector向量嵌入(kNN 搜索)"type": "dense_vector", "dims": 1536, "index": true
object嵌套 JSON 对象"type": "object"
nested独立索引的对象数组"type": "nested"
ipIP 地址"type": "ip"
binaryBase64 二进制"type": "binary"

Mapping 设计原则

原则说明
------------
禁止动态 Mapping 到生产"dynamic": "strict""runtime"
字符串双字段需要搜索+聚合时为 text+keyword;纯 ID/枚举用 keyword
关闭不必要的 norms/index"norms": false"index": false 减少存储
避免 field explosionflattened 类型处理高基数不可预知的 Key
运行时字段替代 Scriptruntime_mappings 定义计算字段,不占存储

分词器选型

语言/场景分词器说明
------------------------
中文ik_max_word(索引)/ ik_smart(搜索)需安装 IK 插件
英文standard / english内置
多语言独立字段 + 不同分词器每个语言一个 text 子字段
拼音搜索pinyin 插件中文拼音混合搜索
不分词keyword 类型精确匹配用

渐进式加载

详细内容按需加载 references/:

主题文件何时加载
---------------------
索引/Mapping/字段/分词设计规范references/design-spec.mdStep 2-3 索引和 Mapping 设计
场景化操作(创建索引/搜索/聚合/别名/ILM)references/usage-guide.mdStep 6 使用指引
最佳实践(分片/集群/写入/查询/监控/运维)references/best-practices.mdStep 7 生产建议
业务索引模板(6类业务完整Mapping+配置)references/patterns.mdStep 8 模板参考
重大版本特性(废弃/依赖变更/新模块)references/version-major.mdStep 0 版本检查(模块激活时即加载)
深度版本特性 — 9.x(Workflows / ES\QL 增强 / PromQL / GPU 向量 / FIPS)references/version-9.0.mdStep 0 版本检查时自动加载(版本 ≤ 用户目标版本时)
深度版本特性 — 8.x(向量搜索 / ILM / SLM / Data Streams / ES\QL)references/version-8.0.mdStep 0 版本检查时自动加载(版本 ≤ 用户目标版本时)

版本参考文档启用规则

  1. 模块激活时 — 始终加载 references/version-major.md,Agent 需主动对比用户使用的 Elasticsearch 版本,若存在废弃项或重大变更,立即提示用户
  2. 深度特性 Step 0 自动加载 — 版本检查时加载所有 version-X.Y.md(X.Y ≤ 用户目标版本)。设计过程中 Agent 从已加载的上下文中自主检索匹配相关特性,用户无需指定版本号
  3. 深度特性按大版本拆分,小版本持续追加 — 如 version-9.0.md 包含该大版本下所有小版本的设计级特性。更新时在文件中新增 ## X.Y.Z 版本节即可,不单开文件

硬规则

  1. 设计规范内容来自权威资料(Elastic 官方文档/社区最佳实践),不编造
  2. 生产环境 Mapping 必须 "dynamic": "strict""runtime",禁止完全动态映射
  3. 字符串字段按需设计:需要搜索+聚合时用 text+keyword 双字段;纯 ID/枚举仅用 keyword
  4. 禁止使用 _source.enabled: false(除非纯指标场景),丢失原始数据无法修复
  5. 优先使用 _bulk API 批量写入(吞吐量差 10-100 倍),非高频场景允许单条写入
  6. 日志/指标/APM 等时序索引必须有 ILM 策略或 Data Stream 滚动机制
  7. 查询建议设置 timeout(分片级软超时)和 track_total_hits 限制,避免无界搜索

版本历史

共 2 个版本

  • v1.0.1 更新概述:MODULE.md 小版本号 1.0.0 → 1.0.1,追加 Elasticsearch 9.3.0 设计级特性,修正 9.4 发布日期。 - version-9.0.md:新增 9.3 节(bfloat16 向量/ES|QL 时序增强/OTel 指数直方图/Agent Builder/Workflows TP/Pattern 日志压缩/GPU 加速向量 TP),修正 9.4 发布日期 2025-12 → 2026-05-05 - version-major.md:新增 9.3 重大版本特性节,修正 9.4 发布日期 - 修复渐进式披露表格显示问题 - MODULE.md:版本号 1.0.0 → 1.0.1 当前
    2026-06-10 16:36 安全 安全
  • v1.0.0 初始版本
    2026-06-09 14:25 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

活动新闻稿写作

user_3651d062
生成规范的活动新闻稿:根据用户提供的发言稿、活动议程、宣传材料等素材,提取关键信息并输出符合政府或企业宣传规范的正式新闻稿。(1)应用场景: 用户需要撰写正式活动新闻稿时触发,包括:行业会议/论坛/峰会、签约仪式、发布会、官方培训/学习、领
★ 0 📥 44

MySQL 设计与使用助手

user_3651d062
帮助Agent为项目进行MySQL Schema设计、索引设计、查询设计,并提供场景化使用指南。当用户需要设计数据库表结构、优化查询性能、规划分库分表方案时触发。
★ 0 📥 61

MongoDB 设计与使用助手

user_3651d062
帮助Agent为项目进行MongoDB文档模型设计、索引设计、聚合管道设计,并提供场景化使用指南。当用户需要设计MongoDB Schema、选择嵌入vs引用、设计聚合查询时触发。
★ 0 📥 39