导入数据并搜索

Elasticsearch BES

  • 邀测版存储计算分离套餐介绍
  • 功能发布记录
  • 产品描述
    • 基本概念
    • 关键特性
    • 产品介绍
    • 产品性能
      • 4核16GB512GB通用型的3个数据节点实例基准性能指标
      • 8核16GB512GB计算型的3个数据节点实例基准性能测试
      • 16核32GB512GB计算型的3个数据节点实例基准性能指标
      • 4核8GB512GB计算型的3个数据节点实例基准性能测试
      • 8核32GB512GB通用型的3个数据节点实例基准性能指标
      • 16核64GB512GB通用型的3个数据节点实例基准性能指标
      • 概述
  • Python-SDK
    • 实例
    • 异常
    • 日志
    • 节点配置类型
    • 版本更新记录
    • 快速入门
    • 集群
    • BesClient
    • 安装SDK工具包
    • 概述
  • Kibana
    • Kibana使用指南
  • Logstash
    • Logstash使用指南
    • 实例管理
      • 实例详情信息
      • 实例扩缩容
      • 管道管理
      • 创建实例
      • 实例列表
      • 删除实例
  • 开发指南
    • Elasticsearch Restful API
    • 通过其他客户端访问Elasticsearch
    • Elasticsearch Java客户端
      • Low Level REST Client
      • Rest Client操作向量索引示例
      • Java REST Client
      • High Level REST Client
  • Java-SDK
    • 实例
    • 异常
    • 日志
    • 节点配置类型
    • 版本更新记录
    • 快速入门
    • 集群
    • BesClient
    • 安装SDK工具包
    • 概述
  • 向量检索特性
    • 资源规划
    • 关键概念
    • 应用场景
    • 快速入门
    • 算法介绍
    • 能力简介
    • 向量数据库
    • 操作指南
      • 写入和查询数据
      • 训练模型
      • 向量索引缓存管理
      • 创建索引
      • 基于Reciprocal Rank Fusion的融合查询
      • 参数优化
      • 7.4版本兼容说明
    • 最佳实践
      • 调优建议
      • BES RAG 最佳实践:基于LangChain+BES的私域知识的QA问答系统
    • 迁移方案
      • ES dense vector 切换为BES方案
  • ELK
    • 基于ELK构建日志分析系统
  • 增强特性
    • 慢查询隔离
    • 百度NLP中文分词词典动态更新
    • 百度NLP中文分词插件
    • 基于段文件的主从复制
    • 基于BOS的冷热数据分离
  • 快速入门
    • 访问Elasticsearch服务
    • 导入数据并搜索
    • 创建集群
    • 集群资源评估
  • 典型实践
    • 使用BSC将BOS中的数据导入Es
    • 使用BSC将Kafka中的数据导入Es
    • 基于CCR实现多集群跨地域高可用
    • 基于节点磁盘介质的冷热数据分离
  • 服务等级协议SLA
    • 数据迁移服务协议
    • BES服务等级协议SLA(V1.0)
  • 常见问题
    • Spark访问Es常见问题
    • Elasticsearch系统常见问题
    • 常见问题总览
  • 产品定价
    • 预付费
    • 计费说明
    • 配置变更费用说明
    • 后付费
  • API文档
    • 概述
    • 自动续费相关接口
      • 续费列表
      • 查看自动续费
      • 查看自动续费规则列表
      • 续费操作
      • 更新自动续费规则
      • 删除自动续费规则
      • 创建自动续费规则
    • 插件配置接口
      • 上传自定义插件
      • 卸载系统默认插件
      • 上传nlp词典
      • 安装系统默认插件
      • 获取默认和自定义插件列表
      • 卸载自定义插件
      • 安装自定义插件
      • 删除自定义插件
      • 查看nlp词典
    • 日志管理相关接口
      • 查看日志导出任务记录
      • 创建日志导出任务
      • 日志设置
      • 日志查询
    • 标签接口
      • 查询标签列表
      • 批量新增标签
      • 单个集群更新标签
    • 智能巡检接口
      • 查看近7天已完成的巡检任务列表
      • 近七天巡检概况
      • 查看手动巡检任务的配置
      • 集群巡检授权
      • 列举所有可选巡检项
      • 查询是否可以提交巡检任务
      • 最新一次巡检概况
      • 查看集群是否开启自动巡检
      • 修改手动巡检任务的配置
      • 开启或关闭自动巡检
      • 提交手动巡检任务
      • 查询今日已执行完成的手动巡检次数
      • 查看某巡检任务的执行状态和结果
    • 集群相关接口
      • 获取操作历史信息
      • 删除集群
      • 新增节点类型
      • 开启和关闭https
      • 查看集群详情信息
      • 重置密码
      • EIP绑定
      • EIP解绑
      • 是否开启Grafana监控
      • 获取数据量观测数据
      • 查看集群列表
      • 上传NLP分词词典
      • 创建集群
      • 智能评估
      • 集群blb信息
      • 用户可用代金券列表
      • 停止集群
      • 扩容集群
      • 启动集群
      • 重启集群
    • 实例相关接口
      • 批量停止实例
      • 启动实例
      • 查看缩容节点列表
      • 数据迁移
      • 数据迁移系统建议
      • 批量启动实例
      • 数据迁移回滚
      • 停止实例
      • 数据迁移节点列表
      • 删除实例
    • 配置修改相关接口
      • 获取同义词文件列表
      • 查看集群配置
      • 删除同义词配置文件
      • 上传同义词配置文件
      • 配置修改
    • 定时调度
      • 更新定时调度任务
      • 删除定时调度任务
      • 创建和更新定时调度任务
      • 查看定时调度任务
  • API3.0
    • 集群相关接口
      • 删除集群
  • Elasticsearch
    • 用户手册
      • YML参数配置
      • 权限管理
      • 智能巡检
      • 数据迁移
      • 基于BOS的快照与恢复
      • 集群列表
      • 账号使用说明
      • 多可用区部署
      • 定时调度
      • 数据量观测
      • 日志查询
        • 日志查询(旧)
        • 日志查询(新)
        • 日志导出
        • 查询语法
      • 集群配置
        • 配置同义词
      • 插件管理
        • 上传与安装自定义插件
        • Elasticsearch插件列表
        • 系统默认插件
          • analysis-pinyin拼音分词插件
          • IK中文分词插件与动态更新词典
          • compression-zstd插件
          • CCR插件
          • 限流插件
          • 动态同义词插件
          • 简繁体转换插件
          • ingest attachment插件
          • SQL插件
      • 配置变更
        • 节点数据迁移
        • 集群变配说明与建议
        • 集群扩缩容
      • 版本升级
        • 升级版本
        • 内核版本说明
        • 升级检查
      • 集群监控报警
        • 监控查看及指标说明
        • 配置报警
      • 集群管理
        • 集群重启
        • 变更HTTPS协议用户指南
        • 节点启停
        • 查看集群信息
        • 集群创建
        • 公网绑定
        • 修改集群名称
        • 跨可用区迁移集群
        • 集群删除
        • 集群列表
        • 自动续费
        • 密码重置
        • ES服务区域代码
      • 账户管理
        • 多用户访问控制
所有文档
menu
没有找到结果,请重新输入

Elasticsearch BES

  • 邀测版存储计算分离套餐介绍
  • 功能发布记录
  • 产品描述
    • 基本概念
    • 关键特性
    • 产品介绍
    • 产品性能
      • 4核16GB512GB通用型的3个数据节点实例基准性能指标
      • 8核16GB512GB计算型的3个数据节点实例基准性能测试
      • 16核32GB512GB计算型的3个数据节点实例基准性能指标
      • 4核8GB512GB计算型的3个数据节点实例基准性能测试
      • 8核32GB512GB通用型的3个数据节点实例基准性能指标
      • 16核64GB512GB通用型的3个数据节点实例基准性能指标
      • 概述
  • Python-SDK
    • 实例
    • 异常
    • 日志
    • 节点配置类型
    • 版本更新记录
    • 快速入门
    • 集群
    • BesClient
    • 安装SDK工具包
    • 概述
  • Kibana
    • Kibana使用指南
  • Logstash
    • Logstash使用指南
    • 实例管理
      • 实例详情信息
      • 实例扩缩容
      • 管道管理
      • 创建实例
      • 实例列表
      • 删除实例
  • 开发指南
    • Elasticsearch Restful API
    • 通过其他客户端访问Elasticsearch
    • Elasticsearch Java客户端
      • Low Level REST Client
      • Rest Client操作向量索引示例
      • Java REST Client
      • High Level REST Client
  • Java-SDK
    • 实例
    • 异常
    • 日志
    • 节点配置类型
    • 版本更新记录
    • 快速入门
    • 集群
    • BesClient
    • 安装SDK工具包
    • 概述
  • 向量检索特性
    • 资源规划
    • 关键概念
    • 应用场景
    • 快速入门
    • 算法介绍
    • 能力简介
    • 向量数据库
    • 操作指南
      • 写入和查询数据
      • 训练模型
      • 向量索引缓存管理
      • 创建索引
      • 基于Reciprocal Rank Fusion的融合查询
      • 参数优化
      • 7.4版本兼容说明
    • 最佳实践
      • 调优建议
      • BES RAG 最佳实践:基于LangChain+BES的私域知识的QA问答系统
    • 迁移方案
      • ES dense vector 切换为BES方案
  • ELK
    • 基于ELK构建日志分析系统
  • 增强特性
    • 慢查询隔离
    • 百度NLP中文分词词典动态更新
    • 百度NLP中文分词插件
    • 基于段文件的主从复制
    • 基于BOS的冷热数据分离
  • 快速入门
    • 访问Elasticsearch服务
    • 导入数据并搜索
    • 创建集群
    • 集群资源评估
  • 典型实践
    • 使用BSC将BOS中的数据导入Es
    • 使用BSC将Kafka中的数据导入Es
    • 基于CCR实现多集群跨地域高可用
    • 基于节点磁盘介质的冷热数据分离
  • 服务等级协议SLA
    • 数据迁移服务协议
    • BES服务等级协议SLA(V1.0)
  • 常见问题
    • Spark访问Es常见问题
    • Elasticsearch系统常见问题
    • 常见问题总览
  • 产品定价
    • 预付费
    • 计费说明
    • 配置变更费用说明
    • 后付费
  • API文档
    • 概述
    • 自动续费相关接口
      • 续费列表
      • 查看自动续费
      • 查看自动续费规则列表
      • 续费操作
      • 更新自动续费规则
      • 删除自动续费规则
      • 创建自动续费规则
    • 插件配置接口
      • 上传自定义插件
      • 卸载系统默认插件
      • 上传nlp词典
      • 安装系统默认插件
      • 获取默认和自定义插件列表
      • 卸载自定义插件
      • 安装自定义插件
      • 删除自定义插件
      • 查看nlp词典
    • 日志管理相关接口
      • 查看日志导出任务记录
      • 创建日志导出任务
      • 日志设置
      • 日志查询
    • 标签接口
      • 查询标签列表
      • 批量新增标签
      • 单个集群更新标签
    • 智能巡检接口
      • 查看近7天已完成的巡检任务列表
      • 近七天巡检概况
      • 查看手动巡检任务的配置
      • 集群巡检授权
      • 列举所有可选巡检项
      • 查询是否可以提交巡检任务
      • 最新一次巡检概况
      • 查看集群是否开启自动巡检
      • 修改手动巡检任务的配置
      • 开启或关闭自动巡检
      • 提交手动巡检任务
      • 查询今日已执行完成的手动巡检次数
      • 查看某巡检任务的执行状态和结果
    • 集群相关接口
      • 获取操作历史信息
      • 删除集群
      • 新增节点类型
      • 开启和关闭https
      • 查看集群详情信息
      • 重置密码
      • EIP绑定
      • EIP解绑
      • 是否开启Grafana监控
      • 获取数据量观测数据
      • 查看集群列表
      • 上传NLP分词词典
      • 创建集群
      • 智能评估
      • 集群blb信息
      • 用户可用代金券列表
      • 停止集群
      • 扩容集群
      • 启动集群
      • 重启集群
    • 实例相关接口
      • 批量停止实例
      • 启动实例
      • 查看缩容节点列表
      • 数据迁移
      • 数据迁移系统建议
      • 批量启动实例
      • 数据迁移回滚
      • 停止实例
      • 数据迁移节点列表
      • 删除实例
    • 配置修改相关接口
      • 获取同义词文件列表
      • 查看集群配置
      • 删除同义词配置文件
      • 上传同义词配置文件
      • 配置修改
    • 定时调度
      • 更新定时调度任务
      • 删除定时调度任务
      • 创建和更新定时调度任务
      • 查看定时调度任务
  • API3.0
    • 集群相关接口
      • 删除集群
  • Elasticsearch
    • 用户手册
      • YML参数配置
      • 权限管理
      • 智能巡检
      • 数据迁移
      • 基于BOS的快照与恢复
      • 集群列表
      • 账号使用说明
      • 多可用区部署
      • 定时调度
      • 数据量观测
      • 日志查询
        • 日志查询(旧)
        • 日志查询(新)
        • 日志导出
        • 查询语法
      • 集群配置
        • 配置同义词
      • 插件管理
        • 上传与安装自定义插件
        • Elasticsearch插件列表
        • 系统默认插件
          • analysis-pinyin拼音分词插件
          • IK中文分词插件与动态更新词典
          • compression-zstd插件
          • CCR插件
          • 限流插件
          • 动态同义词插件
          • 简繁体转换插件
          • ingest attachment插件
          • SQL插件
      • 配置变更
        • 节点数据迁移
        • 集群变配说明与建议
        • 集群扩缩容
      • 版本升级
        • 升级版本
        • 内核版本说明
        • 升级检查
      • 集群监控报警
        • 监控查看及指标说明
        • 配置报警
      • 集群管理
        • 集群重启
        • 变更HTTPS协议用户指南
        • 节点启停
        • 查看集群信息
        • 集群创建
        • 公网绑定
        • 修改集群名称
        • 跨可用区迁移集群
        • 集群删除
        • 集群列表
        • 自动续费
        • 密码重置
        • ES服务区域代码
      • 账户管理
        • 多用户访问控制
  • 文档中心
  • arrow
  • ElasticsearchBES
  • arrow
  • 快速入门
  • arrow
  • 导入数据并搜索
本页目录
  • 前提条件
  • 创建索引
  • 导入数据
  • 导入单条数据
  • 导入多条数据
  • 搜索数据
  • 查询索引
  • 全文搜索
  • 按条件搜索

导入数据并搜索

更新时间:2025-08-20

前提条件

开通百度智能云Elasticsearch服务(参考创建集群)且可访问Elasticsearch集群(参考访问Elasticsearch服务)后,可以通过附赠的kibana节点访问Elasticsearch集群,然后可以创建索引、导入数据和搜索数据。

创建索引

在导入数据之前,可以评估shard和创建索引,以下示例创建一个名称为index_name的索引。

Plain Text
1PUT index_name
2{
3  "settings": {
4    "index": {
5      "number_of_shards": 1,
6      "number_of_replicas": 1
7    }
8  }
9}

其中,number_of_shards指主分片数,number_of_replicas指每个主分片有多少个副本分片数。Elasticsearch 7.0以下版本默认创建5个主分片和1个副本分片,Elasticsearch 7.0及以上版本默认创建1个主分片和1个副本分片。主分片数只能在索引创建前指定,且索引创建后不能动态修改,只能通过reindex或split等方式达到修改目的,副本分片数可以动态修改。

创建成功,返回如下结果。

Plain Text
1{
2  "acknowledged" : true,
3  "shards_acknowledged" : true,
4  "index" : "index_name"
5}

返回结果各个字段的含义如下所示。

返回字段 含义
acknowledged 索引在集群中是否创建成功
shards_acknowledged 每个分片组在超时之前是否激活了所需数量的分片
index 索引名称

注:返回值中acknowledged或者shards_acknowledged为false时,索引创建操作仍然可能成功,这两个值只是表示操作是否在超时之前完成。假设acknowledged为false,新创建的索引更新集群状态时超时,创建索引操作仍然可能会在之后执行成功。假设shards_acknowledged为false,新创建的索引成功更新集群状态,但激活所需数量的分片超时,默认只启动主分片。

导入数据

导入单条数据

以下示例创建单个文档并导入数据。

Plain Text
1PUT index_name/_doc/1
2{
3  "name": "Amber Adams",
4  "age": 32
5}

导入数据成功,返回如下结果。

Plain Text
1{
2  "_index" : "index_name",
3  "_type" : "_doc",
4  "_id" : "1",
5  "_version" : 1,
6  "result" : "created",
7  "_shards" : {
8    "total" : 2,
9    "successful" : 1,
10    "failed" : 0
11  },
12  "_seq_no" : 0,
13  "_primary_term" : 1
14}

返回结果各个字段的含义如下所示。

返回字段 含义
index 索引名称
_type 文档类型
_id 文档唯一标识符
_version 文档版本,每次更新文档,版本都会增加
result 操作结果
_shards 被操作的分片总数量、成功数量、失败数量
_seq_no 文档序列号,序列号用于确保旧版本文档不会覆盖新版本
_primary_term 主项

可以使用如下命令查询数据来进行验证。

Plain Text
1GET index_name/_search
2{
3"query": { "match_all": {} }
4}

导入多条数据

以下示例使用_bulk API创建多个文档并导入数据。

Plain Text
1POST _bulk
2{"index":{"_index": "index_name", "_id": 2}}
3{"name": "Fulton Rich","age": 40}
4{"index":{"_index": "index_name", "_id": 3}}
5{"name": "Virginia Ayala", "age": 12}
6{"index":{"_index": "index_name", "_id": 4}}
7{"name": "Mcgee Mooney", "age": 23}
8{"index":{"_index": "index_name", "_id": 5}}
9{"name": "Burton Meyers", "age": 60}

可以使用如下命令查询插入的数据来进行验证。

Plain Text
1GET index_name/_search
2{
3"query": { "match_all": {} }
4}

搜索数据

向集群导入数据之后,可以进行数据搜索,比如查询索引、全文搜索、按条件搜索等。

查询索引

如下命令查询集群的所有索引。

Plain Text
1GET _cat/indices?v

查询结果如下所示。

Plain Text
1health status index                uuid                   pri rep docs.count docs.deleted store.size pri.store.size
2green open   index_name           GKL71ejiT0CyqJZgVgkMjA   3   1          5            0     11.2kb         11.2kb

查询结果各个字段的含义如下所示。

返回字段 含义
health 索引健康状态
status 索引的开启状态
index 索引名称
uuid 索引uuid
pri 索引主分片数
rep 索引副本分片数量
docs.count 索引中文档总数
docs.deleted 索引中删除状态的文档
store.size 主分片+副本分片的大小
pri.store.size 主分片的大小

全文搜索

如下命令搜索name包含Ayala的文档数据。

Plain Text
1GET index_name/_search
2{
3  "query": {
4    "match": {
5      "name": "Ayala"
6    }
7  }
8}

搜索结果如下所示。

Plain Text
1{
2  "took" : 10,
3  "timed_out" : false,
4  "_shards" : {
5    "total" : 3,
6    "successful" : 3,
7    "skipped" : 0,
8    "failed" : 0
9  },
10  "hits" : {
11    "total" : {
12      "value" : 1,
13      "relation" : "eq"
14    },
15    "max_score" : 0.9808292,
16    "hits" : [
17      {
18        "_index" : "index_name",
19        "_type" : "_doc",
20        "_id" : "3",
21        "_score" : 0.9808292,
22        "_source" : {
23          "name" : "Virginia Ayala",
24          "age" : 12
25        }
26      }
27    ]
28  }
29}

搜索结果各个字段的含义如下所示。

返回字段 含义
took 执行搜索耗时,单位为毫秒
time_out 搜索是否超时
_shards 多少分片被搜索,成功多少,跳过多少,失败多少
hits 搜索结果展示
hits.total 匹配条件的文档总数
hits.max_score 最大匹配得分
hits._score 返回文档的匹配得分(得分越高,匹配程度越高,越靠前)
hits.hits 返回结果展示

按条件搜索

如下命令搜索age在20-30岁之间(闭区间)的文档数据。

Plain Text
1GET index_name/_search
2{
3  "query": {
4    "range": {
5      "age": {
6        "gte": 20,
7        "lte": 30
8      }
9    }
10  }
11}

搜索结果如下所示。

Plain Text
1{
2  "took" : 18,
3  "timed_out" : false,
4  "_shards" : {
5    "total" : 3,
6    "successful" : 3,
7    "skipped" : 0,
8    "failed" : 0
9  },
10  "hits" : {
11    "total" : {
12      "value" : 1,
13      "relation" : "eq"
14    },
15    "max_score" : 1.0,
16    "hits" : [
17      {
18        "_index" : "index_name",
19        "_type" : "_doc",
20        "_id" : "4",
21        "_score" : 1.0,
22        "_source" : {
23          "name" : "Mcgee Mooney",
24          "age" : 23
25        }
26      }
27    ]
28  }
29}

搜索结果各个字段的含义同上。

上一篇
访问Elasticsearch服务
下一篇
创建集群