 Elastic_search-字段指定自带分词器
Elastic_search-字段指定自带分词器
  # 版本
# ES
5.4.2
# 自带的几种分词器
| 分词器 | 解释 | 
|---|---|
| standard | 标准标记器,标准过滤器,小写过滤器,停止过滤器 | 
| simple | 小写的分词器 | 
| stop | 小写标记器,停止过滤器 | 
| keyword | 不分词,内容整体作为一个值 | 
| whitespace | 以空格分词 | 
| language | 以语言分词 | 
| snowball | 标准标记器,标准过滤器,小写过滤器,停止过滤器,雪球过滤器 | 
| custom | 自定义分词。至少需要指定一个 Tokenizer, 零个或多个Token Filter, 零个或多个Char Filter | 
| pattern | 正则分词 | 
# 准备
- 删除之前的索引,否则会报已存在错误
# 正文
- fielddata是为了能使用aggs,不需要的可以不加
PUT index名
{
  "mappings":{
    "doc":{
      "properties":{
        "字段名": {
            "type": "指定字段类型,如text",
            "analyzer": "指定分词器,如whitespace",
            "fielddata": true
        },
         "其他字段名": {
           "type": "keyword"
         }
      }
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
编辑  (opens new window)
  上次更新: 2024-12-06, 10:03:39
