Elastic_search-字段指定自带分词器
# 版本
# ES
5.4.2
# 自带的几种分词器
分词器 | 解释 |
---|---|
standard | 标准标记器,标准过滤器,小写过滤器,停止过滤器 |
simple | 小写的分词器 |
stop | 小写标记器,停止过滤器 |
keyword | 不分词,内容整体作为一个值 |
whitespace | 以空格分词 |
language | 以语言分词 |
snowball | 标准标记器,标准过滤器,小写过滤器,停止过滤器,雪球过滤器 |
custom | 自定义分词。至少需要指定一个 Tokenizer, 零个或多个Token Filter, 零个或多个Char Filter |
pattern | 正则分词 |
# 准备
- 删除之前的索引,否则会报已存在错误
# 正文
- fielddata是为了能使用aggs,不需要的可以不加
PUT index名
{
"mappings":{
"doc":{
"properties":{
"字段名": {
"type": "指定字段类型,如text",
"analyzer": "指定分词器,如whitespace",
"fielddata": true
},
"其他字段名": {
"type": "keyword"
}
}
}
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
编辑 (opens new window)
上次更新: 2024-12-06, 10:03:39