以下三种Character Filter是elasticsearch官方提供的三种,(只有三种哦!)
Mapping Char Filter
通过给定的mappings数据来替换.
mappings | mappings数据. |
mappings_path | 一个存放mappings数据的地址,可以把mappings数据写到config配置文件中,然后把 config存放到某个路径下 |
1 | 1 |
HTML Strip Char Filter
html_strip 把数据中的html 标签元素剥离出来。例如“<a>”就会变成“a
Pattern Replace Char Filter
pattern_replace 用正则表达式的方式来替换数据。 pattern 正则表达式“参数” replacement 最后替换后的形式。借鉴了lucene的相关内容,详情请参考:http://lucene.apache.org/core/4_3_1/analyzers-common/org/apache/lucene/analysis/pattern/PatternReplaceCharFilter.html
书写格式:
例子:
1、元数据:"aa bb aa bb" 、
pattern="(aa)\s+(bb)"、 replacement="$1#$2"
输出结果为:"
aa#bb aa#bb"
2、元数据:"
aa123bb" 、
pattern="(aa)\d+(bb)" 、 replacement="$1 $2"
输出结果为:"
aa bb"