当前位置:首页 > 经验 >

elasticsearch用什么语言写的(elasticsearch什么语言好)

来源:原点资讯(www.yd166.com)时间:2022-11-04 04:39:29作者:YD166手机阅读>>

本文演示了如何使用IK Analysis 插件来实现在 Elasticsearch 中的中文分词功能。

使用中文分词

在“Spring Boot应用企业级博客系统”课程中(http://coding.imooc.com/class/125.html),所有的博客功能都已经完成了。读者朋友们开始愉快地使用博客来发表博客了。但如果朋友们足够细心的话,发现在输入中文的标签的时候,存在一定的问题。

比如,当我们想将某个博客标记为“大神”时,博客系统却将这个单词粗暴的分成了如图21-2所示的两个词“大”和“神”。显然,这并不符合用户的使用习惯。

elasticsearch用什么语言写的,elasticsearch什么语言好(1)

这是 Elasticsearch 语言分析器上的限制,它并不能友好的处理所有语言,特别是中文。这种情况下,我们就需要额外的中文分词器来协助我们了。

本章节,我们将演示使用 IK Analysis 插件来帮助我们实现中文分词。

IK Analysis 插件

IK Analysis 插件(https://github.com/medcl/elasticsearch-analysis-ik/)就是一款专门用于 Elasticsearch 的分词器,可以友好的处理中文。

IK Analysis 插件将 Lucene IK 分析仪(http://code.google.com/p/ik-analyzer/)集成到了 Elasticsearch 中,从而支持自定义分词。

安装 IK Analysis

安装 IK Analysis 非常简单。主要有两种方式。

使用 elasticsearch-plugin

如果 Elasticsearch 是 5.5.1 以后的版本,可以使用 elasticsearch-plugin 来安装,安装方式如下:

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v5.5.1/elasticsearch-analysis-ik-5.5.1.zip 1

下载解压到指定目录

另外一种方式是,下载安装包,解压到 Elasticsearch 安装目录的 /plugins/目录下即可。

下图展示了 IK 的安装目录。

elasticsearch用什么语言写的,elasticsearch什么语言好(2)

需要注意的是,不管是哪种安装方式,相应的插件,要对应相应的 Elasticsearch 版本,否则可能会安装不成功。

下载地址为 https://github.com/medcl/elasticsearch-analysis-ik/releases。本章节,我们使用 IK Analysis for Elasticsearch 5.5.0 版本。

使用 IK Analysis

要使用 IK Analysis,需要在文档类里面,指定相应的分词器。我们在 EsBlog 的 tags 属性上,添加了searchAnalyzer = "ik_smart", analyzer = "ik_smart"的注解内容就可以了。

public class EsBlog implements Serializable { ... @Field(type = FieldType.text,fielddata = true, searchAnalyzer = "ik_smart", analyzer = "ik_smart") private String tags; // 标签 1 2 3 4 5 6

下图展示了使用了IK分词的标签效果

elasticsearch用什么语言写的,elasticsearch什么语言好(3)

IK Analysis 类型

ik_smart 是 IK Analysis 其中一种分词形式。IK Analysis主要有两种类型的分词形式,分别是 ik_max_word 和 ik_smart。

  • ik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国”、“中华人民”、“中华”、“华人”、“人民共和国”、“人民”、“人”、“民”,、“共和国”、“共和”、“和”、“国歌”等,会穷尽各种可能的组合;
  • ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国”、“国歌”。

栏目热文

elasticsearch有什么用(elasticsearch快速入门)

elasticsearch有什么用(elasticsearch快速入门)

目录一、ElasticSearch是什么?二、ElasticSearch基本概念1. 全文搜索(Full-text Se...

2022-11-04 04:54:14查看全文 >>

elasticsearch怎么读中文(elasticsearch快速入门)

elasticsearch怎么读中文(elasticsearch快速入门)

Elasticsearch是什么•Elasticsearch 是一个分布式的开源搜索和分析引擎。•适用于所有类型的数据,...

2022-11-04 04:58:03查看全文 >>

elasticsearch 可以干什么(elasticsearch是怎么存储的)

elasticsearch 可以干什么(elasticsearch是怎么存储的)

摘要先自上而下,后自底向上的介绍ElasticSearch的底层工作原理,试图回答以下问题:为什么我的搜索 *foo-b...

2022-11-04 04:40:27查看全文 >>

elasticsearch代码(elasticsearch接口调用)

elasticsearch代码(elasticsearch接口调用)

前言看到标题以后大家有些人可能感觉有点小题大做,毕竟cilent端几行代码就能解决的问题,没必要兴师动众的来仔细讲一下。...

2022-11-04 04:38:13查看全文 >>

elasticsearch 做什么用的(elasticsearch有什么用)

elasticsearch 做什么用的(elasticsearch有什么用)

作者:靠发型吃饭的柳树 来自:柳树的絮叨叨Elasticsearch是什么? Elasticsearch is the ...

2022-11-04 04:17:02查看全文 >>

elasticsearch干嘛的(elasticsearch白名单)

elasticsearch干嘛的(elasticsearch白名单)

Elasticsearch,这个家伙我就不用过多介绍了吧,简称ES,这可不是js里面的es语法也不是阿里云里面的es云服...

2022-11-04 04:35:08查看全文 >>

elasticsearch是什么系统(elasticsearch为什么快)

elasticsearch是什么系统(elasticsearch为什么快)

在安装配置之前 ,我们首先应该弄清楚什么是Elasticsearch,以及它有什么作用什么是Elasticsearch?...

2022-11-04 04:35:44查看全文 >>

elasticsearch怎么读日志(elasticsearch 日志输出)

elasticsearch怎么读日志(elasticsearch 日志输出)

ElasticStack技术栈如果你没有听说过 Elastic Stack,那你一定听说过 ELK ,实际上 ELK 是...

2022-11-04 04:19:49查看全文 >>

elasticsearch重要吗(为什么要elasticsearch)

elasticsearch重要吗(为什么要elasticsearch)

前提人工智能、大数据快速发展的今天,对于 TB 甚至 PB 级大数据的快速检索已然成为刚需,大型企业早已淹没在系统生成的...

2022-11-04 05:04:41查看全文 >>

elasticsearch的概念(elasticsearch 是啥)

elasticsearch的概念(elasticsearch 是啥)

Elasticsearch核心概念Near Realtime (NRT) 近实时:数据提交索引后,立马就可以搜索到。Cl...

2022-11-04 05:05:24查看全文 >>

文档排行