商务服务
java高级--Elasticsearch
2024-11-14 21:45

                1.1 什么是搜索引擎

                概念:用户输入想要的关键词,返回含有该关键词的所有信息。

java高级--Elasticsearch

        场景:

                1、互联网搜索:谷歌、百度、各种新闻首页

                 2、 站内搜索(垂直搜索):企业OA查询订单、人员、部门,电商网站内部搜索商品(淘宝、京东)场景。

                1.2 数据库做搜索弊端

                数据量小,简单搜索,可以使用数据库。

                站内搜索的问题: 如果数据量很大。

  1. 存储的问题: 电商网站商品上亿条时,涉及到单表数据过大必须拆分表,数据库磁盘占用过大必须分库。

  2. 性能问题: 解决上面问题后,查询“笔记本电脑”等关键词时,上亿条数据的商品名字段逐行扫描,性能跟不上。

  3. 分词搜索问题: 如搜索“笔记本电脑”,只能搜索完全和关键词一样的数据,那么数据量小时,搜索“笔记电脑”,“电脑”数据要不要给用户。

                互联网搜索: ---数据量pb级别的数据【byte字节 kb m G t p】

                        存储引擎来解决上面数据库作为搜索的弊端。

                1.3 常用的搜索引擎软件

                 Solr Elasticsearch                 理解为数据库-->搜索性能非常块而且存储量也比较大

                1.4 Solr 和 Elasticsearch

1.当单纯的对已有数据进行搜索时,Solr更快

 

2.当实时建立索引时,Solr会产生io阻塞,查询性能较差,ElasticSearch具有明显的优势

3.随着数据量的增加,Solr的搜索效率会变得更低,而ElasticSearch却没有明显的变化

        总结 1、es基本是开箱即用(解压就可以用!)【南京】 ,非常简单。Solr安装略微复杂一丢丢! 2、Solr 利用Zookeeper进行分布式管理,而Elasticsearch<mark>自身带有分布式协调管理功能</mark>。 3、Solr 支持更多格式的数据,比如JSON、XML、 CSV ,而Elasticsearch仅支持json文件格式。 4、Solr 官方提供的功能更多,而Elasticsearch本身更注重于核心功能,高级功能多有第三方插件提供,例如图形化界面需要kibana友好支撑 5.Solr 查询快,但更新索引时慢(即插入删除慢) ,用于电商等查询多的应用;

ES建立索引快(即查询慢) ,即实时性查询快,用于facebook新浪等搜索。 Solr是传统搜索应用的有力解决方案,但Elasticsearch更适用于新兴的实时搜索应用。 6、Solr比较成熟,有一个更大,更成熟的用户、开发和贡献者社区,而Elasticsearch相对开发维护者较少,更新太快,学习使用成本较高。

        > 大多数企业使用的是ES.

                1.5 Elasticsearch是什么

                The Elastic Stack, 包括 Elasticsearch【搜索,分析】、 Kibana【可视化】、 Beats 和 Logstash【数据的搜集】(也称为 ELK Stack)。能够安全可靠地获取任何来源、任何格式的数据,然后实时地对数据进行搜索、分析和可视化。

        Elaticsearch,简称为 ES, ES 是一个开源的高扩展的分布式全文搜索引擎, 是整个 ElasticStack 技术栈的核心。

        它可以近乎实时的存储检索数据;本身扩展性很好,可以扩展到上百台服务器,处理 PB 级别的数据。

        总结: 核心实时存储 和 实时数据分析 实时数据检索 而且可以处理数据量PB级别,以及扩展

                1.6 哪些公司正在使用ES

国外:

  • 维基百科,类似百度百科,“网络七层协议”的维基百科,全文检索,高亮,搜索推荐

  • Stack Overflow(国外的程序讨论论坛),相当于程序员的贴吧。遇到it问题去上面发帖,热心网友下面回帖解答。

  • GitHub(开源代码管理),搜索上千亿行代码。

  • 电商网站,检索商品

  • 日志数据分析,logstash采集日志,ES进行复杂的数据分析(ELK技术,elasticsearch+logstash+kibana)

  • 商品价格监控网站,用户设定某商品的价格阈值,当低于该阈值的时候,发送通知消息给用户,比如说订阅《java编程思想》的监控,如果价格低于27块钱,就通知我,我就去买。

  • BI系统,商业智能(Business Intelligence)。大型连锁超市,分析全国网点传回的数据,分析各个商品在什么季节的销售量最好、利润最高。成本管理,店面租金、员工工资、负债等信息进行分析。从而部署下一个阶段的战略目标。

国内:

  • 百度搜索,第一次查询,使用es。

  • OA、ERP系统站内搜索。

  • 知网

                1.7 安装ES

                保证JDK 1.8.0_73以上的版本。---安装在window                不要安装在中文目录下

                下载和解压缩Elasticsearch安装包,查看目录结构。

         Download Elasticsearch | Elasti

        下载地址:https://www.elastic.co/cn/downloads/

    以上就是本篇文章【java高级--Elasticsearch】的全部内容了,欢迎阅览 ! 文章地址:http://sicmodule.glev.cn/news/411.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 歌乐夫资讯移动站 http://sicmodule.glev.cn/mobile/ , 查看更多   
最新新闻
《世界公卫人》| 中国营养学会肥胖防控分会主委王友发:控体重是防慢病的第一环
在3月4日“世界肥胖日”来临之际,《生命时报》记者专访了西安交通大学医学部副主任、全球健康研究院院长、中国营养学会肥胖防控
研学的目的和意义 研学活动有必要参加吗
研学的目的和意义1、提高综合素质研学强调知识与实践相结合,进而培养学生综合运用知识的能力,提高其综合素质。2、增强信心在研
给跳舞的您五条中肯的建议,轻松提升自己!
舞蹈如人生,找到正确的方法,朝着心中的方向前进,很多的困难都会迎刃而解,对舞蹈的感悟也会达到全新的高度。 善于学习别人的
特权二:把你介绍给最亲近的人,给你满满的安全感
男人深爱一个女人的表现有哪些?一次与读者群里的朋友聊起这个话题,有个女孩说:有时觉得我老公是爱我的,因为他细心、贴心,有
花粉大全,我国常见的花粉及功效!
茶花蜂花粉(花粉之王)新鲜茶花粉具有特殊的茶香气息,味道微甜,呈浅黄色。茶花粉富含蛋白质,氨基酸,脂肪酸,维生素,活性酶
江苏省淮州中学原校长利用手中权力敛财百万陷入犯罪深渊
  忏悔人:王维银  原任职务:江苏省淮州中学校长  触犯罪名:受贿罪  判决结果:2010年12月15日,淮安市中级法院判处王
人生的经典哲理语录
【精华】2024年人生的经典哲理语录88句  冬日的正午,感觉如同是夏日的黄昏一样,模糊而又悲伤地美好着。以下是小编精心准备的
5个关键词还原网红仲尼35岁人生
据每日经济新闻,11月8日,网红卡琳娜的老公,同样也是网红博主、作家的仲尼,在印度尼西亚巴厘岛旅游时溺水身亡,相关话题引发
回望2020大事件之关键词(知识产权报)
学习:指明方向 推动伟大实践一切伟大的实践,根本在于科学理论的正确指引。2020年11月30日,中共中央政治局以“加强我国知识产
java高级--Elasticsearch
1.1 什么是搜索引擎概念:用户输入想要的关键词,返回含有该关键词的所有信息。场景: 1、互联网搜索:谷歌、百度、各种新闻首
本企业新闻