首页编程java编程java搜索引擎有什么用(怎么用java 开发一个搜索引擎呀)

java搜索引擎有什么用(怎么用java 开发一个搜索引擎呀)

编程之家2023-10-1285次浏览

大家好,关于java搜索引擎有什么用很多朋友都还不太明白,今天小编就来为大家分享关于怎么用java 开发一个搜索引擎呀的知识,希望对各位有所帮助!

java搜索引擎有什么用(怎么用java 开发一个搜索引擎呀)

java软件开发到底是干什么的

一、做网站

Java可以用来做网站,很多大型网站都是用Java写的,比如我们熟悉的B站,所以想学习Java的同学还可以负责网站方面的制作,这方面的岗位(网站开发)也比较多,一直以来都相当流行。

二、做安卓软件

java搜索引擎有什么用(怎么用java 开发一个搜索引擎呀)

安卓是基于Linux的操作系统,其中源代码就是Java,市面上所有的安卓手机都是修改Java运行的,对于更多的开发人员来说,他们更多的时间是花在开发APP上面。你随便打开一个App应用,他们就是用Java语言做的。

三、做游戏

电脑上的大多数游戏也是用Java来开发的,最经典的就是《我的世界》,还有当今世界最具影响力的游戏英雄联盟,吃鸡也是用Java写的

java搜索引擎有什么用(怎么用java 开发一个搜索引擎呀)

四、写软件

很多编程语言都是可以来写软件的,但Java是现在应用最广泛的,比如:企业级应用开发,还有OA、邮箱、物流、医疗、投票、金融、考试、矿山等信息方面的系统,Java都占有极为重要的地位。现在国内的最热门的就是手机应用,学习Java去做手机应用还是比较吃香的。

五、Java服务器程序

Java在金融服务业的应用非常广泛,许多跨国投资银行都用Java来编写前台和后台的电子交易系统,结算和确认系统,数据处理项目以及其他项目。

大多数情况下,Java被用在服务器端开发,但多数没有任何前端,它们通常是从一个服务器(上一级)接收数据,处理后发向另一个处理系统(下一级处理)。

六、Java大数据技术

Hadoop以及其他大数据处理技术都是用Java或者其他,Java依旧还有潜力去在这个市场占据一部分。

怎么用java 开发一个搜索引擎呀

一.创建索引

1.一般创建索引的核心步骤

(1).创建索引写入对象IndexWriter:

IndexWriter indexWriter= new IndexWriter(INDEX_STORE_PATH,new StandardAnalyzer(),create);

参数说明:INDEX_STORE_PATH:索引文件存放路径

new StandardAnalyzer():分词工具

create:此参数为Boolean型,true表示重新创建整个索引,false表示增量式创建索引。

(2).创建文档模型,并用IndexWriter对象写入

Document doc= new Document();

Field field1= new Field(fieldName1, fieldValue,Field.Store.YES, Field.Index.TOKENIZED);

doc.add(field1);

Field field2= new Field(fieldName2, fieldValue,Field.Store.YES, Field.Index.TOKENIZED);

doc.add(field2);

……

indexWriter.addDocument(doc);

indexWriter.close();

参数说明:

Document:负责搜集数据源,它可以从不同的物理文件提取数据并放入同一个Document中或从一个物理文件中提取出不同的数据并放入同一个Document中。

如下图所示

Field:用来表示不同的数据源

fieldName1:表示field名称

fieldValue:表示field的值

Field.Store.YES,:表示是否在索引文件中完整的存储该值。

在创建索引时,有些内容需要以摘要的形式完整地或以片段的方式显示在页面上,来便于用户查找想要的记录,那么就应该选择存储,如果不需要完整或片段的显示就不需要存储。

Field.Index.TOKENIZED:表示是否索引和分词。

只要是需要当作关键字让用户查找的字段就需要建立索引。

在建立索引的过程中,如果像文章标题、文章内容这样的Field,一般是靠用户输入几个关键字来查询的,就应该选择分词。

如果需要用户输入完整字符也就是精确查找才能查询到的,例如:beanName,就可以不分词。

Document最直观的理解方式:

Document就相当于我们平台中的一个普通javaBean,,而Field就是javaBean中的一个属性。lucene搜索的机制就是靠搜索指定的Field的值,来得到含有要搜索内容的Document集合,所以问题的关键在于如何组织Document.

2.结合平台创建索引的思路

(1)经分析搜索元素应该由如下内容组成(Document的属性)

(2)数据库数据转化为Document的构造过程:

JavaBean/ Attachment→(Temp Object) BaseData→(Finally Object) Document

分析:

要建立索引的源数据分为两大部分:一个是数据库数据BeanData,另一个是附件数据FileData,这样可以建立一个抽象类BaseData,来存放它们共有的属性。同时为了管理这些相应的数据,在相同的等级结构上,建立了相应的管理类(xxxDataManager),对这些数据类的操作(建立或删除索引)进行管理,并用一个工厂类(DataManagerFactory)来创建所需要的管理类,IndexHelper用来充当整个索引模块对外的接口,为了实现一些与平台特定的业务,特用SupportManager来提供一些额外的业务支持,索引模块代码结构如下图所示。

二.搜索索引

1.lucene搜索的核心步骤:

String[]fields={“title”,“summary”,……};//要查找的field范围

BooleanClause.Occur[]flags={BooleanClause.Occur.SHOULD, BooleanClause.Occur.MUST,……};

Queryquery= MultiFieldQueryParser.parse(queryStr, fields,flags,new StandardAnalyzer());

Hitshits=newIndexSearcher(INDEX_STORE_PATH).search(query);

for(int i= 0;i< hitsLength; i++)

{

Document doc= hits.doc(i);

String title= doc.get(“title”);

String summary= doc.get(“summary”);

//搜索出来的结果高亮显示在页面上

if(title!= null){

TokenStream tokenStream= analyzer.tokenStream(“title”,new StringReader(title));

String highlighterValue= highlighter.getBestFragment(tokenStream, title);

if(highlighterValue!= null){

title= highlighterValue;

}

//log.info("SearchHelper.search.title="+title);

}

if(summary!= null){

TokenStream tokenStream= analyzer.tokenStream(“summary”,new StringReader(summary));

String highlighterValue= highlighter.getBestFragment(tokenStream, creator);

if(highlighterValue!= null){

summary= highlighterValue;

}

//log.info("SearchHelper.search. summary="+ summary);

}

}

2.结合平台构造搜索模块

PageData类用来存放检索结果集数据。

PageInfo类用来存放页面相关信息例如,PageData对象集合、总记录个数、每一页的记录数、总页面数量等等。

SearchHelper用来充当整个搜索模块的对外接口。

三.为平台组件添加索引的步骤(以知识中心为例)

1.在com.cscec.oa.searchengine.extend.module目录下添加一个新的package

例如:com.cscec.oa.searchengine.extend.module.resourcestore

2.在新的目录下建立data package并建立相应的数据类,并使这个数据类继承BeanData。

例如:

package com.cscec.oa.searchengine.extend.module.resourcestore.data

public class ResourceStoreBeanData extends BeanData{

}

3.与data package同一级目录建立manager package并建立相应管理类,并使这个管理类继承BeanDataManager

例如:

com.cscec.oa.searchengine.extend.module.resourcestore.manager

public class ResourceStoreBeanDataManagerImpl extends BeanDataManager{

}

4.以管理员的身份登陆OA后,在菜单中找到“索引模块管理”链接,将相应信息添加完成后,便可以在List页面点击“创建索引”对该模块的数据进行索引的建立,建立完成后便可以进行查询。

java里索引是什么意思

java编程中索引是对数据库表中一列或多列的值进行排序的一种结构(B树-平衡多叉树)。

创建索引可以大大提高系统的性能。

第一,通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。

第二,可以大大加快数据的检索速度,这也是创建索引的最主要的原因。

第三,可以加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。

第四,在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。

第五,通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能

关于java搜索引擎有什么用到此分享完毕,希望能帮助到您。

学java去哪做什么工作呢(学习java之后会从事哪方面的工作)断言失败 java 是什么 java assertionerror是什么异常