lucene?Lucene怎样发音
一、Lucene怎样发音
['lusen]Lucene(发音为['lusen])是一个非常优秀的开源的全文搜索引擎,我们可以在它的上面开发出各种全文搜索的应用来。Lucene在国外有很高的知名度,现在已经是Apache的顶级项目,在国内,Lucene的应用也越来越多。
二、lucene存储原理
Lucene是一个基于Java的全文检索引擎,它的存储原理是将文档分解成一个个的词条,然后将这些词条存储在索引文件中,以便快速检索。
索引文件中的每个词条都会被分配一个唯一的ID,并且会记录该词条出现在哪些文档中,以及出现的次数。
当用户搜索时,Lucene会根据用户输入的关键词,查找索引文件中的词条,并返回包含这些词条的文档。
三、lucene 最大索引字数
单个分片(Shard)实际是Lucene的索引,单分片能存储的最大文档数是:2,147,483,519(=Integer.MAX_VALUE-128)。