1.     介绍
Lucene是一个用Java写的全文索引引擎工具包,软件包中包括一些简单的例程,可以直接试用。本例将测试对一个目录中的txt文件进行索引,并通过索引找到相应的文件。

2.     原理
反向搜索机制,维护了一个词/短语表,对于这个表中的每个词/短语,都有一个链表描述了有哪些文档包含了这个词/短语。
Lucene 软件包的发布形式是一个 JAR 文件,包说明
org.apache.lucene.analysis   用于分词
org.apache.lucene.index      用于建立索引
org.apache.lucene.search 用于搜索

3.     安装

1)       下载:
http://xiexiejiao.cn/java/lucene-3-0-2-release-download.html
本文以lucene-3.0.3-src.tar.gz为例,在Linux中安装运行

2)       安装相关工具

a)       安装JDK 1.5以上版本

b)       安装Ant工具(Ant是编译Java的工具,与make功能相似)
$ apt-get install ant

3)       安装(参见源码包中BUILD.txt说明)
$ tar xvzf lucene-3.0.3-src.tar.gz
$ cd lucene
$ ant       // 此时在build目录下产生jar包
$ ant compile-demo
$ ant jar-demo  // 此时在build目录下产生demo的jar包

4)       运行
$ export CLASSPATH=$CLASSPATH:xxx/build/lucene-core-3.0.3-dev.jar:xxx/build/lucene-demos-3.0.3-dev.jar   // 设置jar包环境变量
$ java org.apache.lecene.demo.IndexFiles TXT所在的目录名    // 此时生成了索引
$ java org.apache.lecene.demo.SearchFiles   //然后按提示输入要查的词,即可找到相应的txt

4.     参考

1)       Lucene入门
http://www.iteye.com/topic/33241

 


(转载请注明出处)


GitHub 加速计划 / li / linux-dash
10.39 K
1.2 K
下载
A beautiful web dashboard for Linux
最近提交(Master分支:2 个月前 )
186a802e added ecosystem file for PM2 4 年前
5def40a3 Add host customization support for the NodeJS version 4 年前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐