-
求:怎么加快lucene写文件的效率(附代码)
求:如何加快lucene写文件的效率(附代码)packagecom.ffcs.nss.server.lucene; importjava.io.File; importjava.io.IOException; importjava.net.UnknownHostException; importjava.util.ArrayList; importjava.util.Calendar; impo...
246
热度 -
lucene的有关问题,哪个帮忙看看,多谢
lucene的问题,哪个帮忙看看,谢谢!我用lucene生成的索引文件之后在目录下生成了_q.cfs,segments.gen,segments_1j三个文件,可是用luke打开_q.csf文件的时候却报告Invalidpath,ornotaLuceneindex,这是为什么呢?我们公司原来生成的索引文件目录里面只有两个文件_0.cfs,segments,像这种生成两个文件的用luke就可以打开,...
157
热度 -
关于lucene的一个小疑点
关于lucene的一个小疑问就是在建立Field的时候,newField(name,value,Field.Store.NO,Field.Index.ANALYZED),其中当Field.Store的属性为NO的时候,表示不存储value的值,那在搜索的时候,又怎么能通过value搜索到相关信息呢?小弟刚开始学lucene,问的可能比较初级,各位大大见谅分享到:lucene的一个小疑问】就是在建立...
115
热度 -
共享一个不错的Lucene中文分词包!
共享一个不错的Lucene中文分词包! 下载地址:http://www.jesoft.cn/posts/list/5.page1.2增加中文数字的匹配(如:二零零六)数量词采用“n”作为数字通配符优化词典结构以便修改调整1.1增加扩展词典的静态读取方法1.0.1修正无法识别生僻字的问题1.0支持英文、数字、中文(简体)混合分词常用的数量和人名的匹配超过22万词的词库整理...
433
热度 -
大家伙儿知道Lucene建立索引和查询的机制吗
大家知道Lucene建立索引和查询的机制吗?Lucene是怎么建立索引和查询的?有人研究过吗?color='#FF8000'>------解决思路----------------------看这个http://blog.csdn.net/ScAREcrOw_ss/article/details/6139951color='#FF8000'>------解决思路-------------------...
59
热度 -
小弟我现在需要lucene-1.4.3.jar包,帮帮小弟我吧
我现在需要lucene-1.4.3.jar包,帮帮我吧!我现在需要lucene-1.4.3.jar包,更高权本的也行,我在网上找了好久也找不到,到lucene的官网上也没找到。谁有的话发给我好吗,yueli0413@163.com谢谢!color='#e78608'>------解决方案--------------------发了.hug191@163.com
530
热度 -
Lucene+Struts2+Spring+IBatis兑现文档内部搜索代码分享
Lucene+Struts2+Spring+IBatis实现文档内部搜索代码分享最近公司开始研究Lucene,基于Lucene+Struts2+Spring+IBatis进行搭建,现在共享部分代码供大家参考,代码和文档部分文档资料下载地址(复制到迅雷):http://www.bbsdh.org.cn/lucene.rar内部搜索文档系统的截图如下:color='#e78608'>------解决方...
40
热度 -
lucene.net并发修改索引有关问题(多用户同时操作索引)
lucene.net并发修改索引问题(多用户同时操作索引)刚接触lucene不久,最近在测试时发现一个问题,lucene中可以允许多用户同时对索引进行检索,但当用户同时对索引进行相应的新增、修改、删除等操作时通常会报错,请教一下各方朋友的解决办法。。。color='#e78608'>------解决方案------------------------------------------------...
8064
热度 -
lucene4.4复合模糊查询,该如何解决
lucene4.4复合模糊查询假定lucene的document中存储了3个StringField域,分别是"site","channel","title",现在要做多字段匹配且包含模糊的查询,查询条件为:site="1"ANDchannel="10"ANDtitle包含“中国”关键字的数据,不晓得该怎么写?当前使用的lucene4.4,请不吝赐教,谢谢!这种方式:Queryquery=newTe...
40
热度 -
Lucene4.0+索引的效率有关问题
Lucene4.0+索引的效率问题最近用Lucene4.0做全文检索:公司大约有700GB左右的文件,格式有PDF、word、ppt、图片及其它等等,文件数量大约在70万个左右。我用多线程调用Tika来解析文件,解析后的文本文件写入本地磁盘,耗时大概1-2天的样子。然后用Lucene4.0对做索引,索引代码如下:Analyzeranalyzer=newStandardAnalyzer(Versio...
143
热度 -
求救:lucene索引文件时出错解决办法
求救:lucene索引文件时出错我索引文件的函数如下:privatestaticvoidindexFile(IndexWriterwriter,Filef)throwsException{if(f.isHidden()||!f.exists()||!f.canRead()){return;}//读句子加入索引InputStreamReaderread=newInputStreamReader(ne...
54
热度 -
lucene对xml检索有关问题
lucene对xml检索问题我对文件夹里的xml文件建立了索引,但是为什么就检索不到呢,请各位大侠指点指点:建立索引的类:LuceneIndexLocalDiskpackageTest;importjava.io.IOException;importjava.io.File;importjavax.xml.parsers.DocumentBuilder;importjavax.xml.parser...
307
热度 -
关于全文检索的稿子(使用技术Lucene3.0)
关于全文检索的文章(使用技术Lucene3.0) Lucene3.0全文搜索简单应用 由于项目的要求,用到了全文搜索技术,上网查了许多资料,结合本项目实际情况,现将lucene3.0总结如下: 1.首先了解一下lucene中的一些基本概念: ?假设我们的电脑的目录中含有很多文本文档,我们需要查找哪些文档含有某个关键词。为了实现这种功能,我们首先利用Lucene对这个目录中的文档建立索引,然后在建立...
192
热度 -
lucene全文检索组合用户行为优化排序结果
lucene全文检索结合用户行为优化排序结果问题是这样的:我在做一个全文检索引擎,对数据库表建索引进行查询,然后对查询结果进行排序;查询用到这三个字段:name(名称),address(地址),visits(查询频率);其中查询频率visit是动态变化的;举例说明一下:我输入“测绘”,查询结果如下图,假设我想得到的结果是“省测绘局”,我点击省测绘局,会增加数据库中visit的值,我想通过visit...
72
热度 -
Lucene评分公式的数学推导解决思路
Lucene评分公式的数学推导在进行Lucene的搜索过程解析之前,有必要单独的一张把Lucenescore公式的推导,各部分的意义阐述一下。因为Lucene的搜索过程,很重要的一个步骤就是逐步的计算各部分的分数。Lucene的打分公式非常复杂,如下:在推导之前,先逐个介绍每部分的意义:t:Term,这里的Term是指包含域信息的Term,也即title:hello和content:hello是不...
9
热度 -
lucene.net分词搜索有关问题求解
lucene.net分词搜索问题求解数据表内容:idcontent1言归正传,为什么要把web服务器与数据库分开放置呢?2数据库配置该如果进行3服务器该怎么防攻击?我采用的是射日分词分析器建立索引和搜索的。当我搜索关键词:数据库结果id为1,2当我搜索关键词:数据库服务器结果id为1,2,3当我搜索关键词:数据库服务器结果id为空当我搜索关键词:服务器数据库结果id为空我插了下搜索关键词的拆分,服...
1150
热度 -
请教下,Lucene怎么对Nutch抓取的页面进行索引啊
请问下,Lucene如何对Nutch抓取的页面进行索引啊?请问下,Lucene如何对Nutch抓取的页面进行索引啊?分享到:Lucene如何对Nutch抓取的页面进行索引啊?】请问下,Lucene如何对Nutch抓取的页面进行索引啊?'data-pics=''>color='#FF8000'>------解决方案--------------------nutch没用过,但是这和对lucene去索引...
9
热度 -
Lucene.net 多个词查询,该怎么解决
Lucene.net多个词查询百度,google搜索时候输入多个词中间用空格隔开,就可以搜索这两个关键的数据Lucene.net怎么能实现呢感觉和Sql里边的like'%X%'or'%X1%'这样怎么实现呢?color='#e78608'>------解决方案--------------------------------------------------------没必要吧,搜索分词的时候就自...
10690
热度 -
lucene+paoding搜寻不到任何结果
lucene+paoding搜索不到任何结果如题,代码是用的paoding的一个例子代码(我自己写的一个也不行)。publicclassEnglish{ privatestaticStringFIELD_NAME="content"; privatestaticStringQUERY="Tomcat"; publicstaticvoidmain(String[]args)throwsExcepti...
63
热度 -
lucene.net 分词搜索有关问题
lucene.net分词搜索问题我使用了lucene.net的内置分析器StandardAnalyzer,对于中文搜索没有任何问题,但是对英文和数字以及符号等搜索不是很理想举个例子:12345-12,当我输入12345的时候是检索不到12345-12的,只有在输入12345-12的时候才能被检索到不知怎么才能解决,在网上看了ChineseAnalyzer,不是内置的,不知道效果怎么样,希望哪位大侠...
3948
热度