当前位置:
代码迷
>>
Java相关
>> tika抓取文本如何限制抓取内容的长度
详细解决方案
tika抓取文本如何限制抓取内容的长度
热度:
78
发布时间:
2016-04-22 21:04:37.0
tika抓取文本怎么限制抓取内容的长度?
如题:使用tika抓取各种文档文本内容,如何限制大小.因为返回的是字符串.我只想抓取前100000个字节.
如果用字符串截取的话可能抓取的文档是几百兆的pdf文件 效率会很低.有没有限制抓取大小的?
------解决方案--------------------
参考: Tika
parseToString:获取全文String(setMaxStringLength(int)是对此方法获取全文长度的限制)
相关解决方案
。tika
Lucene4.10使用教程(九):Tika