当前位置: 代码迷 >> Java相关 >> tika抓取文本如何限制抓取内容的长度
  详细解决方案

tika抓取文本如何限制抓取内容的长度

热度:78   发布时间:2016-04-22 21:04:37.0
tika抓取文本怎么限制抓取内容的长度?
如题:使用tika抓取各种文档文本内容,如何限制大小.因为返回的是字符串.我只想抓取前100000个字节.
如果用字符串截取的话可能抓取的文档是几百兆的pdf文件  效率会很低.有没有限制抓取大小的?
------解决方案--------------------
参考: Tika
parseToString:获取全文String(setMaxStringLength(int)是对此方法获取全文长度的限制)