Loading... ## DocFetcher 简介 官方网站:[http://docfetcher.sourceforge.net/zh/index.html](http://docfetcher.sourceforge.net/zh/index.html) > 最近写材料的时候,用到这个非常好用。特别是有一次考试临时用了以下找材料,还挺好用的,推荐给大家。优雅~ DocFetcher 是一个使用 Java 语言开发的开源桌面搜索应用程序:它允许您搜索计算机上的文档内容,能够在 Windows,Linux 和 OS X 上运行。 本人在工作中已经使用 DocFetcher 超过半年时间,主要用来在代码库中查找包含关键字或关键字的组合的源码文件,基本能够满足我的工作中检索源码的需要。而 Docfetcher 奇快的查找速度着实给了我不种草都不行的理由,当然,Docfetcher 也并非完美无瑕,在日常使用中也发现其存在一些 bug,但不影响主要功能的使用。 ![1.1.png](https://imgki.com/usr/uploads/2022/03/414474447.png) ## 下载安装 运行环境:Java Runtime Environment(JRE)1.7 + 下载地址:[http://docfetcher.sourceforge.net/en/download.html](https://link.ld246.com/forward?goto=http%3A%2F%2Fdocfetcher.sourceforge.net%2Fen%2Fdownload.html) 安装方法:windows 平台请使用 .exe 安装包进行安装,其他平台请参照官方文档 ![1.2.png](https://imgki.com/usr/uploads/2022/03/151178118.png) ## 使用方法 ### part1 建立索引 为了快速的进行文本检索,DocFetcher 在检索文档文本前需要建立索引,用户可以根据需要为文件夹或者整个磁盘建立索引,当然,仅仅在第一次检索时需要为所要检索的文件夹或磁盘建立索引,建立索引后,当文件内容发生了变化 DocFetcher 会自动更新索引。以下是建立索引的详细方法: #### step 1 如图所示,右击[搜索范围]框的空白处,选择弹出菜单中的[建立索引 - 资料夹]。 ![2.1.png](https://imgki.com/usr/uploads/2022/03/64972280.png) #### step 2 在弹出的选择窗口中选择需要检索文档的位置,点击[确认]。 ![2.2.png](https://imgki.com/usr/uploads/2022/03/3356738580.png) #### step 3 在弹出的窗口中可以对索引的细节进行设置,可以选择所要检索的文件格式,在排除列表中可以使用正则表达式过滤不需要建立索引的文件和文件格式,其他选项没有特殊要求使用默认值即可。最后选择[执行],将开始建立索引。 ![2.3.png](https://imgki.com/usr/uploads/2022/03/716174741.png) #### step 4 建立索引的过程耗时较长,具体时间取决于所选建立索引的文件夹中包含的文件数量及文件大小。索引建立完成后在首页的[搜索范围]框内便有了对应的目录。 ![2.4.png](https://imgki.com/usr/uploads/2022/03/969470139.png) ### part2 检索数据 对于建立好索引的目录,可以通过勾选检索目录、勾选文件类型、设定文件大小、输入关键字来进行文本检索。 #### 1. 检索语法 这里仅对 DocFetcher 的检索语法做简单介绍,详细内容请参照官方文档。 * 短语搜索:需要将所要检索的短语放入英文双引号内。如 :"可转债",返回包含词语"可转债"的文件; * 布尔运算:支持复杂条件的检索,常用运算符包含 AND、OR 、NOT 等,短语间没有运算符时将默认使用 OR。如 "可转债" AND "可交换债",返回既包含短语"可转债"又包含短语"可交换债"的文件; * 通配符:问号(`'?'`)和星号(`'*'`)可用于表示某些字符未知。如 :"可"*,返回包含"可以"、"可转债"、"可交换债"等包含以"可"开头的语句的文件; * 模糊搜索:可以搜索与给定单词*类似* 的单词。如,roam~,返回包含 foam 和的单词的文档 roams 的文件。 #### 2.检索示例 检索包含短语"Bond_Issue"的文件,点击检索结果里的文件可以在下方的预览框预览文件的内容,预览中命中的检索关键字将被标红,如下图所示。 ![4.2.png](https://imgki.com/usr/uploads/2022/03/1713637048.png) 检索即包含"Bond_Issue" 和短语 "WBPJRQ" 的文件,如下图所示。 ![4.3.png](https://imgki.com/usr/uploads/2022/03/508878018.png) ### part3 设置 通过点击右上角的齿轮状按钮可以进入[设置]。在设置中可以对默认布尔运算符进行修改、自动预览一个人符合的项目、使用及时搜索等,还可以对预览的字体,命中文本的颜色,快捷键等进行设置。 ![5.1.png](https://imgki.com/usr/uploads/2022/03/3477467873.png) ### part4 注意事项 #### 1. 内存大小限制 DocFetcher 的默认内存限制为 256 MB,因此 DocFetcher 运行时占用的内存大小和资源都是相当小的,但是当检索速度过慢或者索引建立时存在单个文件过大而导致索引建立失败则需要提高内存大小。 Windows 平台下,DocFetcher 内置了多个不同内存大小的启动器,其位于 DocFetcher 安装目录下的 misc 目录下。 在 misc 目录下,文件名"DocFetcher-2048_64-bit-Java.exe"中的"-2048"即是表示使用 2048MB 的内存启动,"64-bit-Java"表示为 64 位的启动程序,适用于 64 位系统。可根据自己的实际情况选择合适的启动器。 很重要的一点是,这些备用启动器在使用时需要将其从 misc 目录复制到 DocFetcher 安装目录下,复制完成后,双击该启动器即可启动对应内存大小的 DocFetcher。其他平台的增加内存方法请参照 DocFetcher-设置-说明。 #### 2.检索关键字格式 检索中文,因为 DocFetcher 中文分词器的原因,如果想搜索整个词语请务必使用英文双引号括住,否则将导致 DocFetcher 将词语分词后使用 OR 运算进行检索,最终使检索结果出乎意料。 #### 3.搜寻范围越界的问题 使用 DocFetcher 检索时,可能只是勾选了一个搜寻目录,但搜索结果可能包含了未勾选的目录的内文件,这可能是 DocFetcher 的一个 BUG,目前暂不清楚原因。解决方法是尝试勾选其他目录,再取消勾选,再点击搜索。 作者:wangzhijun97 链接:https://ld246.com/article/1568960776746 来源:链滴 协议:CC BY-SA 4.0 https://creativecommons.org/licenses/by-sa/4.0/ Last modification:March 19, 2022 © Allow specification reprint Like 如果觉得我的文章对你有用,请随意赞赏