Вопрос Как искать в PDF и других документах, кроме простого текста, желательно с помощью графического интерфейса?


Возможно ли это в принципе?

Мне кажется, что инструменты поиска, такие как gnome-search-tool, Catfish и Searchmonkey, могут выполнять поиск в текстовых файлах, но не в других более сложных документах, таких как pdf или с расширениями, обрабатываемыми LibreOffice. Я что-то упустил?

Существуют ли программы, которые могли бы достичь этого?


2
2017-08-02 04:01


происхождения


Этот ответ может помочь, askubuntu.com/questions/31869/... - Sabacon
Thnx - recoll очень сложный. Не могли бы вы создать простой ответ о том, как искать с помощью recoll для файла pdf или odf на основе слова внутри него, в том числе, как установить каталог поиска (если есть такая опция) и так далее. Я имею в виду описание такого рода ограниченного поиска, учитывая тот факт, что программа может делать гораздо больше - cipricus
Я бы сказал, что это, безусловно, возможно в принципе, потому что результаты поиска Google часто создают файлы PDF среди традиционных HTML-страниц. Они явно ищут и индексируют PDF-файлы. Будет ли загрузка ваших файлов PDF (и других документов типа файла) в Google Docs для поиска вариантом? Это не изящно, но вы можете сделать это и начать использовать его прямо сейчас. - Tom Brossman
то, что я имел в виду, искал в десятках и сотнях документов для определенного названия, создавая библиографию. - cipricus


ответы:


Recoll это ответ - предложение из комментария: Вот


3
2017-08-25 21:18





Извините за задержку с ответом!

Начиная с Searchmonkey 0.8.3, мы теперь поддерживаем сложные текстовые файлы, такие как PDF, DOCX и DOC.

Последний код можно найти на Sourceforge: -

https://sourceforge.net/projects/searchmonkey/files/gSearchmonkey%20GTK%20%28Gnome%29/

С уважением, Адам - ​​основатель Searchmonkey


2
2018-02-14 11:43



Я не могу установить 0.8.3 в системе на базе 16.04: Dependency not satisfiable: libzip2 (>=0.10), в то время как у меня есть libzip4 установленный в моей системе. Что мне делать? - cipricus
Существуют три версии Searchmonkey. Версия JAVA не имеет зависимости от LibZip2 и легко работает в Linux. Я рассмотрю вопрос libzip4 и вернусь к вам. Вы также можете связаться со мной в Twitter @JSearchmonkey для дальнейшего обсуждения. - Adam


У меня нет предложения для графического интерфейса, но да, возможно. Инструмент командной строки для этого pdfgrep,


0
2017-08-02 06:50



не могли бы вы добавить подробности? - cipricus