Вопрос Включить поиск в файле (PDF) с помощью трекера


Насколько я понимаю, поиск гномов и, возможно, поиск nautilus, управляются или, по крайней мере, расширены трекером. Я установил трекер в 18.04 для сбора функции поиска содержимого контента, которую я использовал в Ubuntu 17.10. Затем мне удалось добавить мои папки в настройки gnome, и они действительно проверяются. Но похоже, что они используют метаданные, такие как имя, а не содержимое файлов:

~> tracker daemon -w
Ressourcen-Aktualisierungen der Datenbank werden nun überwacht
Alle Eigenschafte »nie:plainTextContent« werden ausgelassen

Drücken Sie Strg+C zum Anhalten

Во второй строке указано, что свойства «nie: plainTextContent» пропускаются. Я думаю, что я хочу, чтобы это разрешить, не так ли? Я пытался найти способ, но я искал только устаревшую информацию при поиске в Интернете, и я не мог узнать, как включить это свойство.

Дело в том, что он просто пропускает nie: plainTextContent при индексировании. Ручное извлечение дает запрашиваемые свойства:

~> tracker extract ~/watched_folder/file.pdf 
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix nie: <http://www.semanticdesktop.org/ontologies/2007/01/19/nie#> .
@prefix nfo: <http://www.semanticdesktop.org/ontologies/2007/03/22/nfo#> .

<file:///home/user/watched_folder/file.pdf> nfo:pageCount 51 ;
  nie:title "Lecture_File" ;
  a nfo:PaginatedTextDocument ;
  nie:plainTextContent "long text from the pdf" # this is what I want to search in!

Вопрос

Вы знаете, как я могу включить поиск содержимого файла для поиска в Gnome и / или поиска nautilus? Является ли поиск nautilus и поиск оболочки gnome (вводя в меню «Activities»), управляемый трекером?


3
2017-07-15 18:58


происхождения


Я не уверен, что это решит вашу проблему или нет. Но в таких случаях я использую поиск Adobe Acrobat в функциях PDF-файлов (см. этот вопрос а также мой ответ на него). Это не требует индексации. - N0rbert
У меня очень плохой опыт работы с продуктами Adobe на Linux относительно стабильности и производительности, поэтому я бы хотел этого избежать. Тем более, что есть решение (трекер), которое я уже интегрировал в систему, которая имеет функциональность и отлично вписывается в мой рабочий процесс. Но спасибо за указание на эту альтернативу. - verpfeilt
В стороне, если вы часто просматриваете содержимое документов, могу ли я рекомендовать DocFetcher для этой цели? - S.R.


ответы:


Поиск Gnome Shell использует поиск nautilus для извлечения файлов. Без установленного трекера поиск ограничивается поиском имени файла. С установленным трекером можно найти содержимое файла.

В Ubuntu 17.10 и 18.04 Tracker не установлен. Поиск имени файла не будет извлекать файлы из подпапок в домашней папке в Ubuntu 17.10 и в раннем Ubuntu 18.04. В настоящее время это работает хорошо.

Я сомневаюсь, насколько хорошо будет работать поиск содержимого файла с установленным Tracker. В принципе, он должен хорошо работать. Я предлагаю вам просто попробовать, как хорошо это работает.


0
2017-07-18 16:38



Я считаю, что вы что-то не поняли: 17 октября я установил трекер, и он правильно просмотрел папки. Затем я использовал поиск nautilus или gnome (я не уверен, что оба работали) для поиска в файлах, и это сработало. Однако это не работает 18.04. Вы предлагаете попробовать трекер, но вот что я прошу: как? Это не работает, как я думал / испытал раньше. Я не могу понять, как я могу настроить его для хранения свойства nie: plainTextContent, которое, я думаю, является проблемой. - verpfeilt