Recoll – программа для полнотекстового поиска на Linux

Если коротко оценить ситуацию с полнотекстовым поиском, то это прозвучит так: «всё очень плохо». Действительно, и на Linux и на Windows приходится по полторы программы, которые более или менее сносно выполняли свои функции. Прочитав статьи 5-7 летней давности с обзорами поисковых программ, начинает казаться, что в то время с локальным полнотекстовым поиском дела обстояли лучше. Одна только Google Desktop Search чего стоила! Кроссплатформенная, с полноценным поиском на национальных языках с пониманием морфем и очень быстрым и сбалансированным механизмом фонового сканирования. Почему Google Desktop прекратила своё существование загадка для меня похлеще улыбки Джоконды.

Поисковые программы я отбирал по следующим критериям:

  • присутствует полнотекстовый поиск;
  • есть фоновое сканирование.

Согласитесь, на такие уж большие требования. Хотелось бы ещё поиска с учётом национальных морфем, но это, в конце концов, не так уж важно.

Я перелопатил почти с десяток поисковых систем на Linux, среди которых были в том числе Tracker, Recoll, Strigi¸ Deskbar, Peagle, Yabi¸ Catfish. Почти все они оказались заброшенными, неподдерживаемые больше разработчиками, некоторые просто не захотели работать или оказались с примитивной функциональностью. Скажу честно, был момент, когда я отчаялся, что уже не найду ничего стоящего. К счастью, это оказалось не так. Ситуацию спасла программа Recoll. Официальный сайт.

Пользователи Ubuntu (Mint) могут установить эту программу из репозитория.

Но версия там 1.16 и в ней нет фонового сканирования! Но на официальном сайте доступна версия 1.17.3, в которой с фоновым сканированием всё в порядке! Чтобы установить именно последнюю версию, добавьте в источники приложений (для Ubuntu 12.04, Mint 13):

deb http://ppa.launchpad.net/recoll-backports/recoll-1.15-on/ubuntu/ precise main

deb-src http://ppa.launchpad.net/recoll-backports/recoll-1.15-on/ubuntu/ precise main

Для других версий Ubuntu и Mint источники приложений можно найти здесь.

Особенности установки на другие версии Linux описан здесь.

Итак, запускаем наш Recoll.

blank

Первым делом, настроим параметры индексирования. Программа поддерживает русский язык, поэтому вряд ли будут затруднения. Самое главное, нам нужно выбрать каталоги для поиска. Все остальные настройки можно оставить без изменений или вернуться к ним позже.

blank

Теперь нам нужно запустить индексацию. Это можно сделать через меню «Файл» -> «Обновить индекс»

blank

А начиная с версии 1.17 ещё и через расписание индексирования. Можно выбрать запуск индексирования в определённое время (например, по ночам, когда компьютер простаивает), а можно задать фоновое индексирование. Всё очень удобно и просто – в самом меню предостаточно информации на русском языке, трудно не разобраться.

blank

Индексирование происходит достаточно быстро. Если в качестве каталогов для индексирования вы выбрали сменные носители, то это не проблема – программа работает с ними как с обычными директориями.

Давайте попробуем что-нибудь найти:

blank

Программа просто великолепно справилась!

Но это ещё не всё! В программе присутствует возможность сложного поиска. А здесь ещё больше интересного, в том числе:

  • поиск по фразам, с возможностью указывать допустимый размер интервала между словами;
  • по полям (автор и пр.);
  • с исключением определённых слов;
  • фильтровать по дате, по размеру, по типу файлов;
  • искать только в определённом каталоге (или во всех каталогах, кроме одного).

blank

blank

blank

И ещё один черпак мёда в нашу бочку мёда – программа понимает русские словоформы.

Итак, программа из разряда «Маст Хэв». Потрясающий гибкий поиск и отлаженный механизм сканирования. Программа полностью оправдала и превзошла ожидания, предъявляемые к продуктам подобного рода. Я не ставлю оценки программам, но этой бы поставил 6 баллов из 5 (ну или 5+).

Оставить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *