Поиск текста

Тема в разделе "Программное обеспечение", создана пользователем Avilum, 7 дек 2004.

Статус темы:
Закрыта.
  1. Avilum

    Avilum Гость

    Доброго жития всем.

    Нужна программа способная быстро находить нужный текст в большом количестве документов (более 40 000).

    Ищейка слишком долго индексирует файлы (около 8 суток) при этом занятие чем нибудь другим параллельно приводит к жутким тормозам системы и зависанию.
     
  2. Guest

    Guest Гость

    google desktop?
     
  3. Avilum

    Avilum Гость

    Под Windows XP SP2 не работает
     
  4. Avilum

    Avilum Гость

    Извиняюсь маленькая оплошность

    Под Windows XP SP2 не работает
     
  5. Guest

    Guest Гость

    1. Нафига было ставить эту хрень SP2?
    2. Жди релиза GDesktop.
     
  6. Barmutik

    Barmutik Гость

    Можеш попробовать Copernic Desktop Search

    А в документах какого типа надо искать?
     
  7. Avilum

    Avilum Гость

    *.doc; *.rtf; *.htm; *.html; *.lex; *.txt
     
  8. Avilum

    Avilum Гость

    Вкусы у всех разные.

    Кому хрень, а кому нет.
     
  9. Barmutik

    Barmutik Гость

    Есть разработка (серьёзная).. для полнотекстового поиска данных..

    Пока в работе .. в смысле в разработке .. на текущий момент пока не ищет в .doc и .rtf.. просто пока нет времени доделать модули для корректного вытягивания текста из этих форматов...

    Индексит ориентировачно со скоростью 2-3 гига в час..

    Скорость фразового поиска (есть возможность использования морфологии и синонимов)... практически на лету..

    Если есть сильная необходимость .. могу скинуть на пробу...
     
  10. ????

    ???? Гость

    Barmutik
    для нашего любимого русского? как делали? словарь или "как в лингво"?
     
  11. Dr.Gigabit

    Dr.Gigabit Гость

    Сорри за возможный оффтоп, больная тема:)

    А в лингво, что не словарь?
    Без словаря учитывать морфологию - нужно, имхо, далеко не самых худших лингвистов подключать
     
  12. Barmutik

    Barmutik Гость

    набирали морфологию просто .. был загнан словарь русского языка (около 150.000 слов) потом построен умный алгоритм разбора, который сгенерил в итоге около 1.500.000 морфологических форм... нет конечно 100% гарантии что всё правильно.. но ручной выборочный анализ пока ошибок не нашёл.

    Насчёт синонимов всё несколько хуже .. так как они затачиваюся под конкретную предметную область.. т.е под конкретный заказ-задачу.

    Просто полнотекстовый фразовый поиск это подзадача для решения основной задачи.. поиска похожих документов.
     
  13. Avilum

    Avilum Гость

    Скидывай. Буду рад попробовать.
     
  14. ????

    ???? Гость

    Dr.Gigabit
    словарь, да не простой (имхо)
    вот у Barmutik один большой словарь словоформ (может не полный, избыточный, ... но рабочий :rolleyes: - обычный подход где не требуется дикой производительности). Но существуют другие подходы:
    тынц тынц тынц
    тут всё "вперемешку" и м/б не всё по теме, но материал к размышлению есть.
     
  15. Barmutik

    Barmutik Гость

    Очень напрасно ...
    Производительность требуется и серьёзная.. организация внутренней структуры морфологии оптимизирована для очень быстрого поиска словоформ.

    Но за линки спасибо .. почитаю... всегда есть идеи которые могут перевернуть мир :rolleyes:
     
  16. Mr Sizam

    Mr Sizam Гость

    FAR manager :)
     
Загрузка...
Статус темы:
Закрыта.

Поделиться этой страницей