Аттачи: вытянуть информацию

Тема в разделе "Lotus + Java + LS2J", создана пользователем wowa, 20 апр 2010.

  1. wowa

    wowa Well-Known Member

    Регистрация:
    1 фев 2007
    Сообщения:
    842
    Симпатии:
    0
    Добрый день.

    Мне нужно будет обработать с помощью LS значения из аттачментов письма.
    Я обрабатывал *.doc и *.xls файлы.
    Сейчас возможно ситуация обработки *.pdf и *.ppt
    Что-то я не нашел решений как можно обработать эти файлы.
    Подскажите кто что знает. И если это реализуемо, трудоемкое ли это дело?
     
  2. hosm

    hosm * so what *

    Регистрация:
    18 май 2009
    Сообщения:
    2.450
    Симпатии:
    7
  3. Xalet

    Xalet Well-Known Member

    Регистрация:
    8 авг 2008
    Сообщения:
    410
    Симпатии:
    0
    Что имеется ввиду под обработать? Из pdf ов текст/цифры вытянуть?
     
  4. wowa

    wowa Well-Known Member

    Регистрация:
    1 фев 2007
    Сообщения:
    842
    Симпатии:
    0
    xalet, да

    Очень не желательно
     
  5. hosm

    hosm * so what *

    Регистрация:
    18 май 2009
    Сообщения:
    2.450
    Симпатии:
    7
    соррь, я как-то вот сразу java варианты предложила
    http://dpastov.blogspot.com/2009/12/create...s-using-ls.html
    Погуглить в сторону реализаций на VB (и адаптируйте под скрипт) или JAVA?
    вот человек на пхп в презенташках копался, мне админ форумный давал ссылку - http://habrahabr.ru/blogs/php/76033/
    т.е. у людей что-то получается. Там есть ссылки на спецификации формата.
     
  6. wowa

    wowa Well-Known Member

    Регистрация:
    1 фев 2007
    Сообщения:
    842
    Симпатии:
    0
    сразу отпадает, сервера на Linux
     
  7. lmike

    lmike нет, пердело совершенство
    Команда форума Lotus team

    Регистрация:
    27 авг 2008
    Сообщения:
    6.073
    Симпатии:
    299
    давайте будем реалистами ;)
    и перестанем изобретать велики
    у ЛС есть три бриджа:
    -СиАПИ
    -джава
    -КОМа
    последний отпадает в случаях с "невиндой"
    первый сложен как в реализации (тщательная выверка и сопоставление АПИ ф-ций и параметров), так и в отладке
    т.о. остаётся 2-ой (или ничего)
    вру - есть вариант - юзать вызов внешних утилит :)
     
  8. lmike

    lmike нет, пердело совершенство
    Команда форума Lotus team

    Регистрация:
    27 авг 2008
    Сообщения:
    6.073
    Симпатии:
    299
  9. lmike

    lmike нет, пердело совершенство
    Команда форума Lotus team

    Регистрация:
    27 авг 2008
    Сообщения:
    6.073
    Симпатии:
    299
  10. lmike

    lmike нет, пердело совершенство
    Команда форума Lotus team

    Регистрация:
    27 авг 2008
    Сообщения:
    6.073
    Симпатии:
    299
    стоит присмотреться (из списка OKEN )
    http://pdfbox.apache.org/commandlineutilit...xtractText.html
    работает как с командной строки, так и имеет АПИ
    нужна жвм :)

    Добавлено: про PPT...
    под линухами есть пакет catdoc
    он содержит мсо-киллеры для doc и ppt
    соответ команды:
    -catppt (вызовет ppt2text)
    -catdoc
     
Загрузка...
Похожие Темы - Аттачи вытянуть информацию
  1. Kizarek86
    Ответов:
    17
    Просмотров:
    5.536
  2. Omh
    Ответов:
    32
    Просмотров:
    7.259
  3. deeeman
    Ответов:
    7
    Просмотров:
    3.382
  4. deeeman
    Ответов:
    9
    Просмотров:
    4.469
  5. deeeman
    Ответов:
    9
    Просмотров:
    3.433

Поделиться этой страницей