• Курсы Академии Кодебай, стартующие в мае - июне, от команды The Codeby

    1. Цифровая криминалистика и реагирование на инциденты
    2. ОС Linux (DFIR) Старт: 16 мая
    3. Анализ фишинговых атак Старт: 16 мая Устройства для тестирования на проникновение Старт: 16 мая

    Скидки до 10%

    Полный список ближайших курсов ...

Аттачи: вытянуть информацию

  • Автор темы wowa
  • Дата начала
W

wowa

Добрый день.

Мне нужно будет обработать с помощью LS значения из аттачментов письма.
Я обрабатывал *.doc и *.xls файлы.
Сейчас возможно ситуация обработки *.pdf и *.ppt
Что-то я не нашел решений как можно обработать эти файлы.
Подскажите кто что знает. И если это реализуемо, трудоемкое ли это дело?
 
H

hosm

соррь, я как-то вот сразу java варианты предложила

Погуглить в сторону реализаций на VB (и адаптируйте под скрипт) или JAVA?
вот человек на пхп в презенташках копался, мне админ форумный давал ссылку -
т.е. у людей что-то получается. Там есть ссылки на спецификации формата.
 

lmike

нет, пердело совершенство
Lotus Team
27.08.2008
7 941
609
BIT
217
Цитата:

(OKEN @ 20:04:2010 - 16:22) *



это java. некошерно?)



Очень не желательно
давайте будем реалистами ;)
и перестанем изобретать велики
у ЛС есть три бриджа:
-СиАПИ
-джава
-КОМа
последний отпадает в случаях с "невиндой"
первый сложен как в реализации (тщательная выверка и сопоставление АПИ ф-ций и параметров), так и в отладке
т.о. остаётся 2-ой (или ничего)
вру - есть вариант - юзать вызов внешних утилит :)
 

lmike

нет, пердело совершенство
Lotus Team
27.08.2008
7 941
609
BIT
217
вспомнил :)
в линухах есть pdf2ps и ps2ascii
это из gs
и вот инфа
а вот с национальными языками будет опа
вот - "рыдайте" -
ну вот так полегча буит
 

lmike

нет, пердело совершенство
Lotus Team
27.08.2008
7 941
609
BIT
217
во...
штука юзает iText (ту джава, кот. "нежелательна" :) )
 

lmike

нет, пердело совершенство
Lotus Team
27.08.2008
7 941
609
BIT
217
стоит присмотреться (из списка OKEN )

работает как с командной строки, так и имеет АПИ
нужна жвм :)

Добавлено: про PPT...
под линухами есть пакет catdoc
он содержит мсо-киллеры для doc и ppt
соответ команды:
-catppt (вызовет ppt2text)
-catdoc
 
Мы в соцсетях:

Обучение наступательной кибербезопасности в игровой форме. Начать игру!