Пути конвертации RTF -> PDF для Лотуса

Gandliar

Lotus team
16.02.2004
341
8
#1
Собственно по теме.

Надо под аикс в итоге.

Заранее благодарю.
 

lmike

нет, пердело совершенство
Премиум
27.08.2008
6 567
263
#3
RTF нотусёвый? - тогда DXL->XSLT->FOP->PDF
XSLT - была ссылка на наш с NetWood проект
там не было форматирования текста (просто руки у меня "не дошли") - нужно дописать рекурсивные ф-ции:
-с учетом разрыва тегов (если форматирование меняется в одном слове)
-булеты
-таблицы
еще http://stackoverflow.com/questions/586411/...vert-rtf-to-pdf

Добавлено: ну и ваш любимый iText http://blog.rubypdf.com/2009/11/24/convert...-library-itext/
 

Gandliar

Lotus team
16.02.2004
341
8
#4
RTF нотусёвый? - тогда DXL->XSLT->FOP->PDF
XSLT - была ссылка на наш с NetWood проект
там не было форматирования текста (просто руки у меня "не дошли") - нужно дописать рекурсивные ф-ции:
-с учетом разрыва тегов (если форматирование меняется в одном слове)
-булеты
-таблицы
еще http://stackoverflow.com/questions/586411/...vert-rtf-to-pdf

Добавлено: ну и ваш любимый iText http://blog.rubypdf.com/2009/11/24/convert...-library-itext/
rtf не лотусовый

новый itext не поддерживает rtf parser
а старый конвертит крайне криво и не поддерживает русский текст
 

lmike

нет, пердело совершенство
Премиум
27.08.2008
6 567
263
#5

lmike

нет, пердело совершенство
Премиум
27.08.2008
6 567
263
#6
работа с русским языком http://linux-easy.ru/blog/nastrojka/put-ot...rtf-fajlax.html
опять же - для AIX может не собраться

Добавлено: ну и если совсем никак :) - берем спецификаии по РТФ и пишем парсер

есть jFO, Aspose... - это за деньги
 

lmike

нет, пердело совершенство
Премиум
27.08.2008
6 567
263
#9
нет, увы http://apache-poi.1045710.n5.nabble.com/Re...90p2282395.html
он не для этого замышлялся
и полагаю, что создать парсер - наиболее простой путь

Добавлено: т.е. берем описание РТФ создаём парсер в FO , далее - fop
 

lmike

нет, пердело совершенство
Премиум
27.08.2008
6 567
263
#10
есть такая , платная, утиль http://rtf2fo.com/purchasing.html
её труибу позволяет получить FO, но с ограничениями:
Evaluation version limitations
Text content is stained with characters occasionally replaced with punctuation marks;
Not all text data entries are moved to XML data file in prepare-template mode;
The given limitations are applied when the trial time period is expired.
текст заменяется, в произвольных местах пунктуацией и не весь текст преобразует
можно попробовать, цена доступная (750-1500грина)
 

lmike

нет, пердело совершенство
Премиум
27.08.2008
6 567
263
#13
еще есть http://www-106.ibm.com/developerworks/xml/library/x-tiprtf/
но я это ресурс найти не могу

Добавлено: вот ещё штучку нашёл http://sourceforge.net/projects/majix/
но оно тока хмл даёт
не подойдет - там COM бридж (виндовз онли, разумеется ;) )
сам себе отвечу :huh: - делает хмл из ртф, КОМ тока для .doc нужен
вощем годно, единственный "затык" будет - цифры в букивки переводить ;) (ведь кодировка ИСО-....-1) как и полагается - 7бит
 

lmike

нет, пердело совершенство
Премиум
27.08.2008
6 567
263
#14
дополню... xml получается в urldecoded виде
вспомогательные ссылки:
http://social.msdn.microsoft.com/Forums/ru...3-b251643256cc/ здесь собсно это и оговаривается
http://www.unicode.org/Public/MAPPINGS/VEN...NDOWS/CP932.TXT - соответствие символов (урлдекодед там нет :huh: )
ну и кодер/декодер онлайн http://meyerweb.com/eric/tools/dencoder/
разумеется &#x надо поменять на % и ; на пусто

<div class="sp-wrap"><div class="sp-head-wrap"><div class="sp-head folded clickable">"как пример"</div></div><div class="sp-body"><div class="sp-content">-в хмл
Запрещается допускать превышение нагрузки на
-енкодед
%d0%97%d0%b0%d0%bf%d1%80%d0%b5%d1%89%d0%b0%d0%b5%d1%82%d1%81%d1%8f %d0%b4%d0%be%d0%bf%d1%83%d1%81%d0%ba%d0%b0%d1%82%d1%8c %d0%bf%d1%80%d0%b5%d0%b2%d1%8b%d1%88%d0%b5%d0%bd%d0%b8%d0%b5 %d0%bd%d0%b0%d0%b3%d1%80%d1%83%d0%b7%d0%ba%d0%b8 %d0%bd%d0%b0
-результат после сервиса
Запрещается допускать превышение нагрузки на
у либы есть пакетный режим
java -cp lib/majix.jar com.tetrasix.majix.MajixBatch -xp foo.rtf foo.xml
умолчально оно юзает mydoc шаблон, но есть другие, смореть можно при запуске в интерактиве
java -cp ../classes:../lib/xt.jar:../lib/sax.jar:../lib/saxon.jar:../lib/xalan.jar:../lib/xerces.jar:../lib/xp.jar сom.tetrasix.majix.MajixStandard
 

lmike

нет, пердело совершенство
Премиум
27.08.2008
6 567
263
#15
забыл еще одно замечание...
проект писали под виндой (судя по косвенным признакам) отсюда хронические болезни:
-кодировка в файла изжоповская (для франзузкого) - проще переименовать файла (типа в *.org)
find ./ -iname "*_fr.java" -exec mv \{\} \{\}.org \;
французкий интерфейс ведь не нужен ;)
-переводы кареток <CR><LF> (это надо учитывать если пользоваться командами в bash - пересохранить правильно)

ну и в довесок - проект совметим с jvm 1.3 и автор использовал слово enum, кот. для 1.5 зарезервировано
я переименовал в enum_ для корректной сборки
я сборку делал с пом. ant (собсно она и предполагается)