Re: lug-bg: PDF Bookmarks Extract
- Subject: Re: lug-bg: PDF Bookmarks Extract
- From: Alexander Shopov <ash@xxxxxxxxxx>
- Date: Mon, 01 Mar 2004 11:13:34 +0200
Здравей,
Първо - пробвай да видиш дали това приложение не може да ти свърши
работа по генерирането на pdf.
http://web2.altmuehlnet.de/fschmid/about.html
А сега специално за букмарките:
Отворих един pdf файл, който има отметки в себе си.
Забелязах в началото на файла особен тип конструкции от вида:
166 0 obj
<<
/A <<
/S /URI
/URI (http://www.w3.org/XML/xml-V10-2e-errata)
>>
/Type /Annot
/Subtype /Link
/Rect [70 613 541 625]
/Border [0 0 1]
>>
endobj
Ако преподложим, че това представляват отметките, то може да ги извадиш
със следния скрипт:
--------------------------------
#!/usr/bin/sed -n
/^\/URI/{
s/^\/URI (//
s/)$//
p
}
---------------------------------
Това го правиш на файлче - примерно bm.sed, chmod +x и го изпълняваш
върху файла:
./bm.sed определен.pdf
Ако не тръгне така (сори, тествам го върху cygwin)
го изпълняваш така:
sed -n -f bm.sed определен.pdf
Кажи дали ти върши работа. Освен това - мисля, че той ще отркие само
външните урл-та, но не и вътрешните. За тях ли ти трябва решение?
ал_шопов
============================================================================
A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers).
http://www.linux-bulgaria.org - Hosted by Internet Group Ltd. - Stara Zagora
To unsubscribe: http://www.linux-bulgaria.org/public/mail_list.html
============================================================================
|