Re: lug-bg: PDF Bookmarks Extract
- Subject: Re: lug-bg: PDF Bookmarks Extract
- From: "Qsin" <qsin@xxxxxxxxxxxx>
- Date: Mon, 1 Mar 2004 11:26:15 +0200
----- Original Message -----
From: "Alexander Shopov" <>
To: <lug-bg@xxxxxxxxxxxxxxxxxx>
Sent: Monday, March 01, 2004 11:13 AM
Subject: Re: lug-bg: PDF Bookmarks Extract
> Здравей,
> Първо - пробвай да видиш дали това приложение не може да ти свърши
> работа по генерирането на pdf.
> http://web2.altmuehlnet.de/fschmid/about.html
>
> А сега специално за букмарките:
> Отворих един pdf файл, който има отметки в себе си.
> Забелязах в началото на файла особен тип конструкции от вида:
> 166 0 obj
> <<
> /A <<
> /S /URI
> /URI (http://www.w3.org/XML/xml-V10-2e-errata)
> >>
> /Type /Annot
> /Subtype /Link
> /Rect [70 613 541 625]
> /Border [0 0 1]
> >>
> endobj
>
> Ако преподложим, че това представляват отметките, то може да ги извадиш
> със следния скрипт:
>
> --------------------------------
> #!/usr/bin/sed -n
>
> /^\/URI/{
> s/^\/URI (//
> s/)$//
> p
> }
>
> ---------------------------------
>
> Това го правиш на файлче - примерно bm.sed, chmod +x и го изпълняваш
> върху файла:
> ./bm.sed определен.pdf
>
> Ако не тръгне така (сори, тествам го върху cygwin)
> го изпълняваш така:
>
> sed -n -f bm.sed определен.pdf
>
>
> Кажи дали ти върши работа. Освен това - мисля, че той ще отркие само
> външните урл-та, но не и вътрешните. За тях ли ти трябва решение?
>
> ал_шопов
Здрасти,
не, не ме интересуват URL-та, а това което притежават някои (не всички)
PDF-и. Нещо подобно на съдържание на документа.
Благодаря все пак за решението, което си показал по-горе. И то може да
свърши работа някой друг път и по друг повод.
Явор Атанасов
============================================================================
A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers).
http://www.linux-bulgaria.org - Hosted by Internet Group Ltd. - Stara Zagora
To unsubscribe: http://www.linux-bulgaria.org/public/mail_list.html
============================================================================
|