Главная » Статьи » Дамир Шамарданов » Искусство жить красиво

Уважаемый посетитель! Этот замечательный портал существует на скромные пожертвования.
Пожалуйста, окажите сайту посильную помощь. Хотя бы символическую!
Я, Дамир Шамарданов, благодарю за вклад, который Вы сделаете.

Или можете напрямую пополнить карту 2204 1201 0698 2552
Или через QIWI-кошелёк https://qiwi.com/n/POMOGUPORTALU
Благодарю за вклад!
Искусство жить красиво. Глава 5. Приручение PDF
Надо отметить, что эта глава представлена в третьей редакции. Видимо настолько сложен оказался сам формат для освоения (у меня, по крайней мере). Конечно, для большинства пользователей хватает простого чтения pdf-файлов через родной вьювер Adobe Acrobat Reader. Я же этот формат возненавидел с момента нашего знакомства (как только у меня появились pdf-файлы в компьютере). Дело в том, что мне крайне было необходимо вытащить текст из этих файлов. Где-то это удавалось, но удача себя не оправдывала, поскольку строчки из абзацев, скопированные в буфер обмена, при вставке в Word представляли собой самостоятельные абзацы, то есть если слово переносилось на другую строчку, то перенесенное становилось самостоятельным словом, начинающим новый абзац. Word в таком случае зеленел от злости и краснел от бессилья, а вдобавок мог запросто вывалиться (есть у него такая особенность), хорошо, что в версиях, начиная с XP он мог перезапуститься с восстановлением. Это я описал случаи, когда было возможно извлечь текст из pdf-файла. Но были и такие, когда Acrobat сурово предупреждал - файл запоролен, копирование запрещено. В общем, полный абзац котёнку не будет больше испражняться. Нужен был хороший конвертер. Но прежде чем перейти к конвертации из pdf- файлов в другой формат я должен рассказать о том, как создавать pdf-файлы. Это будет логически закономерно.
На всем рынке pdf-собираемых программ мне приглянулась абсолютно бесплатная прога CutePDF Printer. Право, на знаю, бесплатна ли она сейчас, но в 2003 году, по крайней мере, была таковой. Я ее нашел в одном из выпусков журнала "Мир ПК".
Собственного интерфейса у проги нет и представлена она как модель виртуального принтера. То есть, если вы создать pdf-файл в том приложении, которое имеет возможность вывода на печать, то достаточно из списка принтеров выбрать CutePDF Printer, после чего вылезет окно, предлагающее сохранить pdf-файл. Озаглавливаете файл и жмете "Сохранить" Запускается процесс виртуальной печати и pdf-файл будет создан. Единственный недостаток проги заключается в том, что с ее помощью нельзя установить пароль на файл. Впрочем, я это не отношу ни к достоинствам, ни к недостаткам, поскольку запороленный файл можно взломать. Ниже будет описана процедура взлома..
Итак, о создании pdf-файлов поговорили, теперь разговор о конвертации оных в другие удобоваримые форматы.
Как я уже писал выше формат pdf оказался для меня очень сложным. Что только я не делал, что бы получить редактируемую информацию. Начинал же с того, что копировал содержимое экрана в буфер обмена (для этого на клаве есть ценная кнопочка "Print Screen") и вставлял содержимое в графический редактор "Paint", после чего обрезал элементы меню, попавшие в рисунок и сохранял полученное в формате tiff. Следующим шагом была оцифровка tiff-файла в "Fine Reader" и дальнейшее распознавание (так было в 4 и 5 версиях "Fine Reader"). После этого был процесс чистки полученного, иной раз плевался и предпочитал набрать текст, чем мучиться с распознанным: муторно и долго.
Потом, кажется в "Fine Reader 6.0" стало возможным отправлять pdf-файлы для распознавания прямо в саму прогу. Процесс убыстрился, да и качество стало на выходе получше. Наконец программисты из ABBYY (файнридеровцы, как я их прозвал) создали автономный от "Fine Reader" продукт ABBYY PDF Transforrmer 1.0, механизм которого был направлен на тщательную конвертацию pdf-файлов.
Прогу я скачал с сайта ABBYY и был немного раздосадован ее платностью. В триальной версии ее можно было запустить ограниченное количество раз и распознавалось за раз только три страницы (а у меня были тексты по 600 и более страниц). Я даже написал файнридеровцам письмо, что с обидой, что они не сделали продукт free для нищих россиян (хотя могли бы), в заключении я добавил, что обязательно найду кряк. Какая-то милая девушка из ABBYY мне написала ответ, что де за программные продукты надо платить, поскольку на этом строится деятельность фирмы, что пиратство (старая песня) не есть карашо, и что хакнутые проги ни есть карашо работать (еще одна старая песня). Дальше переписку с файнридеровцами я не продолжал, а отправился искать кряк, который быстро нашелся на пиратских порталах.
Взломав программу я насытился в той части, касающуюся незапороленных pdf-файлов. Обрабатывая запороленные pdf прога настоятельно велела вводить пароль, который я, естественно, не знал.
Пришлось знакомиться с рынком прог, снимающих защиту с файлов. Причем на каждый формат существует своя прога. Для pdf таковой оказалась "Advanced PDF Password Recovery". Скачав оную я опять был раздосадован триальнстью (полученный на выходе файл состоял из трех страниц, которые могли конвертироваться, а далее шли пустые листы, хорошо, что сам оригинал не пропадал, а сохранялся в виде bak-файла). Писать разработчикам я не стал, а отправился, правильно, к пиратам у которых и нашел вожделенную ломалку. История с пробитием бреши в защите pdf-файлов завершилась.
Оставалось только найти что-нибудь acrobat-о-подобное для чтения самих pdf-файлов. Adobe Acrobat Reader  от версии к версии стал расти как на дрожжах, пожирая при инсталляции до 70 мб дискового пространства. К этому прибавилась его медлительность при загрузке. В одном из бесконечных путешествий по Интернету  я наткнулся на маленькую программку "Foxit Reader" и очень обрадовался ее способности быстро загружать pdf-файл . Конечно, с гиперссылкам, расположенными на pdf-файлах прога не работала, но зачастую это и не нужно. А CD-диски от компьютерных журналов, на которых присутствуют pdf-файлы, связанные между собой гиперссылками я смотрю не через автозапуск, а через простой пункт "открыть". В общем-то там все понятно.

Примечание (2008 г.): сейчас с pdf стало проще работать. Отправляем файл в Fine Reader 9.0 и не паримся.
Категория: Искусство жить красиво | Добавил: shamardanov (28.09.2008)
Просмотров: 1697 | Рейтинг: 0.0/0
Всего комментариев: 0
avatar