www.cqham.ru

\главная\р.л. конструкции\схемы и мануалы\...

Что такое DJVU и как с ним бороться :-)? 

Третья редакция - май 2003 г.
Tempora mutantur et nos mutamur in illis
Времена меняются и мы меняемся вместе с ними.
А поскольку все течет, все меняется, то данная статья будет по возможности обновляться с учетом текущего момента.

Дежавю, применительно к компьютерам, представляет собой новый графический формат, весьма экономичный. Как и что в нем устроено, вы можете подробно ознакомиться в нескольких статьях, размещенных на странице Ликбез по DjVu. Там же можно понять, почему djvu активно используют на сайте СКР, в первую очередь из-за небольшого объема и хорошего качества файлов. В мою задачу не входит его реклама, а критика, желательно аргументированная и не переходящая на персоны, будет от вас самих, что уже было, но крайне редко, а в настоящее время уже не встречается.

Аргументом критиков служит приблизительно такое утверждение: "Мои знакомые попробовали и сказали что это SUXX, лучше бы вы пользовались более привычными форматами, вот ... это RULEZZ!". Особенно упирают на популярный jpg, в этом случае можно сказать только одно - авторы этих писем никогда не занимались созданием черно-белых графических файлов, куда девать "артефакты" после такой операции с jpg? Я мог бы привести таблицу размеров различных форматов файлов для одного и того же изображения, но в этом нет большой необходимости, жизнь уже взяла свое и djvu стал использоваться шире, чем несколько лет назад. Многие сайты, не имеющие отношения к радио и графике, начали публиковать статьи по djvu и выкладывать материалы в этом формате.
Если интересно, то наберите в Google или другом поисковике одно слово "djvu" и читайте только ссылки на русскоязычные ресурсы Интернета, станет ясным растущая популярность этого формата..

Никто никогда не утверждал, что djvu - это альтернатива всем существующим графическим форматам, отнюдь! Но в области создания и хранения черно-белой, полутоновой и отчасти цветной документации, пока ему нет равных. В первую очередь это касается отсканированных бумажных документов или как модно говорить, носителей. Системы OCR, то есть распознавания текста, конечно, замечательные вещи, но пока они еще не настолько интеллектуальны, чтобы суметь распознать много страниц без единой ошибки, различить, где рисунки, где текст, а где надписи на рисунках. Я сам достаточно много работаю с FineReader 6, как одной из самых лучших программ для этой цели и хорошо знаю его достоинства и недостатки. Поверьте мне - чем тратить уйму времени на правку распознанного текста, во многих случаях проще отсканировать эту же страницу с хорошим качеством, не ниже 300 dpi и сохранить ее как файл djvu. Результат будет один и тот же, если не иметь в виду редактирование текста и изображений, но затраты времени будут неизмеримо меньше, при сопоставимом объеме файлов. Под результатом имеется в виду получение информации о том, что напечатано на бумаге, ведь это главная цель при такой задаче. Если в сканируемом оригинале есть схемы, формулы и все такое прочее, то тут распознавание отдыхает, разумеется, были есть и будут энтузиасты, способные восстановить все, но затраты времени резко зашкаливают за разумный предел.

Давайте рассмотрим имеющиеся на сегодняшний день программы, при помощи которых можно смотреть, создавать и конвертировать файлы djvu.

Первые программы от творца этого формата, всемирно известной фирмы AT&T, были консольные, что отнюдь не вдохновляло, поскольку работать было попросту неудобно. Но это было несколько лет назад, с тех пор утекло много воды, а права на коммерческое использование djvu были проданы Lizard Tech. Нельзя сказать, чтобы после покупки Лизардом прав на djvu, появились небывало удобные и быстрые кодировщики и конвертеры, но по крайней мере, работа в этом направлении идет. Исчезновение бесплатного DjVu Solo 3.1 с сайта Лизарда тепрь уже понятно, взамен появилась программа Document Express Professional Edition, в ней три компонента - сам редактор, представляющий собой доработанное Соло, виртуальный принтер djvu и самое неприятное изобретение - так называемый Express Cartidge Manager, представляющий собой некий виртуальный картридж, позволяющий сконвертить только оплаченное количество файлов. Судя по всему, у нынешних владельцев не все в порядке с головой, раз они пошли по пути фирмы Feith, которая тоже пыталась применить ограничение количества файлов в зависимости от суммы, к примеру, их DjVuer PRO требует 8000 долларов за unlimited, что не может не вызвать вопросов опять таки по поводу их душевного здоровья. То, что за программы нужно платить деньги, не вызывает особых возражений, но ограничивать количество файлов - полный дебилизм, который может привести только к потере позиций на рынке, ведь ни один другой графический формат такого не требует. Во всяком случае я о таком не слышал, а музыка - это другое дело, хотя после введения отчислений за mp3, изобретатели формата ogg сразу начали радостно тереть руки - им светит недоступная ранее популярность, причем небезосновательно. В Document Express есть также возможность OCR, но вряд ли это такая уж выдающаяся фича, ибо ФайнРидер все равно справится лучше, а сконвертить djvu в tif или bmp проблем не представляет, хоть при помощи того же Fine Print. Отправьте файл djvu на печать в FP, щелкните на вкладке Jobs(Задания), нажмите Save(Сохранить), выберите необходимые параметры в открывшемся диалоге и сохраните файл в желаемом формате.

Чтобы не лишать народ бесплатного кодера djvu и для создания многостраничных файлов, мой знакомый программист быстренько слепил на скорую руку GUI для djvu кодера и для многостраничника, работать стало намного удобнее, качество файлов, несмотря на то, что исходная программа была написана несколько лет назад, весьма хорошее, нужно только правильно прописать параметры в командной строке интерфейса. Проблемы, связанные с истекшей лицензией устранены, за это большое спасибо никогда не отказывающему в помощи AmaTeuR-у. Вот только версия этого кодера несколько старше, чем у Соло 3.1, что приводит к меньшему сжатию на 3-5%.

В пользу популярности djvu можно привести пример известных вьюеров, типа ACDSee (3,4,5), XNView, IrfanView и других, к которым имеются djvu плагины. Для первых двух софтов они несколько кривоватые, имеется в виду, что изображение при просмотре выглядит как отсканированное с очень низким разрешением, хотя на самом деле это не так, djvu плагин к Ирфану был доработан и смотрится несравненно быстрее и приличнее. Мало того, в последней версии IrfanView 3.80 есть возможность смотреть многостраничные файлы djvu, правда, только первую страницу, но тоже прогресс. При переписке с автором, то есть, самим Ирфаном, я посетовал на отсутствие поддержки многостраничности и невозможности создавать файлы djvu, на что автор ответил, что подумает на эту тему.

Появился новый бесплатный вьюер SlowView (www.slowview.at), в котором есть плагин кодера и декодера djvu, но увы, многостраничные файлы он тоже не поддерживает, а кодер, скорее, способен дискредитировать саму идею, ибо файл получается больше оригинала, надо бы попробовать пообщаться с ним на эту тему. Русификация ко всем указанным выше вьюерам есть.

Основным инструментом для просмотра djvu можно считать плагин к Internet Explorer-у, лежащему на сайте самого Лизарда - www.lizardtech.com. Работает он прекрасно, поддерживает многостраничные файлы, чего никто из упомянутых выше софтов не может. Существенно то, что плагин может разделить многостраничный файл на составные части, это бывает нужно при конвертации в другие форматы, например для распознавания текста и его перевода на другой язык. После загрузки многостраничного файла нужно щелкнуть мышкой на "Save" и при сохранении выбрать "Indirect". Конвертировать djvu файлы можно только в bmp, но этого более, чем достаточно в большинстве случаев. Есть два варианта по установке плагина - скачать дистрибутив или установить плагин прямо в онлайне. Об этом я расскажу в самом конце статьи.

Имеются плагины к другим браузерам и под другие ОС, но поскольку я пользуюсь только Win98/IE6SR1, то ничего про них сказать не могу. Из программ, которые могут создавать и просматривать djvu, следует упомянуть DjVuer (несколько версий) от фирмы Feith - www.feith.com. Он работает лучше всех остальных, но имеющиеся версии не поддерживают многостраничные файлы, что не может не вызвать удивления, причем это же неумение сохранилось и по сей день!. Последняя, опробованная мной версия - DjVuer PRO 2.04, хотя на сайте указана 1.7. Второй недостаток этого софта - неумение работать с большими файлами, при размере в десятки мегабайт DjVuer долго шуршит винтом, а потом, не говоря худого слова, прекращает работу. Если же исходные файлы имеют умеренный размер, то проблем не возникает. В плюс можно поставить возможность групповой или пакетной (batch) конвертации, что позволяет обработать сразу много файлов, но бывают и вылеты при очень большом (несколько сотен) количестве файлов.

Разработка самой LizardTech под названием DjVu Solo 3.1 сменившая DjVu Shop, может создавать многостраничные файлы и делать гиперссылки, что безусловно удобно, учтите только, что добавлять страницы в пакет нужно с ПОСЛЕДНЕЙ, это уже ляп разработчиков, впрочем запомнить эту особенность нетрудно. Судя по консольному многостраничнику, для которого тоже есть GUI, ляп был заложен в незапамятные времена, поскольку эта особенность присутствует и в консоли, в остальном DjVu Solo работает неплохо, пока бесплатной альтернативы нет.

Поскольку преимущества djvu сказываются именно на графических файлах, созданных с большим разрешением, то есть 300-600 dpi, то проблемы при распознавании конвертированного файла не возникает, по крайней мере у меня все проходит гладко и ошибок из-за конвертации практически нет.

Для конвертации pdf в djvu подходит пакет GhostScript + GhostView - http://www.cs.wisc.edu/, который позволяет преобразовать pdf в самые различные форматы, например в bmp с разрешением 600 dpi. Файл djvu после такой операции получается прекрасного качества, но раз в пять меньше оригинала. Кстати, для работы с pdf упомянутый пакет очень удобен и полезен, поскольку другие софты сложны и объемны. Но последний Акробат 5(полный), несмотря на свою объемность, очень хорошо конвертит pdf в tif и работает лучше, чем предыдущая версия. Вторая возможность конвертации, а по занимаемому объему, скорее первая, и не только для pdf, а для любых файлов - это FinePrint (http://www.fineprint.com), об этом написано выше. Есть еще несколько виртуальных принтеров, ознакомиться с советами по сканированию и созданию графических файлов можно на сайте СКР.

Советы по подготовке материалов в электронном и бумажном виде.

Теперь об установке плагина для IE. У меня стоит Windows 98PE, оказалось, что после инсталляции плагина, которая проходит несколько странно - не выдается окно настройки, файлы djvu отказываются открываться, хотя в типах файлов все прописано верно, при Windows 98SE такого вроде не было. После некоторых мучений было принято решение установить плагин в онлайне, прямо с сайта Лизарда и тогда все пошло как по маслу. Разница оказалась в разных папках размещения плагина после инсталляции, с чем это связано, сказать трудно, может быть старая версия Виндов, может быть еще что то. При неверной инсталляции, папка плагина размещалась в папке самого IE, а при правильной - в отдельной папке LizardTech - DjVuControl. Позже выяснилось, что ни в Win98, ни в WinXP плагин поставить из файла не получается, искомая цель достигается только при онлайновой установке.

Итак, подведем некоторые итоги djvu-шного софта:

Просмотр любых файлов djvu:
- плагин к IE, DjVu Solo.

Просмотр одностраничных файлов:
- IrfanView, DjVuer(Feith) - хорошее качество;
- XN View, ACDSee - неважное качество;
- SlowView - свои огромные djvu медленно, остальные - плохо.

Распаковка многостраничных файлов;
- плагин к IE, DjVu Solo.

Создание одностраничных файлов djvu:
- DjVuer (Feith), DjVu Solo, кодер от AT&T;
- SlowView - пока пародия на создание, djvu файл больше исходника.

Создание многостраничных файлов:
- DjVu Solo с гиперссылками;
- многостраничник от AT&T , только конвертация, без гиперссылок;

Конвертация djvu в другие форматы:
- плагин к IE (только bmp);
- виртуальные принтеры FinePrint(рекомендуется), SuperPrint, ePrint, pdfFactory и другие.
- IrfanView;
- DjVuer от Feith (bmp, jpg, pnm);
- DjVu Solo (только bmp);

Восстановление текста для перевода после конвертации djvu в bmp, tif etc:
- FineReader - http://www.abbyy.ru/
- CuneiForm - http://www.cuneiform.ru/ и другие.

Распечатка в большом масштабе после конвертации djvu:
- Teulat, поддерживаются файлы ps, tif, jpg - http://www.femfum.com/
- плагин к Акробату 5 (полному) CrackerJack 4.1, поддерживается pdf - http://www.lantanarips.com/

Печать djvu - категорически и настоятельно рекомендую применять FinePrint - http://www.fineprint.com, особенно для многостраничных файлов, это поможет избежать многих ошибок при печати и сэкономит вам время и бумагу.

Если были найдены другие программы для работы с файлами djvu, сообщите, пожалуйста, об этом вебмастеру, мы будем признательны за информацию.
В настоящей статье не рассматривается применение DjVuJoin, поскольку надобности в нем пока не возникало. На сайтах, посвященных djvu есть упоминания о новых коммерческих программах, но увы, они не доступны для скачивания и тестирования.

В конце концов, если вам этот формат настолько не по сердцу и вас начинает бить нервная дрожь при одном только упоминании djvu - нет проблем! Я даже не буду советовать искать аналогичные не djvu-шные материалы на "более других" сайтах, а предложу компромиссное решение, сохраняющее овец при насыщении волков. Считайте djvu не графикой, а новым архивным форматом с возможностью предварительного просмотра. Никто вам не мешает после закачки файла djvu отконвертить его в услаждающий ваше сердце, родной с детства и радующий глаз bmp, jpg, tif, gif, pdf или другой, вам еще более милый, формат. Если исходный файл был с разрешением 300-600 dpi и был правильно отсканирован и сконверчен в djvu, то никаких неудобств вы не испытаете, чего нельзя сказать о черно-белых файлах, изувеченных jpg-ом или цветным gif-ом.

LizardTech Virtual Printer v3.6.1.20  3.2mb для NT/2000/XP

Загрузить DjVu плагин
 
Загрузить DjVu Plug-in

DJVU plug 4.5.0_537, онлайновый вариант плагина, но с возможностью установки в оффлайне. Проверялось на ХР, попробуйте на 98 и других ОС, по возможности сообщите работает ли, хотя не думаю, что будут трудности, реестры совпадают. Оффлайновый плагин у Лизарда сейчас 7 мегов, экономия существенная.

Программы для создания многостраничных файлов djvu:


DjVu Solo 3.1 (1.9mb)  Создание многостраничных файлов с гиперссылками

DjVu Editor 4.1 PRO Russian (2.4mb)

Некоторые рекомендации по работе с DjVu Solo 3.1, а также сканирование, обработка изображений и печать файлов djvu.

OCR в djvu файлах - новый подход к старым возможностям.

Немного о PDF софте.


DJVU_GUI 709kb

1. Скопировать файл DJVU.ini в папку WINDOWS
2. Создать папку C:/DJVU, скопировать в нее остальные файлы.
3. Запустить TASKER.exe и указать путь к файлу DjVuEncode.exe
4. Прописать в командной строке необходимые параметры, например: -b -d300 -1 -l -q100, можно сохранить их в файл xxx.par для дальнейшего использования при смене параметров конвертации файлов - черно-белые, полутона, цветные.
5. Указать расширение выходных файлов djvu
6. Нажать Start и выделить файлы для конвертирования, которые ДОЛЖНЫ быть в папке C:/DJVU, нажать Открыть. Видимость задачи можно не задействовать. В нижней строке таскера будет виден процесс конвертирования, когда Осталось будет равно 0, то процесс закончен. Если возникли проблемы, то скачайте новый файл   DjvuEncode.exe  и замените имеющийся.

Выяснилось, что ACDsee 4.0.2 создает какие то странные tif-ы, они не конвертируются в djvu, после открытия Ирфаном и сохранения в тот же формат повторная операция проходит без проблем.


BUNDLE_GUI 652kb

1. Создать папку C:/DJVU_BUN, скопировать в нее остальные файлы.
2. Запустить TASKER.exe и указать путь к файлу DjVuBundle.exe
3. Прописать в командной строке необходимые параметры, только если это нужно, обычно ничего не указывается.
4. Указать имя и расширение выходного файла, например 123.djvu
5. Нажать Start и выделить файлы для конвертирования, начиная с ПОСЛЕДНЕГО, тогда он будет ПЕРВЫМ в многостраничном файле. Файлы для конвертации ДОЛЖНЫ быть в папке C:/DJVU_BUN.
6. Нажать Открыть. Видимость задачи можно задействовать для индикации, когда окно закроется, то процесс закончен.

Дополнение - август 2004 г.

Предлагается дополнение с учетом текущего момента. Забавно, что мою писанину на djvu-шные темы начали тиражировать не только в Интернете, но и на пиратских дисках. Вот истинное признание для автора - раз воруют, значит было написано не так уж и плохо. Дивидендов, правда, не отчисляют, но я как-нибудь переживу эту утрату :-).

"Дежавю, применительно к компьютерам, представляет собой новый графический формат, весьма экономичный. Как и что в нем устроено, вы можете подробно ознакомиться в нескольких статьях, размещенных на странице Ликбез по DjVu. Там же можно понять, почему djvu активно используют на сайте СКР, в первую очередь из-за небольшого объема и хорошего качества файлов. В мою задачу не входит его реклама, а критика, желательно аргументированная и не переходящая на персоны, будет от вас самих, что уже было, но крайне редко, а в настоящее время уже не встречается."

Так было написано в далеком прошлом. Однако, судя по откликам от посетителей на этой вебстраничке, кое-кто до сих пор не может установить необходимые драйвера из разряда ruki.sys, печально, но факт! Продолжается песня на тему jpg с новыми вариациями, вдобавок появились новые графические форматы - jpm, lwf, ldf, jpg2000 и так далее. Успокойтесь, господа-граждане! Ни один из новых, а равно как и старых форматов, не превосходит djvu, ни по параметрам, ни по популярности, ни по доступности софта. Если вы сами не можете установить плагин или открыть файл в djvu вьюере или редакторе, то это не повод для критики формата, как такового. То и дело попадается вопль души очередного страдальца - "Скачал файл djvu, чем его открыть??? Где взять софт??? Почему у меня не открывается файл djvu???"
Что я могу сказать на эти вебкрики? Для начала поглядите на рисунок, может быть он натолкнет на некоторые размышления :-).

Перевод, не затрагивающий самолюбия читателей - "Сначала я буду использовать поисковик Google, а только потом задавать вопросы".

Софта вполне достаточно, на СКР лежат практически все необходимые инструменты, причем ужатые до минимального объема. Чтобы можно было поставить djvu плагин к IE не заходя на сайт Лизарда, есть его оффлайновая версия меньше мегабайта. Аналогичный вариант у Лизарда занимает 7 мегабайт. Про Win98 не скажу, но на WinХР все ставится и работает без проблем, неоднократно сам проделывал эту операцию. Один из посетителей доработал файлы реестра с учетом особенностей Win98, за что ему большое спасибо!

Есть сокращенная версия неисталлируемого DjVu редактора, откуда убран OCR, хелп и виртуальный принтер, объем сократился с 31 до 2 с хвостом мегов. Единственное замечание - не нажимайте F2 (слайдшоу), в оригинале программы есть глюк с этим режимом.

Появились новые версии популярного вьюера IrfanView, последняя - 3.92 позволяет конвертировать многостраничные файлы djvu в другие форматы буквально за два щелчка мышкой. По-прежнему доступен DjVu Solo 3.1, причем на многих сайтах в Интернете.

Дмитрий Гарькаев сделал бесплатный, неинсталлируемый DjVuReader, его можно взять на http://www.opendjvu.nm.ru, последняя версия 2.0.0.13 от 15 августа 2004. Автор этой программы появляется в форумах и постоянно дорабатывает свое детище. Глядишь, кодер туда введет, совсем хорошо будет.

Есть виртуальный принтер (пока только под XP, 2k и другие NT платформы), единственное средство для прямой конвертации pdf в очень качественные файлы djvu. Особенно хорошо получаются печатные платы, где количество цветов не превышает восьми. Для примера - одно из сервисных описаний в pdf при конвертации в djvu уменьшилось с 30 до 6 мегабайт. Дело даже не в уменьшении, резко увеличилась скорость просмотра при сильном увеличении, на том же самом файле pdf тормозят даже неслабые компы. По сравнению с pdf оригиналом заметно только небольшое размытие границ в djvu, совершенно не снижающее общего качества изображения.

За последнее время мне довелось прочитать много книг, взятых в Интернете после OCR. Ни одна из них не была свободна от многочисленных ошибок - следствие распознавания. Зачастую ошибки такого плана, что их заметить может только человек, ни один софтовый редактор не обладает настолько развитым электронным интеллектом, чтобы их заметить. С другой стороны, те же книги в djvu не содержат ни единой ошибки, поскольку являются точной копией оригинала.

Благодаря болгарскому программисту Генчо, появилась возможность встроенного OCR для файлов djvu с русским и другими кириллическими языками. Тем самым, формат djvu приобрел новые возможности, поскольку в таких файлах возможен поиск и копирование текста в буфер.

Так что умерьте свое возмущение по поводу djvu, как говорится в народе - "Нравится, не нравится, терпи, моя красавица." Тонкий намек, что назад ходу нет, никто не собирается в угоду немногочисленным критикам отказываться от djvu, пока не изобретут нечто, превосходящее его по всем статьям. Пока таких тенденций не замечалось, что будет потом, поживем - увидим. IrfanView 3.92 позволяет вам не держать ненавистные djvu на компе. Щелкнули мышкой, подождали немного и получили свой любимый jpg или другой формат. На этом
дебаты по поводу сравнения djvu с jpg закончены, в виду их полной бесперспективности.

Напоследок кое-какие советы по поводу установок виртуального принтера djvu.

Сначала выдержка из хелпа на виртуальный принтер, смысл актуален и для всех других кодеров.

---------------------------------------------------------------
Типы слоев - Layer types.

Когда вы кодируете файл в djvu, Virtual Printer(VP) размещает объекты в двух слоях - фон и маска.

Описание слоев - Layer Description

Фон - Background

Фон содержит цвет или полутона фотографий, картинок и другие однотонные изображения. Так как разборчивость и контрастность меньше предыскажаются, эти компоненты обычно кодируются на трети разрешения, приблизительно 100 dpi.

Маска - Foreground

Маска содержит текст и линии, которые имеют резкие границы и один цвет, поэтому они кодируются на максимальном разрешении, приблизительно 300 dpi.

Bind Document to Printed Area

Эта опция уменьшает белый фон вокруг прямоугольных объектов, таких как текст и графика. У принтеров небольшое количество форматов бумаги, и если вы печатаете только на небольшом участке, например одна линия или строчка текста, то вокруг них останется очень много белого фона. Вы можете уменьшить файл, выбрав минимальный формат бумаги, на который полностью поместится выводимое на печать.
В окне расширенных установок выберите Bind Document to Printed Area.

Максимальное количество цветов - Maximum Number of Colors

Установка максимального количества цветов позволяет ограничить их количество при кодировании маски объектов. Вы можете выбрать от 1 до 4000 цветов. По умолчанию задается 256 цветов, этого достаточно для большинства цветных документов. Меньшее количество цветов уменьшает размер djvu файла.

Количество страниц в общем "словаре" файла - Assigning pages to shared dictionaries

Общий "словарь" файлов содержит информацию о формах, которые повторяются в масках многостраничного документа. Эти формы определяются для текста и объектов на каждой странице.

Во время кодирования VP сканирует все страницы для поиска повторяющихся форм и создает "словарь" повторений форм. Информация о повторяющихся формах на каждой странице используется для значительного уменьшения размера файла.
Число может лежать в диапазоне от 1 до 10000 страниц, по умолчанию оно равно 20.

Слишком маленькие значения при большом количестве страниц приведут к дополнительному времени при открытии файла, неоправданно большие значения увеличат размер файла. Оптимальное значение выбирается равным приблизительно одной пятой от количества страниц в документе и может быть подобрано экспериментально.

Субвыборка фона - Subsampling Factor

Она уменьшает количество пикселей в фоне, что уменьшает его размер, а поскольку фон кодируется с низким разрешением, то можно значительно ухудшить качество и уменьшить размер при его отображении. Величина этого параметра устанавливается от 1 до 10, если разрешение файла равно 300 dpi и установить значение 3, то фон будет с разрешением 100 (300dpi/100dpi = 3), это уменьшит размер файла, но при этом текст, находящийся в маске будет вполне читаемым. Значение зависит от разрешения файла. Установка величины субвыборки 1 или 2 должна применяться только в следующих случаях - когда фон не содержит различных цветов или разрешение документа ниже 100 dpi.

Качество фона - Background Quality

Оно определяет размытость фона в документе, более высокие значения уменьшают размытость, особенно на фотографиях, но увеличивают размер файла, меньшие - наоборот. Если документ нужен для архивной копии, то устанавливайте значение близкое к предельному, т.е. 95, это позволит получить кодирование практически без потерь. Для публикации на вебстраницах уменьшите это значение до 75. Еще меньшие значения должны использоваться только при низких требованиях к качеству или когда в фоне нет различных цветов.

Помещение объектов в фон - Send to Background Objects.

Маска может содержать до 4000 цветов, а поскольку объекты маски кодируются с высоким разрешением, то при этом растет объем файла. VP позволяет уменьшать размер файла путем помещения малоцветных объектов в фон, который кодируется с низким разрешением. Величина параметра определяет количество цветов объекта, помещаемого в маску. Если для объекта это количество превышается, то он автоматически помещается в фон. Можно выбрать величину от 1 до 4000, по умолчанию она равна 256, что подходит для большинства цветных документов.

Определение порога между маской и фоном - Separation Threshold.

VP разделяет цветное изображение путем помещения небольших однотипных объектов в маску, а больших и многоцветных в фон. Некоторые объекты не могут быть однозначно отнесены к тому или другому типу, поэтому VP должен использовать некий порог для объектов при таком разделении, анализируя форму, цвет и наложение на другие объекты.
Регулировка позволяет менять соотношение при помещении объектов в фон или маску. Величина порога равная нулю показывает, что все сомнительные объекты будут помещены в фон, а при пороге равном 100 все сомнительные объекты будут помещены в маску. По умолчанию порог равен 75, что подходит для большинства цветных документов. Обычно величина порога определятся экспериментально по наилучшему балансу размещения объектов между фоном и маской.
---------------------------------------------

После конвертации изображений в djvu, не сочтите за труд открыть файл djvu, щелкнуть на нем правой мышкой и открыть пункт "Page Information..." (применительно к IE djvu плагину).
Там вы найдете очень интересную и полезную информацию, особенно в тех случаях, когда у вас вылезают глаза на лоб от размера djvu файла - конвертили один килобайт, а получили один мегабайт :-). Не спешите обвинять всех и вся в глюках и багах, сначала нужно разобраться в установках. Для правильно выбранных параметров при конвертировании черно-белых файлов в информации о странице будет нечто вроде:

DJVU Image (1560x2140, 200 dpi) version 21:
0.0 Kb 'INFO' Page information.
0.0 Kb 'INCL' Indirection chunk (8610038_0001.djbz).
34.2 Kb 'Sjbz' JB2 foreground mask (1560x2140, 200 dpi).
Compression ratio: 285 (34.3 Kb)

или

DJVU Image (2480x3508, 300 dpi) version 23:
0.0 Kb 'INFO' Page information.
0.0 Kb 'INCL' Indirection chunk (dict0010.iff).
6.5 Kb 'Sjbz' JB2 foreground mask (2480x3508, 300 dpi).
0.0 Kb 'FGbz' JB2 foreground colors (1 colors, 1594 ccs).
0.1 Kb 'BG44' IW44 background (207x293, 25 dpi).
Compression ratio: 3807 (6.7 Kb)

Если в фоне (background) вообще или практически ничего нет (не считать же объемом 0.1 Kb!), а основная информация находится в маске (foreground) и количество цветов равно единице, то все было сделано правильно.

При следующей картине, даже если изображение внешне кажется черно-белым, есть повод задуматься о правильности установок кодера:

DJVU Image (2706x3508, 300 dpi) version 25:
0.0 Kb 'INFO' Page information.
0.0 Kb 'CIDa' Unrecognized chunk.
36.7 Kb 'Sjbz' JB2 foreground mask (2706x3508, 300 dpi).
0.8 Kb 'FG44' IW44 foreground colors (226x293, 25 dpi).
0.8 Kb 'BG44' IW44 background (902x1170, 100 dpi).
0.2 Kb 'BG44' IW44 background (part 2, 100 dpi).
0.0 Kb 'BG44' IW44 background (part 3, 100 dpi).
0.2 Kb 'BG44' IW44 background (part 4, 100 dpi).
Compression ratio: 718 (38.8 Kb)

Параметры явно были установлены с избытком по части цветов, отличие в размере будет уже существенным, для примера - одна и та же страница займет 40 и 35 килобайт, соответственно.
А если страниц сотни? Вот то-то и оно!

Сравните информацию о странице после правильных установок:

DJVU Image (2706x3508, 300 dpi) version 25:
0.0 Kb 'INFO' Page information.
0.0 Kb 'CIDa' Unrecognized chunk.
34.3 Kb 'Sjbz' JB2 foreground mask (2706x3508, 300 dpi).
Compression ratio: 808 (34.4 Kb)

Заметили как изменилась степень сжатия за счет удаления ненужного?

У виртуального принтера есть одна особенность, он всегда выбирает наивысшее качество, то есть, если кодировать сразу много страниц, где есть черно-белые, серые и цветные изображения, то принтер автоматически выберет установки для цветных изображений, применив их для черно-белых и серых страниц.

Лучше разделить страницы по типам и сначала конвертить только черно-белое, затем только серое и напоследок - цветное. Разумеется, что каждый раз нужно менять установки принтера. В финале просто объединить полученные djvu файлы в один, тогда результатом будет качественный файл минимально возможного размера.

Вот окно выбора параметров в виртуальном принтере:

Нас будут интересовать только первые семь установок, дефолные значения:

1. Send to background objects with... - 32
2. Separation threshold - 25
3. Maximum Number of colors - 256
4. Numbers of pages per shared... - 20
5. Foreground compression - Lossless
6. Subsampling factor - 3
7. Background quality - 75

Установки "Text Encoding" мы не рассматриваем, а параметр "Bind document to printed area" был описан выше. С ним будьте внимательны, без надобности его лучше не применять.
На что влияет та или иная установка, описано выше, в выдержке из хелпа.

Вот некоторые установки виртуального принтера, полученные экспериментальным путем, любые дополнения и изменения всячески приветствуются. Чтобы не повторять названия установок каждый раз, даю только их значения:

Черно-белое изображение:

32
0
1
20
Lossless
1
1

Было установлено, что для черно-белых изображений, значение Send to background... нужно выбирать не менее 16.


Серое изображение:

32
16
4
20
Lossless
1
1

При выборе цвета = 2, все изображение стало серым, следовательно минимальное значение = 4.


Ограниченное число цветов:

16
0
4, может выбираться до 8, в зависимости от исходного файла
20
Lossless
1
1


Вы можете сами попробовать изменять параметры, особенно на цветных изображениях, с тем, чтобы получить максимальное качество при минимальном объеме файла djvu. Не забудьте, что было сказано выше по поводу "Page Information...", это поможет определить, какие установки оптимальны в каждом конкретном случае.

Игорь (UN7GM)
(С) СКР 2004


Советы по подготовке материалов в электронном и бумажном виде.

 

Как распечатать большой графический файл. 

Про эту проблему знают все, а вот ее решение известно, увы, немногим. Сам много раз просил совета у разных людей, но ничего внятного и практически пригодного для работы не подсказали. Советы были такие - использовать Эксел. Сказано - сделано, действительно Эксел вроде может такую штуку, за дело взялся человек, очень прилично знающий эту программу. Файл был загружен в Эксел, поделен на листы и отправлен на печать. Эксел проделал все операции с радостой улыбкой идиота, постоянно кивая головой и... выдал только первый лист с изображением, остальные были пустые, как голова с похмелья. Все попытки уговорить его на этот подвиг в полном объеме успеха не имели, кому удалось - делитесь, это еще Христос велел :-), но при дележке распишите последовательность действий, чтобы понял даже не очень сведущий человек, уровень подготовки посетителей СКР самый разный.
Второй совет был уже покруче - использовать Короля дров, то бишь Corel Draw достаточно высокой версии. Оный софт был установлен (к счастью не не моей машине!), но его объем и сложность освоения совершенно ненужной мне для других целей программы, свели на нет все усилия, а искомый результат так и не был достигнут, может руки кривые, а может еще что...
Надеюсь, что предложение использовать для подобной цели разного рода грабилки экрана, может рассматриваться только как проявление юмора. Для маленькой схемы это еще туда-сюда, а для большой будет оцениваться только как разновидность мазохизма.
Но это все присказка, а сказка вот какая. Печатать увеличенное изображение в растре вряд ли целесообразно по понятным причинам, из векторных наибольшую популярность имеет pdf, он стал практически стандартом для разного рода документации, поэтому именно ему и было уделено внимание в первую очередь. Были просмотрены почти все возможные программы и плагины для Акробата, кстати, рекомендую переходить на 5-ю версию, она значительно лучше и возможностей больше, чем у предшественников.
Выбор остановился на двух софтах - плагин с забавным названием CrackerJack от Lantana -- http://www.lantanarips.com, для его работы нужен полный Акробат (не Ридер!), а при его установке не забудьте поставить Акробат Дистиллер из пакета полного Акробата, иначе ничего не получится. Для длительной и бесперебойной работы плагина нужно сами знаете что и сами знаете где :-), а кто не догадался где, обращайтесь мылом. Все достаточно просто - не забудьте только поставить крыжик на печать в файл в меню Target, иначе можете испортить кучу бумаги. Самое нужно находится в меню Media - выбрать формат А4(если только у вас не более навороченный принтер А3, не говоря о больших форматах, тогда зачем вам эта метода?), подобрать нужную ориентацию листа при печати для более удобного расположения изображения, поставить крыжик на Tile Output, это и есть то самое деление всего изображения на куски выбранного формата, ну и не забыть про Overlap, то есть запас на нахлест при склейке, 10мм обычно хватает за глаза. В меню Options выбирается масштаб, это уже по ситуации, а меню Marks позволяет напечатать ориентиры на каждом листе. В новой, 4-й версии есть неплохой предпросмотр файла, поэтому можно поиграть масштабом, чтобы на искомом количестве листов получилось максимально большое изображение. Смена дюймов на миллиметры сидит в Акробате - Edit - Preferences - CrackerJack 4.

Мой настоятельный совет - не торопиться, иначе будет изведено без толку масса бумаги, а на мою голову обрушатся проклятия за идиотские советы читателям. Поэтому после создания pdf файла нажмите Page Setup в Акробате и убедитесь, что выбрана нужная ориентация листа и его формат. Если была выбрана книжная ориентация листа в Теулате или CrackerJack-е, то и на печать отправляйте такую же, а при альбомной - альбомную, иначе сломаете голову при попытке состыковать лист с листом.

Не пожалейте времени, не отправляйте файл сразу на принтер, а сначала пропустите его через
FinePrint - http://www.fineprint.com/, это поможет избежать расхода бумаги, тонера и сэкономит ресурс принтера. И только после того, как убедитесь что все именно так как нужно, можно нажимать кнопку Print.

Вторая софтина, уже автономная, не плагин, но тоже нуждающаяся в Дистиллере, была найдена на сайте по pdf софтам от других производителей, называется она Tеулат и позволяет работать с файлами ps, jpg и tif, что довольно удобно. Триальная версия будет лепить лэйбаки "Демо" на каждом листе, но ограничений по времени использования не имеет. Лежит эта полезность на http://www.femfum.com/bin/iteulat.zip, недостатки - небольшая сырость в плане эргономики и полное отсутствие хелпа, хотя там есть некоторые неясные моменты, разберемся со временем и надеюсь, вашей помощью. После инсталла нужно прописать пути к Акробату и Дистиллеру в конфигурации, больше никаких проблем с установкой нет, если при запуске Теулата выскочит ошибка с текстом на непонятном языке, то не паникуйте, а перегрузите комп. Х2Y2 - это размеры самого файла, что такое X1Y1 и почему они бывают с минусом, я пока не понял, кто дойдет - поделитесь. Формат выходного файла выбирается Teulat, для чего нужен PPD, я тоже не знаю. Overlap - то же самое, что и описано выше, то есть запас на нахлест, после определения масштаба нужно нажать кнопку Calculate, после этого софт выдаст результат о необходимом количестве листов выбранного формата. Вот только не всегда выбирается их минимально необходимое количество, бывает, что целый ряд, а то и два, пустые, это легко исправляется в Акробате при просмотре перед печатью, просто удалите пустые листы. На каждом листе печается его ряд и колонка, чтобы легче ориентироваться при склейке большого количества листов, первый лист с общим видом раскладки печатать не стоит. Рекомендации по поводу применения ФайнПринта остаются в силе. Остальное особых комментариев не требует, софт достаточно простой и безальтернативный, разве что вы сами подскажете лучший вариант, ну а пока обойдемся и тем, что есть. "Лекарство" уже имеется, за что большущая благодарность AmaTeuR-у, если понадобится - пишите мылом.

Теперь самый больной вопрос - а что делать со столь любимыми мной файлами djvu? Ответ простой - теперь можно их печатать в любом масштабе при помощи Теулата после конвертации в tif или pdf через pdfFactory (www.fineprint.com) и CrackerJack, а также через другие виртуальные принтеры, eРrint (http://www.leadtools.com) имеет 140 выходных форматов!

P.S. Все вышеописанное было проверено мной лично и особых проблем не вызвало, за исключением непонятных файлов pdf, созданных в последнее время сынами Страны восходящего солнца, то есть японцами. Что они с ними делали - вопрос всех времен и народов, но эти файлы открываются только в Акробате, а GhostScript выдает ошибку, хотя на всех других pdf файлах работает как часы. То ли японских фонтов насовали, то ли еще что, но пришлось повозиться для достижения искомого результата, который тем не менее, был достигнут. Так что и это не есть проблема, было бы желание...

С уважением, Игорь (UN7GM). un7gm@qsl.net



Ошибка в передаваемых параметрах

Возврат