DjVu
- графический формат, оптимизированный для
хранения отсканированных документов. В
частности он идеально подходит для создания
электронных книг. Существует два
традиционных способа хранения
отсканированной книги: для энтузиастов это
распознавание (OCR) с последующей
подготовкой полноценного текстового
электронного документа, менее терпеливые
люди выкладывают непосредственно "сканы" -
отсканированные картинки, часто собранные в
pdf документ.
В первом случае требуется чертова прорва
работы, во втором получаются файлы размером
в десятки и даже сотни мегабайт.
Отныне
существует компромиссный вариант - перевод
отсканированных картинок в формат DjVu (дежа-вю).
При этом текст и контрастные рисунки
сохраняются с разрешением 300dpi, все
остальное считается фоном и сохраняется с
пониженным разрешением. Это позволяет хорошо
сжать электронный документ без потери его
читаемости. В DjVu размер файла
отсканированной книги оказывается в пределах
нескольких мегабайт, что вполне приемлемо.
Особое
значение этот формат приобретает для
переноса в сеть математической и вообще
технической литературы, где обилие схем и
формул делает распознавание и перевод в
текстовый формат практически невыполнимым.
В настоящее время формат DjVu становится
фактическим стандартом для электронных
библиотек технической и научной литературы.
Файлы с расширением DjVu, я надеюсь, скоро
перестанут быть экзотикой на просторах сети.