|
Igem
Стаж: 15 лет 2 месяца Сообщений: 235
|
Igem ·
05-Фев-10 14:34
(14 лет 11 месяцев назад, ред. 05-Фев-10 23:50)
Сканирую книги с помощью HP Scanjet G3010 и родного софта "от ХП" (Сканирование HP: 4.0 sct: 5041 bdt: 17175)
Формат вывода - "256 оттенков серого" ("черно белый, 1 бит" не выбираю, т.к. результат получается непередаваемо контрастный, много черных пятен).
Получаю сканы по качеству близкие к черно-белой фотографии. Читать можно: передаются все важные детали текста и даже графических рисунков. Но вот распечатывать, если кому-нибудь понадобится, думаю, - не очень: станица полна ненужных полутонов.
До сих пор для удаления теней пользовался Microsoft Office Picture Manager (у меня MS Offiice 2003 под Windows XP SP3), который позволяет "на глазок" изменить яркость и контрастность для большого числа файлов.
Но вот проблема: как бы я ни старался при сканировании пошире раскрыть переплет книги (иногда чуть ли не разламываю переплет - аж сердцу больно) или получше придавить книгу к стеклу сканера дополнительным грузом, часто в получаемом файле на линии раздела страниц образуется тень, которая наползает на текст. Особенно когда сканируешь старые книги с чуть потемневшей бумагой. Удалить после эту тень (меняя яркость, контрастность и яркость полутонов) тем более в пакетном режиме (для нескольких сканов сразу) не удается: или затемняется текст ближе к корешку книги, или блекнет весь текст страницы.
Примеры: скан и попытки убрать тень на стыке страниц
Photoshop не помогает: исправлять один за другим более сотни сканов, подбирая параметры яркости/контраста вручную - ни времени нет, ни однородности результатов не добиться.
При этом большинство выложенных здесь отсканированных книг выглядят вполне прилично и удобны как для чтения с экрана, так и для распечатки: тени на стыке страниц (у корешка книги) "не мозолят" глаз.
Друзья, подскажите, кто знает, как улучшить результат:
- есть ли лучшие программы для сканирования и для очистки сканов от излишних полутонов?
- если другие приемы, помогающие добиться лучшего качества сканирования переплетенных книг без "всрутия" переплета?
Или махнуть рукой и выкладывать книгу "как есть"? Не хочется сдаваться.
********
P.S. В разделе "Разное" нашел программу ScanKromsator 5,92 ( https://rutr.life/forum/viewtopic.php?t=2160930 )
но она почему-то не хочет работать, как описано в инструкции в теме...
|
|
groks
Стаж: 16 лет 9 месяцев Сообщений: 1534
|
groks ·
06-Фев-10 12:07
(спустя 21 час)
|
|
Igem
Стаж: 15 лет 2 месяца Сообщений: 235
|
Igem ·
06-Фев-10 12:52
(спустя 44 мин.)
В оформление книжного листа ФайнРидер вносит мелкие на первый взгляд, но существенные в конечном итоге правки. Хорошая книга - это визуально удивительно гармоничное (сбалансированное) произведение художника-оформителя, интуитивно построенное в соответствии с ее содержанием - текстом и иллюстрациями. Главное, что мне хотелось - это НЕ распознать текст и перевести книгу в символьный формат, а воспроизвести оформление страниц идентичное оригиналу, чтобы сохранить работу художника-оформителя книги: размеры и пропорции страниц, соответствующие им параметры шрифта (гарнитура, кегль), размеры, пропорции и яркость/контрастность иллюстраций. Книг сейчас много, но издатели часто экономят на работе художников-оформителей. Да и мастеров, как прежде, когда люди учились своему делу не один десяток лет, перенимая у старых специалистов и ремесло, и вкус, встретишь все реже и реже. Хотелось сохранить и ЭТУ работу.
|
|
Cucumis
Стаж: 17 лет 6 месяцев Сообщений: 12001
|
Cucumis ·
08-Фев-10 21:49
(спустя 2 дня 8 часов, ред. 08-Фев-10 21:49)
Порежьте развороты при помощи Scan Tailor ( руководство по Scan Tailor с офф. сайта), выберите полезную область прямо по краю текста (потом сможете добавить поля нужного размера); Scan Tailor умеет выравнивать освещение, так что в итоге можно получить вполне приемлемый результат.
З.ы. Я сканирую IrfanView в TIFF - получается лучше, чем с фирменным софтом от Сanon.
|
|
Igem
Стаж: 15 лет 2 месяца Сообщений: 235
|
Igem ·
09-Фев-10 14:19
(спустя 16 часов, ред. 09-Фев-10 14:19)
Уважаемый Cucumis,
спасибо за интересные подсказки!
Давно собирался потрогать IrfanView за рычажки и кнопочки, теперь будет повод!
Интересно, что на выходных я, побарахтавшись, тоже "притопал" к Scan Tailor'у. Пользоваться им - одно удовольствие, настолько удобно (просто и стройно) реализованы в ней имеющиеся функции. А как он, и в самом деле, выравнивает освещение - залюбуешься!
Примеры результатов обработки
И руководство составлено так, что читать одно удовольствие: идем от общего (концепции работы) к деталям (стадиям работы со всеми возможными хитростями).
Единственно, чего в нем для себя не нашел, так это инструментов:
- исправления кривизны строк
- задания абсолютного размера результирующих страниц (что существенно, если хочется сохранить макет (все размеры и пропорции страниц) книги.
ScanTailor рассчитывает размеры страниц на основе размера полезных областей и полей, заданных пользователем. Случается, иллюстрации, "вылезая" за края текста "раздувают" эти области. Приходится возиться, меняя "на глазок" поля на таких страницах, чтобы нащупать нужные габариты страниц, получающиеся на выходе, что не очень удобно.
Мне кажется, для получения точного макета электронной книги было бы удобнее, если бы алгоритм формирования страницы строился в обратном направлении: от заданных размеров страниц и полей к размещению в оставшемся пространстве изображений с возможностью у пользователя задавать исключения для отдельных страниц, чтобы позволять изображениям "залезать" на поля. Ну, это уже идея автору на будущее - может, пригодится!
Плюс, еще хорошо бы "соорудить" в программе функцию выделения четных и нечетных страниц. Мне приходилось делать это вручную, прокручивая бесконечную ленту предпросмотра, чтобы отдельно задать разные поля для страниц, расположенных слева и справа на книжном развороте.
В целом же, повторюсь, программа мне очень понравилась удобством интерфейса и отлаженностью (чистотой, "безглючностью") работы имеющихся инструментов. Автору большое человеческое спасибо и восхищение разработкой!
Для себя дополнительно нашел одного любопытиного котика в мешке - Book Restorer 4.2.1. Нутром чую, это нешуточное устройство. Но как ни стараюсь, пока мне никак не найти описания концпеции и стадий ее работы (кроме пары авторских статей по отдельным функциям на www.djvu-soft.narod.ru).
Был бы очень признателен, если бы кто-нибудь подсказал, где найти по Book Restorer v.4... документацию или что-то подобное, хотя бы английском языке.
Еще раз, спасибо за помощь!
P.S. Что же до ScanKromsator, многое в его работе стало более понятным, когда удалось найти Пособие по версии 5.6 ( http://www.djvu-soft.narod.ru/kromsator/ ), в котором очень подробно описываются интерфейс и настройки программы.
|
|
petoleg
Стаж: 17 лет 8 месяцев Сообщений: 720
|
petoleg ·
14-Фев-10 17:45
(спустя 5 дней)
Ну... В ST я бы хотел еще и простейший графический редактор. Терки там не хватает.
И еще что-бы он мог в Djvu паковать с учетом цветности страницы. Все ч\б - в качестве skan, серые и цветные - в foto. В журналах часто встречается. Как результат размер будет минимальный при нормальном качестве.
|
|
Igem
Стаж: 15 лет 2 месяца Сообщений: 235
|
Igem ·
21-Фев-10 17:51
(спустя 7 дней)
С июня 2008 г. ScanTailor обсуждается на форуме ru-board. Думаю, все пожелания скоре будут прочитаны автором там)))
Удалось отыскать в сети общее описание BR 4.1 на английском (набрал в Гугле book restorer manual и - опаньки: pdf!), из которого можно понять принцип его работы, а в комплекте 4.2.1 есть справка с описанием деталей. Оказывается, этот "комбайн" ковался для оцифровки целых библиотек.
|
|
toptogun
Стаж: 15 лет Сообщений: 2
|
toptogun ·
22-Фев-10 14:26
(спустя 20 часов)
Igem писал(а):
В оформление книжного листа ФайнРидер вносит мелкие на первый взгляд, но существенные в конечном итоге правки.
Например?
Igem писал(а):
Главное, что мне хотелось - это НЕ распознать текст и перевести книгу в символьный формат, а воспроизвести оформление страниц идентичное оригиналу, чтобы сохранить работу художника-оформителя книги: размеры и пропорции страниц, соответствующие им параметры шрифта (гарнитура, кегль), размеры, пропорции и яркость/контрастность иллюстраций.
В Word-овских настройках страницы можно указать все необходимые параметры. Шрифт подобрать - дело 10 минут.
Картинки вырезаются и обрабатываются отдельно. После чего вставляются в текст. Набив руку, конечный результат и вовсе не будет отличаться от оригинала.
В итоге получаем хорошо читабельный текст и отчётливые картинки при печати, а не размытую кашу уровня дешёвых ксерокопий за 2 руб/стр
Конечно, это нудноприменимо к многотомным изданиям. Хотя, при большом желании возможно всё
|
|
Igem
Стаж: 15 лет 2 месяца Сообщений: 235
|
Igem ·
26-Фев-10 17:36
(спустя 4 дня, ред. 27-Фев-10 12:00)
toptogun писал(а):
Например?
Шрифты, поля, колонтитулы...
Одно дело получить "слепок" страницы на сканере и после хорошенечко подчистить его,
другое - воссоздавать оформление страницы настройками ФР.
Делать второе "на глазок" - все равно, что срисовывать полотно мастера. Получится не то.
Кстати, библиотеки при оцифровке своих фондов пользуются не ФайнРидером, а БукРисторером.
Наверно, неспроста!
|
|
pm12--03
Стаж: 15 лет 6 месяцев Сообщений: 59
|
pm12--03 ·
03-Мар-10 01:31
(спустя 4 дня)
Т.е. в результате всё-равно получается размытый ч/б текст?
Вот например одна из моих раздач:
слева - оригинал, справа - готовый вариант в MS Word
Слишком строго судить не ст0ит - как-никак первый опыт и в FR и в Word'е
В случаях с тонкими книгами особых проблем не будет, но как быть с талмудами под 500 стр и более?
Как минимум, всё будет выглядеть:
Часть текста будет съедаться в корешке. А примерно через час чтения разнокалиберного шрифта начнут болеть глаза.
Поэтому я обеими руками за полноценную цифру.
|
|
Igem
Стаж: 15 лет 2 месяца Сообщений: 235
|
Igem ·
06-Мар-10 12:34
(спустя 3 дня)
pm12--03
pm12--03 писал(а):
Т.е. в результате всё-равно получается размытый ч/б текст
В результате чего? ScanTailor выдает очень четкий результат. А Document Express Editor создает из правленных сканов DjVu-файл с текстовым слоем.
pm12--03 писал(а):
Вот например
Читаемый вариант. Но в нем хорошо видно то, о чем я говорил: высота строк, пробелы между словами после FR не те, что разрабатывал верстальщик. Если читаемость текста - главное, то этот вариант вполне приемлем. Если же хочется сохранить исходное оформление страницы, я бы поискал другое средство обработки сканов.
pm12--03 писал(а):
Часть текста будет съедаться в корешке.
Чтобы этого не случалось, я при сканировании прижимаю книгу не крышкой сканера, а двумя увесистыми томами (по одному на каждую сторону обложки книги), плюс, возможно, еще одним общим "кирпичом" поверх них, чтобы лучше "раскрыть" (но не разворотить) разворот.
Искривление же строк хорошо исправляется специальными программами. СканТэйлор, этого пока не умеет. А жаль! Сканкромсатор - не знаю, кажется, тоже нет. Букристорер может: Устранение кривизны строк и перекоса текста в Book Restorer 4.1
pm12--03 писал(а):
Поэтому я обеими руками за полноценную цифру.
К этому и хотелось бы прийти. По мне, так полноценная цифра включает в себя наличие в файле как текстового слоя, так и оригинального художественно-графического оформления странцы (и иллюстраций, и текста).
|
|
monday2000
Стаж: 15 лет 1 месяц Сообщений: 93
|
monday2000 ·
29-Июн-10 09:51
(спустя 3 месяца 22 дня)
Обработка неравномерно-освещённых сканов в Book Restorer 4.1 http://www.djvu-soft.narod.ru/scan/strange_lighted.htm
|
|
Igem
Стаж: 15 лет 2 месяца Сообщений: 235
|
Igem ·
24-Авг-10 22:32
(спустя 1 месяц 25 дней)
monday2000 Большущее спасибо!!!
|
|
Strekozon
Стаж: 16 лет 9 месяцев Сообщений: 474
|
Strekozon ·
03-Мар-11 23:39
(спустя 6 месяцев)
Тень на развороте проще всего убрать с помощью ластика в инструментах ScanKromsator. Сначала чистите всю страницу, а все тени можно убрать за секунду одним нажатием кнопки левой клавиши мыши при выборе опции "Удалить участок текста".
|
|
Igem
Стаж: 15 лет 2 месяца Сообщений: 235
|
Igem ·
04-Мар-11 08:25
(спустя 8 часов)
Спасибо за совет! Но, помучавшись со ScanKromsator, я давно уже перешел на ScanTailor. На мой взгляд, для обработки черно-белых печатных изданий с минимумом фотоиллюстраций он - лучшее. что пока есть.
Думаю, эту тему можно закрыть, т.к. и этот и большинство других вопросов этого ряда подробно обсуждается в теме Создание электронных книг из сканов: как получить DjVu или PDF из бумажной книги?
|
|
|