Персональный проект Александра Чижова, Иркутск 1998-2006Компьютерный журнал Cooler | скачать новые компьютерные игры | гаджеты | астрономия | обзоры программиста System's temperature
recent issueaboutarchiveLive TAMrubricatorlinksBooks digestComments
Компьютерный журнал "Cooler" Александра Чижова (Иркутск)

Выпуск от 22.03.2007в начало коммент   в конец коммент



Вот такой упрощенный сканер для книг, страницы которой надо переворачивать самому. Скорость сканирования - 1сек на страницу. В общем-то, все до безумия просто: современные мыльницы-фотоаппараты позволяют снимать тексты очень и очень неплохо, тем более, что есть автофокус и т.п. - надо лишь приделать хороший интерфейс (удобная кнопка ), освещение, хорошая подставка - и "сканер" готов. Стоить он должен недорого. Можно снимать документы до А2 формата.

Выпускает фирма Zeutschel. Модель OS 12000 Bookcopy.

В паре с FineReader - получается замечательный оцифровщик.
Кстати, давно уже замечено, что книжку быстее снимать именно фотоаппаратом - со сканером возни много. Потом все снимки загоняешь в FR и очень быстро получаешь электронную копию.

 
12  611 :
Еще несколько вариаций на тему такого сканера есть на http://www.i2s-bookscanner.com/ - там и аналоги этого, и полностью автоматическая линия.

Но нам важнее другое - ребята также делают софт для постобработки изображений с таких сканеров под обычной виндой, называется BookRestorer (раньше лежал вместе
с лекарством на www.djvu-soft.narod.ru, но его закрыли :(). Для обработки просто фотографий книг тоже прекрасно подходит.

Из специфически нужного в нем: выравнивание локального контраста (= неравномерности освещения), коррекция геометрических искажений у корешка и поворота книги относительно фотика, автоматическая обрезка полей и разрезание разворота на две страницы. Плюс куча неспецифического - уровни, общая яркость-контраст, color curves и т.п..

Конечно, он не очень удобен в плане интерфейса, и работает по принципу черного ящика, но зато результат впечатляет - при правильном составлении скрипта обработки, из набора фоток книги, просто положенной на стол в библиотеке и сфотканой цифровой мыльницей без штатива (ну не дают выносить книги из библиотеки, штатив приносить тоже не дают, света кроме встроенной вспышки конечно
же нет), получаются изображения не хуже чем после хорошей обработки сканов с планшетника - сразу же можно класть в djvu и распространять.
    -   | rank:31 | post-id:5709|25.03.2007/12:10
 
11  newuser :
Прикольная моделька (в смысле дизайн)
Такие сканеры нужны для поточного сканирования, тоесть как на конвеере.
На них сканируется около 1000 гравических образов за 11 рабочий день.
На работе подобные стоят, называются "bookeye" сделаны тоже немцами.
Фишка такого сканера в том что сканируется бескосательно (в отличае от планшетников), также там лампочки непростые (300$ за лампу) свет от которых не вредит документу (документы "не выгорят") - все это сделано для того чтобы сканировать архивную документацию, иногда очень старую (мы например работаем с делами 1859г. и позднее).
А в сущности сканер состоит из обычного компа в который воткнута PCI плата для работы панели сканера и для приема данных с "головы". В голове лампочка да вотоприемник. Крутится он скорее всего на модификации линукса + спец софт(кстати по картинке на мониторе вижу что очень похожа на ту что у нас, BCS называется).
Стоит кучу денег. Такого вида работы заказывают крупные организации (типа лукойл или юкос) и гос.архивы.
    -   | rank:2 | post-id:5702|24.03.2007/20:13
 
10  Станислав :
[to TedBeer] [to Mad Mike] Правильно поставленный свет + отсроенный фотоаппарат - это целая наука. Берем старый учебник по фотографии, открываем главу фотокопирование и тщательно УЧИМ написанное!!!

Блики, просвет текста, etc давно пройдено нашими предками. Или благодарным потомкам хоцца повторить их ошибки??? ;)

Господа, АФАИК, в Интернете пока ещё не всё есть и Гугль не панацея (при всём моём уважении к этим явлениям современности) - иногда обычная библиотека или старая книжка с пожелтевшими страницами, добытая из чулана, приводит к более быстрому и эффективному решению, чем неделя сидения в И-нете.

...А техника лишь облегчает нам жизнь, если её юзать по уму. Т. е. + комп + софт + драйвера для прямых рук + голова = успех. :)

P. S. Приходилось переснимать как на фотоплёнку, так и на цифровик. Свидетельствую: то, что пишет ув. Cooler - работает!

P. P. S. Для такого случая Пульт к цифровику есть очень Гуд! Мне понравилсо. :)
   otherwhile@mail.ru  | rank:533 | post-id:5700|24.03.2007/17:42
 
9  Cooler :
[to Mad Mike] Да. нормально снимает.
   chizh@irk.ru  | rank:1277 | post-id:5696|24.03.2007/12:00
 
8  TedBeer :
Сканировал я книгу с многочисленными иллюстрациями. Основная проблема - текст с обратной стороны видимый на просвет страницы. И многие сканы книг и особенно журналов, гуляющие по инету, грешат хреновым качеством именно поэтому. Чтобы обратную сторону не было видно, нужно еще черный лист подкладывать под страницы. А это еще съедает кучу времени в дополнение к переворачиванию
страниц. В результате съезжает баланс белого. Для текста нестрашно, а картинки после этого приходится дорабатывать напильником.
    -    ICQ:9637948  | rank:73 | post-id:5695|24.03.2007/11:31
 
7  Mad Mike :
[to Cooler] Да? ПРидется поставить FR, а то что-то у меня сомнения закрались.
    -    ICQ:72003192  | rank:509 | post-id:5693|24.03.2007/08:26
 
6  Cooler :
[to Mad Mike] пробовал лично. снимал на 3Мпкс. соньку. FR 8 проглотил без единой ошибки.
   chizh@irk.ru  | rank:1277 | post-id:5690|24.03.2007/04:30
 
5  tosh :
[to Mad Mike] отражения от стекла -- полярик решает :) вообще, решает зеркалка на 8-10Мпкс, они сейчас не так и дороги.
    -   | rank:191 | post-id:5688|24.03.2007/03:31
 
4  Mad Mike :
К примеру, берем 6 Мп фотик, потому как оптимум по критерию цена/качество. Разрешение снимка 2816х2112. Допустим, необходимо отснять формат А4 с 12 текстом.
Опять же, допустим, что оптику отстраиваем так, что весь лист помещается в кадр. Получаем ~ 300мм = 2816 пикселей. Получается 9 пикс/мм или 238 dpi. С таким качеством человек прочитает текст, а вот FR может загнуться. Нет, я не говорю, что он совсем ничего не распознает, но большинство текста останется не распознанным. Это я взял стандартный печатный лист со стандартным же
размером шрифта. В книжках (особенно умных) как правило используется более мелкий шрифт, плюс перекосы текста при сканировании, не равномерность освещения, дефекты печати, и т.д. Получаем не разбираемый (машинно) материал. Следовательно, необходимо применять фотики с более высоким разрешением матрицы, а это цена. Правда, сейчас 8Мп камеры стоят тоже относительно не дорого, но
существенного преимущества они не дают.
Если наложить стекло, то с освещением придется еще более заморочиться, так как неизбежны блики, которые сведут на нет все мегапиксели. Опять же получаем проблемы. Относить матрицу от сканируемого объекта далеко- получаем приемлемую картинку, но проигрываем (сильно) в габаритах. Приближаем фотоаппарат - получаем геометрическую абберацию. Для ее устранения применяем хорошую
оптику- сильно увеличиваем стоимость сканера.

Мое резюме: способ хорош для быстрого сканирования важных документов, книг, на сканирование которых на нормальном сканере нет времени. Причем сканер заточен именно для текста.

Когда был студентом, таким образом "стеклили" чертежи. Сканер формата А1, а тем более А0 найти крайне сложно :)
    -    ICQ:72003192  | rank:509 | post-id:5687|24.03.2007/02:25
 
3  Jack Pavlov :
привет Всем !
- при сканировании проблема разрешения решается мегапикселями. Это практически единственное для чего они наконец-то бывают нужны.
- искажения текста у корешка бывает 2х видов. Если речь о плохой фокусировке, то решается все закрытием диафрагмы у фотоаппарата. глубина резкости будет больше и все будет резким. Подальше от книги держать фотоаппарат. Штатив повыше.
- если искажения у корешка из-за неполного раскрытия книги, то применяем грубую физическую силу :) и кусок стекла сверху. Стекло вообще рулез, положил сверху и снимай.....
- хорошая штука пульт ДУ для фотоаппарата. Руками листаешь книгу и кладешь сверху стекло, пультом ДУ сканируешь.
   j402@mail.ru   ICQ:23289019  | rank:83 | post-id:5681|24.03.2007/01:56
 
2  Mad Mike :
Сам "сканил" толстую книжку фотоаппаратом на штативе. Получается, конечно, быстро, и текст хоть разобрать можно, однако же, жля распознавали, думаю, плохо подойдет. Разрешения маловато, плюс искажения текста у корешка книги. Для архива какой-то редкой книги вполне годится. А вообще идя требует своего развития
    -    ICQ:72003192  | rank:509 | post-id:5670|24.03.2007/00:04
 
1  kontiky :
Собственно, вся проблема именно в переворачивании страниц и есть. Но есть и ее решения.
    -   | rank:12 | post-id:5664|23.03.2007/20:53

это мой е-майл Боря делал дизайн