PornOCR

Берем нарезанные сканы и проверяем их размеры:

$ identify *.tif | awk '{print $3}' | sort | uniq
3048x4480

Теперь собираем из них посредством «ABBYY Finereader 12» книжку и проверяем размеры страничек:

$ identify body.pdf | awk '{print $3}' | sort | uniq
366x538
367x538
368x539
$ identify body.djvu | awk '{print $3}' | sort | uniq
3048x4480
3054x4484
3055x4485
3063x4490

Что это вообще?

This entry was posted in сообщения and tagged . Bookmark the permalink.

Leave a Reply