Форум » » Сканирование FR8 дореволюционных книг » Ответить

Сканирование FR8 дореволюционных книг

Сергей: Взял в библиотеке церковной книгу в дореволюционной орфографии.Прот.Григорий Дьяченко Помощь в скорбях и печалях.Решил отсканировать так как книга интересная и захочется снова почитать.Промблема что программа Fine Reader 7.0 не поддерживает старую орфографию.Если букву i еще можно заменить латинской то как быть с ять или фита.Поискал в интернете разговоры есть, что как то получается.Но как это практически сделать.Если кто этим занимался подскажите.Сергей

Ответов - 11

11: отсканируйте в картинках а там разберемся

Сергей: вСпасибо что ответили.За это время я отсканировал уже на 95%в формате PDF использовал в FR-7 функцию сохранение без распознавания.Сохранилось все в файлах в том числе и буквы старой орфоргафии. Слова которые возле разворота страницы в некоторых местах получились некачественно. Теперь хочу попытаться перевести в формат DOC или HTML.Что посоветуете? Я конечно не сижу сложа руки.Накачал много шрифтов.Приграммы Scan Kromsator,After Scan Express,словгрыз,иероглиф.Начал с их помощью что то делать,пока безрезультатно.

Сергей: Книгу наконец-то отсканировал и поместил на страничку www.thevostok.com/Books488/10.html Желающие могут скачать.


Михаил: Посмотрел исходный код (на страничке "Предисловие"). Там видно, что Вы веб-страницы делали прямо из Word-a. Это напрасно - объем файлов от этого увеличивается раз в 5-7. Посмотрите сами: кликните правой клавишей мышки на экран с открытой страницей, из контекстного меню выберите "Просмотр в виде HTML", и прикиньте, сколько там собственно самого текста и сколько HTML-кода - его в пять раз больше, чем текста. А должно быть наоборот. Формат Word даёт много лишнего кода, мусорит. Советую 1) скопировать текст в FrontPage и в нем сделать веб-страницы. В этой программе делается все также, как в Word-e, но мусора на порядок меньше. В установке "Шрифт" указать шрифт, поддерживающий старорусс. орфографию. Или: просто использовать символы кодовой таблицы HTML, в ней есть фита, ижица (в греч. начертании) и остальное, кроме Ять. Ять можно заменить очень похожим на него символом из той же таблицы. 2) указать рядом с линком на скачку архива объем этого архива. Лучше, конечно, страницы делать не в FrontPage, а в обычном текстовом блокноте или (если не знаете кода) в NoteTab-e ( www.notetab.narod.ru ) - тогда их можно сделать легкими для скачки. Чем меньше объем конечного файла, тем лучше.

Сергей: Здравствуйте Михаил.Спасибо за полезные советы. Постараюсь учесть в дальнейшем.Сейчас я в отпуске.Поэтому больше свободного времени: поработал над внешним оформлением странички.Оно стало не таким примитивным как вначале.В дальнейшем буду помещать отсканированные мною книги,которых нет в интернете.Книги буду подбирать христианские в старорусской орфографии.Сергей

Сергей: ссылка на страничку

Сергей: За прошедшее время добавил журналы Русскiй паломникъ за 1906г.Нива 1891-1915гг.Родина 1903-1909гг.Отдельные номера всего около 60№.Готовлю Русскiй паломникъ за 1887 год,отсканировал уже перевожу в формат html.Ссылка прежняя см.выше.

Дмитрий: Поклон за труды, дело замечательное, открывает возможность потрогать нашу историю не сходя с места. В плане предложения: о формате DJVU, с чем его едят и какой куда плагин ставить - об этом надо бы сказать на главной странице. Или на всех страницах, где есть файлы "дежавю", - причем в верхних строчках списка, чтобы глаз сразу туда утыкался. А то не сразу и найдешь, куда-то в середину спрятано, другой человек и искать-то не станет - подумает, что выложено "как есть" и, мол, сами разбирайтесь. В постраничном виде линки лучше всего дать не на одну следующую, а на все страницы сразу, чтобы можно было сразу выйти на нужную страницу, а не листать. А так - вполне все прилично.

Сергей: Дмитрию.Учел ваше предложение.Теперь сведения о плагине к браузеру и программе для чтения текстов в формате DJVU поместил на первую страницу.Плагин я установил у себя на браузер IE-6 работает нормально.Нажимаешь на стрелочку перлистываешь страницы.Итерфейс как говорится интуитивно понятен,тем более русифицирован.Устанавливаются программы просто.Может с установкой шрифта какие нибудь промблемы.Пишите.Если кого интересует т.к. эта тема на любителя.

Андрей Д.: FineReader 8 позволяет распознавать тексты в дореволюционной орфографии. Для этого в настройках распознавания включаете соответствующий язык.

Сергей: Привет Андрей.За два года много воды утекло.Использую уже FineReader 9. Распознаю в дореволюционной орфографии,но дело это хлопотное.Немного я видел желающих этим заниматься. Да и сайт уже другой http://magazines.orthodoxy.su/ . Сделан на Joomla . Там такие тексты есть.Несколько журналов Русскiй паломникъ распознал и выложил в формате html и пару книг одна на сайте другая по ссылке можно найти,если есть желание.Сейчас отошел уже от этого делаю сайты во флэше.



полная версия страницы