A+ A A-

e.Typist - Распознавание иероглифики

1 1 1 1 1 100% (1)

e.Typist является одним из популярных в Японии средством распознавания отсканированных иероглифических текстов.

Поскольку e.Typist предназначен только для японского рынка, его интерфейс не переведён даже на английский язык - от полностью иероглифический. При попытке установки программы в русскоязычной Windows вместо иероглифов вы получите кракозябры даже при установленной в вашей системе поддержке японского языка. Проблема решается с помощью Microsoft Applocale.

Окна программы с подсказками по основным органам управления представлены на Рис. 1 и 2.



Рис. 1. Главное окно e.Typist. Для получения всплывающей справки
наведите курсор мыши на интересующую кнопку.


Рис. 2. Описание меню настроек распознавания для выделенного блока текста.

Опишу последовательность распознавания на конкретном примере (Рис 3).


e.typist
Рис. 3

1) Открываем файл отсканированного изображения с помощью кнопки 1 (предварительно нажимаем на маленький треугольник справа и выбираем опцию ファイル読込(F)). Почему не пользуемся сканером? Дело в том, что после пропускания через Applocale сканер может отвалиться (ошибка - "Twain DLL не найден" по-японски), поэтому лучше сначала подготовить скан с помощью стандартного для сканера приложения (с максимально возможным разрешением для облегчения работы eTypist-у), а затем открыть его в нашей программе описанным способом.

2) Выделяем с помощью мыши блоки текста для распознавания. Для этого ставим перекрестье указателя в один угол, нажимаем левую кнопку мыши и тащим указатель в диагонально противоположный конец блока – появляется рамка, которая должна охватывать весь блок целиком. После отпускания кнопки блок подствечивается зелёной окантовкой. В нашем случае выделено 4 текстовых блока.

3) Проверяем порядок следования блоков, нажав на клавишу, указанную цифрой 3. В каждом блоке появляется его порядковый номер. Если порядок распознавания блоков неверен, то однократным щелчком по каждому блоку в нужной последовательности выставляем правильные номера. Отжимаем кнопку 3 обратно.

4) Для каждой области выставляем параметры распознавания (см. Рис. 2). Чтобы одновременно просмотреть наборы текущих параметров для каждого блока, необходимо нажать клавишу 4.

5) Перед запуском распознавания выставляем для Word опцию "Только текст" (с помощью маленького треугольника справа от кнопки со значком Word и выбора надписи テキスト転送(T)). Нажимаем на значок Word и дожидаемся, пока откроется его окно с результатами распознавания.


Получилось 4 отдельных текстовых блока, каждый из которых состоит из однострочных абзацев. Если включить в Word отображение непечатных символов (Ctrl-Shift-8), то хорошо видно, что значки абзаца завершают каждую строчку (Рис. 4).


Экспорт распознанного текста в Word
Рис. 4

Чтобы избавиться от такого деления сделаем следующее. Выделим (закрасим) мышью кусок текста, который должен быть преобразован в один абзац. Сочетанием клавиш Ctrl-h вызываем диалоговое окно Найти и Заменить. В нём в поле Найти вписываем пару символов ^p, поле Заменить на оставляем пустым (Рис. 5):


etypist5
Рис. 5

Теперь жмём кнопку Заменить все. В результате кусок текста превращается в один слитный абзац и приобретает божеский вид:


etypist6
Рис. 6

СсылкаОписаниеРазмер
Доступ по ссылке (http://letitbit.net/download/44577.489f3f0e130c00f0c07bae4249b2/et15_try.exe.html)e.Typist (v15)Пробная версия e.Typist. Работает 5 дней. (Letitbit).0 kB
Доступ по ссылке (http://vip-file.com/downloadlib/256470178837158594-44577.489f3f0e130c00f0c07bae4249b2/et15_try.exe.html)e.Typist (v15)Скачать файл с Vip-Files0 kB


Комментарии  

# sanji 24.02.2010 08:18


Распознает ли e.Typist иероглифы с кириллицей?
Спасибо.
Ответить | Ответить с цитатой | Цитировать
# Administrator 24.02.2010 16:42


С распознаванием русского у него совсем неважно, к сожалению.
Ответить | Ответить с цитатой | Цитировать
# Гость 16.03.2010 18:28


Как правильно распознавать окуригану?
e.Typist делает ее какой-то разреженной, и не там где нужно, а править не выходит.
Ответить | Ответить с цитатой | Цитировать
# Andrey 18.09.2012 21:31


Надо предупреждать, что это триал. Срок дейтсвия 14 дней.
Создается впечатление, что таким образом Вы просто зарабатываете на летитбите.
Через 14 дней нужно или купить программу или любоваться на бесполезные 252Мб.
Ответить | Ответить с цитатой | Цитировать
# Administrator 18.09.2012 22:08


Цитирую Andrey:
Надо предупреждать, что это триал. Срок дейтсвия 14 дней.
Создается впечатление, что таким образом Вы просто зарабатываете на летитбите.
Через 14 дней нужно или купить программу или любоваться на бесполезные 252Мб.
Прошу прощения, Андрей. Дело в том, что я-то, конечно, пользуюсь лекарством, но по этическим соображениям отключил доступ к этому файлу.
Ответить | Ответить с цитатой | Цитировать
# Андрей 19.09.2012 22:45


Спасибо.
У меня пока что проблемы со знанием кандзи. Если может - ответьте. Достоточно для поместить патч в папку с программой и запустить, или нужно ещё что-то сделать?
Ответить | Ответить с цитатой | Цитировать
# Administrator 20.09.2012 02:38


Цитирую Андрей:
Спасибо.
У меня пока что проблемы со знанием кандзи. Если может - ответьте. Достоточно для поместить патч в папку с программой и запустить, или нужно ещё что-то сделать?
Я сейчас даже уже и не вспомню. Наверное, этого достаточно. Попробуйте.
Ответить | Ответить с цитатой | Цитировать
# Андрей 20.09.2012 15:19


Предупреждение о сроке действия перестало появляться. Причём установленный у меня анитивирус убрал патч в хранилище. Программа работает. Через 14 дней может сообщу что получилось.
PS: У Вас нет случайно патча для NJStar? Обхожусь пока без него, но не знаю что будет, если забуду деинсталлироват ь его до срока действия.
Спасибо.
Ответить | Ответить с цитатой | Цитировать
# Андрей 04.10.2012 17:31


Оставляю комметарий. Если можете дайте, пожалуйста, советы, как решить некоторые трудности.
1. Программа всё ещё работает. Отличная программа. Правда, возможности не безграничны: цветной текст на пёстром фоне, видимо, не распознаётся.
2. Хорошо распознаётся яркий тёмный текст, но такой же (например, желтый) на том же скане программа воспринимает как пустое место.
3. Мне нужно обработать сразу папку со сканами. Программа может это сделать?
4. Пока не понял, можно ли редактировать картинки прямо в программе. Возможно, если изменить цвета, распознавание будет лучше.
5. При каждом запуске предлагает скачать обновление. Пока не знаю, как отключить эту функцию.
6. Ворд у меня не установлен, поэтому те же функции выполняет АдобРидер (он предложит скачать 10Мб японских шрифтов). Дальше текст можно скопировать в другой текстовый редактор в нужном порядке.
Ответить | Ответить с цитатой | Цитировать

Добавить комментарий

Чтобы оставить комментарий, вы можете также войти через любую из предстваленных ниже социальных сетей.
               


Защитный код
Обновить

  1. Блог
  2. Комментарии
  1. Японская грамматика
  2. Тесты
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17

Войти или Зарегистрироваться