ПРОБЛЕМЫ ЦИФРОВОГО ПРЕОБРАЗОВАНИЯ И АВТОМАТИЧЕСКОГО ПЕРЕВОДА ТЕКСТА

Ю. В. Ломоносов, Ж. В. Ломоносова

Анотація


В работе рассматриваются методы классификации, применяемые при цифровой обработке би-тональных изображений текста, полученных сканированием или цифровым фотографированием. Для известных на сегодняшний день алгоритмов классификации, включая хорошо зарекомендовавший себя - алгоритм JB2, приведены количественные характеристики классификации – число классов, получаемых этими алгоритмами для изображения стандартной страницы текста. Так-же показано, что минимально возможное количество классов при классификации изображений символов текста позволяет уменьшить ошибку распознавания текста системами оптического распознавания. Минимизация ошибки распознавания текста позволяет повысить качество автоматического перевода на иностранный язык.

Ключевые слова: классификация изображений текста, системы оптического распознавания, компьютерный перевод текста.

кандидат технічних наук, доцент,  Ломоносов Ю. В. Проблеми цифрового перетворення та автоматичного перекладу тексту / Національний юридичний університет імені Ярослава Мудрого, Україна, Харків.

Ломоносова Ж. В. Проблеми цифрового перетворення та автоматичного перекладу тексту / Харківський національний  університет будівництва та архітектури, Україна, Харків

В роботі розглядаються методи класифікації, що застосовуються при цифровій обробці бі-тональних зображень тексту, отриманих скануванням або цифровим фотографуванням. Для відомих на сьогоднішній день алгоритмів класифікації, включаючи добре відомого - алгоритм JB2, наведені кількісні характеристики класифікації - число класів, одержаних цими алгоритмами для зображення стандартної сторінки тексту. Також  показано, що мінімально можлива кількість класів при класифікації зображень символів тексту дозволяє зменшити помилку розпізнавання тексту системами оптичного розпізнавання. Мінімізація помилки розпізнавання тексту дозволяє підвищити якість автоматичного перекладу на іноземну мову.

Ключові слова: класифікація зображень тексту, системи оптичного розпізнавання, комп'ютерний переклад тексту.

PhD, Associate Professor, Lomonosov Yu. V. Problems of digital conversion and automatic translation of text / Yaroslav Mudryi National Law University, Ukraine, Kharkiv

Lomonosova  Zh. V. Problems of digital conversion and automatic translation of text / Kharkiv National University of Civil Engineering and Architecture, Ukraine, Kharkiv

The paper deals with the classification methods used in digital processing of bi-tonal image of the text, obtained by scanning or digital photography. For the currently known classification algorithms, including well-established - an algorithm JB2, given the quantitative characteristics of the classification - the number of classes obtained by these algorithms to image the standard page of text. Thus, it was shown that the smallest possible number of classes in the classification of images of text characters can reduce the recognition error text optical character recognition systems. Minimizing OCR errors can improve the quality of automatic translation into a foreign language.

Key words: classification of images of text, optical character recognition (OCR), computer translation of the text.


Повний текст:

PDF

Посилання


Земсков В. Н. Сжатие изображений на основе автоматической классификации / В. Н. Земсков, И. С. Ким // Известия вузов. Электроника. – 2003. – № 2. – С. 50-56.

Иванов В. Г. Сокращение содержательной избыточности изображений на основе классификации объектов и фона / В. Г. Иванов, М. Г. Любарский, Ю. В. Ломоносов // Проблемы управления и информатики. – 2007. – № 3. – С. 93-102.

Иванов В. Г. Сжатие изображений на основе автоматической и нечеткой классификации фрагментов / В. Г. Иванов, Ю. В. Ломоносов, М. Г. Любарский // Проблемы управления и информатики. – 2009. – №1 – С. 52-63.

Иванов В. Г. Фурье и вейвлет анализ изображений в плоскости JPEG-технологий / В. Г. Иванов, Ю. В. Ломоносов, М. Г. Любарский // Проблемы управления и информатики. – 2004. – № 5. – С. 111-124.

Иванов В. Г. Сжатие изображения текста на основе выделения символов и их классификации / В. Г. Иванов, М. Г. Любарский, Ю. В. Ломоносов // Проблемы управления и информатики. – 2010. – № 6. – С. 74-84.

Иванов В. Г. Классификационные методы сжатия изображений оцифрованного текста. Часть I / В. Г. Иванов, Ю. В. Ломоносов, М. Г. Любарский // Системи обробки інформації. - 2013. - № 2. - С. 36-43.

Сергеева Т. В. Решение грамматических задач в технике смысловой интерпретации, моделирующей речевое мышление человека / Т. В. Сергеева // Вестник ХГУ. Серия «Психология». – 1999. - № 432. – С. 297–301.

References:

Zemskov V. N. Szhatie izobrazheniy na osnove avtomaticheskoy klassifikatsii / V. N. Zemskov, I. S. Kim // Izvestiya vuzov. Elektronika. – 2003. – № 2. – S. 50-56.

Ivanov V. G. Sokrashchenie soderzhatelnoy izbytochnosti izobrazheniy na osnove klassifikatsii obektov i fona / V. G. Ivanov, M. G. Lyubarskiy, Yu. V. Lomonosov // Problemy upravleniya i informatiki. – 2007. – № 3. – S. 93-102.

Ivanov V. G. Szhatie izobrazheniy na osnove avtomaticheskoy i nechetkoy klassifikatsii fragmentov / V. G. Ivanov, Yu. V. Lomonosov, M. G. Lyubarskiy // Problemy upravleniya i informatiki. – 2009. – №1 – S. 52-63.

Ivanov V. G. Fure i veyvlet analiz izobrazheniy v ploskosti JPEG-tekhnologiy / V. G. Ivanov, Yu. V. Lomonosov, M. G. Lyubarskiy // Problemy upravleniya i informatiki. – 2004. – № 5. – S. 111-124.

Ivanov V. G. Szhatie izobrazheniya teksta na osnove vydeleniya simvolov i ikh klassifikatsii / V. G. Ivanov, M. G. Lyubarskiy, Yu. V. Lomonosov // Problemy upravleniya i informatiki. – 2010. – № 6. – S. 74-84.

Ivanov V. G. Klassifikatsionnye metody szhatiya izobrazheniy otsifrovannogo teksta. Chast I / V. G. Ivanov, Yu. V. Lomonosov, M. G. Lyubarskiy // Sistemi obrobki іnformatsії. - 2013. - № 2. - S. 36-43.

Sergeeva T. V. Reshenie grammaticheskikh zadach v tekhnike smyslovoy interpretatsii, modeliruyushchey rechevoe myshlenie cheloveka / T. V. Sergeeva// Vestnik KhGU. Seriya «Psikhologiya». – 1999. - № 432. – S. 297–301.


Посилання

  • Поки немає зовнішніх посилань.


Цей твір ліцензовано за ліцензією Creative Commons Із зазначенням авторства 4.0 Міжнародна.

 


тИЦ и PR сайта naukajournal.org