Research of automatic information recognition systems construction approaches

Author(s) Collection number Pages Download abstract Download full text
Havrysh B. M., Selmenska Z. M., Kovalskyi B. M., Ізонін І. В. № 1 (81) 21-27 Image Image

Одна з найбільш ранніх спроб створити систему, здатну зчитувати тексти, була створена в 1870 році. Вона представляла собою сканер-сітківку, робота якого була заснована на фотоелементах. Надалі з’явилися Fourier d’Albe’s Optophone в 1912 р. і Thomas tactile relief device в 1926 р. Системи оптичного зчитування текс­тів з’явилися в середині ХХ ст. в результаті розвитку цифрових комп’юте­рів. Девід Шепард, засновник компанії Intelligent Machine Research, вважається ро­до­на­чаль­ником створення комерційних систем OCR.

На початку 60-х р.р. системи автоматичного зчитування набули широкого поширення, незважаючи на можливість зчитування дуже обмеженої кількості шрифтів і на обмеження, що накладаються на орієнтацію символів. З розвитком мікроелектроніки ці системи постійно вдосконалювалися.

Системи оптичного розпізнавання тексту вимагають калібрування для роботи з конкретним шрифтом; в ранніх версіях для програмування було необхідне зображення кожного символу, програма одночасно могла працювати тільки з одним шрифтом. В даний час найпоширеніші так звані «інтелектуальні» системи, які з високим ступенем точності розпізнають більшість шрифтів. Деякі системи оптичного розпізнавання тексту здатні відновлювати початкове форматування тексту, враховуючи зображення, колонки та інші нетекстові компоненти.

Оптичне розпізнавання тексту є досліджуваною проблемою в областях роз­піз­навання образів, штучного інтелекту та комп’ютерного зору. Оптичне розпіз­на­­вання символів дозволяє редагувати текст, здійснювати пошук слів чи фраз, збе­­­рігати його в більш компактній формі, демонструвати або роздруковувати ма­теріал, не втрачаючи якості, аналізувати інформацію, а також застосовувати до тексту електронне переведення, форматування або перетворення в усне мовлення.

Ключові слова: оптичне розпізнавання, система, зчитування, символи, техно­логія.

doi: 10.32403/0554-4866-2021-1-81-21-27


  • Kozel, V. O. Metody ta etapy avtomatychnoho rozpiznavannia tekstu: Visnyk Cherkaskoho universytetu. Seriia prykladna matematyka. Informatyka, 172, 75–86 (in Ukrainian).
  • Havrysh, B. M., Durniak, B. V., Polusyn, O., & Semenova, O. Ie. (2019). Zastosuvannia metodiv zakhystu informatsii v informatsiinykh systemakh: Modeliuvannia ta informatsiini tekhnolohii, 89, 224–229 (in Ukrainian).
  • Havrysh, B. M., Tymchenko, O. V., & Durniak, B. V. (2019). Pobudova iierarkhichnykh stsenariiv opratsiuvannia danykh: Modeliuvannia ta informatsiini tekhnolohii, 86, 86–90 (in Ukrainian).
  • Havrysh, B. M., Tymchenko, O. V., & Kovalskyi, B. M. (2019). Doslidzhennia metodu ko­ryhuvannia rozdilnoi zdatnosti zobrazhennia dlia vidtvorennia tsyfrovymy vyvidnymy polih­rafichnymy prystroiamy. Intelektualni systemy pryiniattia rishen ta problemy obchysliuvalno­ho intelektu : materialy Mizhnarodnoi naukovoi konferentsii (s. Zaliznyi Port, 21–25 travnia 2019 r.), 174–175 (in Ukrainian).
  • Gader, P. D., Forester, B., Ganzberger, M., Billies, A., Mitchell, B., Whalen, M., & Youcum, T. (1991). Recognition of handwritten digits using template and model matching: Pattern Re­cognition, 5 (24), 421–431 (in English).
  • Arica, N., & Yarman-Vural, F. T. (May 2001). An Overview of Character Recognition Focused on Off-Line Handwriting. Machine Intelligence, 22 (1), 4–37. IEEE Trans. on Systems, Man, and Cybernetics. Part C: Applications and Reviews, 31, 2 (in English).
  • Vasin, D., & Ershov, M. (2014). Raspoznavanie simvolov na baze nizkourovnevyh modelej opisanija graficheskih zobrazhenij. Grafikon-2014 : 24-ja Mezhdunar. konf. po komp’juternoj grafike i zreniju, 62–64 (in Russian).
  • Steinbuсh, K., & Piske, U. A. W. (Dec. 1963). Learning matrics and their application: IEEE Transaction of Electronic Computers, EC–12, 6 (in English).