Огляд ЗМІ

Мінекономіки та Держархів навчають ШІ, щоб розпізнати «почерк лікарів»

24 березня 2026, 17:34Новини101

Этот материал также доступен на русском

Головна мета — навчити штучний інтелект якісно розпізнавати складний рукописний текст, старі документи та медичні довідки

  • Посилання скопійованоlink copied

Міністерство економіки України спільно з Державним архівом та іншими відомствами ініціювало масштабний проєкт зі збору бази україномовних рукописних даних. Головна мета — навчити штучний інтелект якісно розпізнавати складний рукописний текст, старі документи та медичні довідки.

Деталями цієї ініціативи поділився ML Lead застосунку «Мрія» та радник зі штучного інтелекту в Мінекономіки Дмитро Войтех у подкасті AI&I. За словами Войтеха ініціатива дозволить суттєво пришвидшити цифровізацію державних послуг та відкриє шлях до глобального оцифрування історичних архівів.

Ідея створення національного датасету народилася під час роботи над проєктом «єДозвіл», який має на меті перевести видачу ліцензій для підприємців у цифровий формат через «Дію». Для автоматизації цього процесу алгоритмам потрібно аналізувати документи заявників.

Проте виявилося, що для отримання багатьох ліцензій необхідно завантажувати старі дипломи (подекуди ще з 90-х років), які часто заповнені від руки, погано сфотографовані або мають дефекти. За словами Дмитра Войтеха, готові OCR-рішення (системи оптичного розпізнавання символів), які існують на ринку, виявилися абсолютно безсилими перед українськими рукописами.

«Ми стикнулися з тим, що дуже недобре працює на українських рукописах, особливо враховуючи, що наші перші ліцензії пов’язані з медичними послугами. Ми всі розуміємо, як виглядає шрифт наших любих лікарів», — розповів Войтех про проблематику українських рукописних текстів.

Зіткнувшись із цією проблемою, розробники зрозуміли, що у відкритому доступі просто не існує якісних та розмічених корпусів українського рукописного тексту. Щоб не чекати роками, поки система «єДозвіл» самостійно накопичить достатню кількість даних, Мінекономіки використало свій авторитет для об’єднання зусиль з іншими державними структурами.

Найбільшим партнером ініціативи став Державний архів України. Ця установа має колосальний інтерес у розвитку технології, адже їхня стратегічна мета — оцифрувати мільйони сторінок історичних документів. Замість того щоб годинами шукати інформацію фізично, як це відбувається зараз, якісна ШІ-модель дозволить перетворити архіви на зручну базу знань, де шукати інформацію можна буде так само легко, як у пошуковику.

Не пропустіть важливе!
Підписуйтесь та отримуйте дайжест новин

Щоденно чи щотижня – обираєте ви!

Матеріали за темою

Огляд ринків

Статті • БОРГ-review
Новим фронтендом для сучасної людини стають криптовалютні платформи

Огляд ринків

Статті • БОРГ-review
Якщо хакери використовують AI для обману, гаманці та біржі роблять це для захисту

Огляд ринків

Статті • БОРГ-review
Якщо недійсність правочину встановлена законом, то визнання його судом недійсним не вимагається

Огляд ринків

Статті • БОРГ-review
Практика банкрутства змінюється там, де з’являється узгоджене розуміння правил

Огляд ринків

Статті • БОРГ-review
Змінюється економіка, адже ліквідність мігрує туди, де зручно агентам

Огляд ринків

Статті • БОРГ-review
Ефективність процедур банкрутства залежить від єдності судової практики, збалансованого контролю та чіткого розмежування відповідальності