Обзор СМИ

Минэкономики и Госархив учат ИИ, чтобы распознать «почерк врачей»

Сегодня, 17:34Новости3

Цей матеріал також доступний українською

Главная цель – научить искусственный интеллект качественно распознавать сложный рукописный текст, старые документы и медицинские справки

  • Ссылка скопированаlink copied

Министерство экономики Украины совместно с Государственным архивом и другими ведомствами инициировало масштабный проект сбора базы украиноязычных рукописных данных. Главная цель – научить искусственный интеллект качественно распознавать сложный рукописный текст, старые документы и медицинские справки.

Деталями этой инициативы поделился ML Lead приложения «Мрия» и советник по искусственному интеллекту в Минэкономики Дмитрий Войтех в подкасте AI&I. По словам Войтеха, инициатива позволит существенно ускорить цифровизацию государственных услуг и откроет путь к глобальной оцифровке исторических архивов.

Идея создания национального датасета родилась во время работы над проектом «Разрешение», который должен перевести выдачу лицензий для предпринимателей в цифровой формат через «Действие». Для автоматизации этого процесса алгоритмы должны анализировать документы заявителей.

Однако оказалось, что для получения многих лицензий необходимо загружать старые дипломы (кое-где еще с 90-х годов), которые часто заполнены от руки, плохо сфотографированы или имеют дефекты. По словам Дмитрия Войтеха, готовые OCR-решения (системы оптического распознавания символов), существующие на рынке, оказались абсолютно бессильными перед украинскими рукописями.

«Мы столкнулись с тем, что очень плохо работает на украинских рукописях, особенно учитывая, что наши первые лицензии связаны с медицинскими услугами. Мы все понимаем, как выглядит шрифт наших любимых врачей», — рассказал Войтех о проблематике украинских рукописных текстов.

Столкнувшись с этой проблемой, разработчики поняли, что в открытом доступе просто не существует качественных и размеченных корпусов украинского рукописного текста. Чтобы не ждать годами, пока система «Разрешение» самостоятельно накопит достаточное количество данных, Минэкономики использовало свой авторитет для объединения усилий с другими государственными структурами.

Крупнейшим партнером по инициативе стал Государственный архив Украины. Это учреждение имеет колоссальный интерес в развитии технологии, ведь их стратегическая цель оцифровать миллионы страниц исторических документов. Вместо того чтобы часами искать информацию физически, как это происходит сейчас, качественная ИИ-модель позволит превратить архивы в удобную базу знаний, где искать информацию можно будет так же легко, как в поисковике.

Не пропустите важное!
Подписывайтесь и получайте дайжест новостей

Ежедневно или еженедельно – выбираете вы!

Мнение эксперта

Хотите стать автором borg.expert?

Материалы по теме

Огляд ринків

Статьи • БОРГ-review
Понад 99% активів на ринку становлять саме токени. Станом на 2025 рік їхня кількість оцінюється в ~36 млн, тоді як криптовалют – близько десяти тисяч

Огляд ринків

Статьи • БОРГ-review
Блокчейн дозволяє людям діяти навіть там, де держава намагається закрити всі можливості, фактично виступаючи проти диктатури і цензури в будь-якій формі

Огляд ринків

Статьи • БОРГ-review
Не хочеться думати, що до розробки законів в Україні іноді долучаються випадкові люди

Огляд ринків

Статьи • БОРГ-review
Проблема в тому, що "спір про право" інколи перетворюється на штучний бар’єр для доступу до процедур банкрутства

Огляд ринків

Статьи • БОРГ-review
Санкційні активи можуть стати драйвером оновлення економіки, але лише тоді, коли держава гарантує інвесторам правову стабільність

Огляд ринків

Статьи • БОРГ-review
Для ефективного використання можливостей, наданих Законом №4564-ІХ, суб’єктам господарювання рекомендується ретельно переглянути статути своїх товариств