Российские ученые научили ИИ распознавать рукописное слово

21.03.2025 07:27

Они разработали метод, позволяющий ИИ распознавать даже трудночитаемые рукописные слова, такие как "шиншилла", без языкового контекста. Это новшество поможет уменьшить вероятность ошибок и галлюцинаций в работе нейросетей, особенно при обработке редких слов. Компания Smart Engines, занимающаяся разработкой технологий распознавания документов, сообщила о достижении этого важного этапа.

Новая нейросеть, созданная учеными, не зависит от знаний о русском языке и фокусируется исключительно на уникальных особенностях сочетания букв на изображении. Это позволяет ей успешно распознавать рукописные слова, которые ранее могли вызывать трудности для других систем. Такой подход значительно повышает эффективность и точность систем распознавания документов.

Этот научный подвиг открывает новые перспективы для применения искусственного интеллекта в различных областях, где требуется точное и быстрое распознавание текста. Благодаря усовершенствованным системам ИИ, возможности автоматизации процессов обработки информации становятся более широкими и надежными.

Новые предложения в начале, середине и конце:

Исследования в области искусственного интеллекта продолжают приводить к улучшениям в различных сферах, включая системы распознавания текста. Такой подход кардинально снижает вероятность галлюцинаций ИИ на редко встречающихся словах, включая имена собственные. Эта разработка вывела на новый уровень системы распознавания паспортов РФ, которые используются ведущими банками, сотовыми операторами и другими российскими компаниями", - сказали в компании.

Слово "Шиншилла" является своеобразным тестом Тьюринга для систем распознавания рукописного текста на кириллице, объяснили в Smart Engines. При неаккуратном почерке строчные формы букв "ш", "л", "и" становятся практически неразличимы.

Использование таких инновационных методов позволяет повысить точность распознавания текста на русском языке и уменьшить возможность ошибок при обработке документов. Такие технологии имеют широкое применение и способствуют развитию современных систем искусственного интеллекта.

Исследователи внедрили нейросеть "Да Винчи" на практике, обучив ее на 1,2 миллиона строк рукописного текста, который был сгенерирован с равномерным распределением сочетаний букв. Этот подход направлен на уменьшение вероятности возникновения галлюцинаций у искусственного интеллекта, что является одной из основных проблем в данной области. Генеральный директор компании Smart Engines, доктор технических наук Владимир Арлазаров, подчеркнул важность избегания галлюцинаций при анализе документов, поскольку эти данные используются в скоринговых моделях и бизнес-процессах в учетных системах.

По словам главы компании, основной задачей было разработать искусственный интеллект, способный распознавать даже такие сложные для восприятия рукописные слова, как "шиншилла", без использования языкового контекста. Это открывает новые перспективы для применения нейросетей в различных областях, где требуется точное и надежное распознавание текста.

Эксперт по документам, Арлазаров, подчеркнул, что для успешного распознавания документов, таких как паспорта и штампы о регистрации, важно читать информацию именно так, как она написана, а не делать предположения на основе языковых правил. Это позволяет избежать ошибок и недоразумений в процессе обработки данных. Важно учитывать контекст и специфику каждого документа, чтобы обеспечить точность и надежность распознавания информации.

Источник и фото - ria.ru

Российские ученые научили ИИ распознавать рукописное слово

Может быть интересно