80 лет Великой Победе!

Кубинские ученые создали собственную языковую ИИ-модель

Об этом сообщил профессор математики и вычислительной техники Александр Пьяд в интервью РИА Новости.

Новая модель искусственного интеллекта, названная CecilIA, уже обучена уникальным языковым особенностям, характерным именно для кубинского испанского. Этот проект стал первым в Латинской Америке, где была создана ИИ-модель, натренированная на национальной языковой базе.

По словам Пьяда, разработка CecilIA открывает новые возможности для использования искусственного интеллекта в различных сферах на Кубе. Эта модель может значительно улучшить качество автоматизированного перевода, анализа текста и других задач, требующих понимания и обработки испанского языка, уникального для данного региона.

Новые исследования в области языковых моделей стали возможны благодаря стажировке исследователей в Университете Аликанте в Испании. В марте началось сбор текстового корпуса для обучения модели, а в апреле было обработано около 300 тысяч документов - 300 миллионов слов из различных кубинских источников, включая газеты, книги и песни. Этот проект основан на Salamandra 2B, открытой академической разработке Барселонского центра суперкомпьютеров.

Исследователи вынуждены были признать, что для создания языковой модели, даже самой небольшой, на Кубе отсутствует необходимое оборудование. До недавнего времени не было доступных технологий, способных реализовать подобный проект с минимальными аппаратными ресурсами. Поэтому они приняли решение использовать испанские разработки в качестве основы для своей работы.

Новые предложения в начале, середине и конце текста:

Кубинская модель CecilIA, названная в честь главной героини романа "Сесилия Вальдес" Сирило Вильяверде, является не только технологическим инструментом, но и символом культурного наследия Кубы. Это сочетание традиций и инноваций делает проект уникальным и значимым для мирового сообщества.

По словам математика, название CecilIA не случайно выбрано – оно отражает глубокие корни кубинской истории и языка. Каждый аспект модели наполнен духом острова, что придает ей особую притягательность и значимость в контексте современных технологий.

Юдивиан Альмейда, директор Группы исследований искусственного интеллекта факультета математики, подчеркнул, что CecilIA обладает уникальной способностью взаимодействовать на испанском языке с акцентом на кубинскую лингвистическую традицию. Это открывает новые возможности для развития искусственного интеллекта в контексте многоязычной среды и культурного разнообразия.

Исследователи стремятся создать модель, которая не только учитывает язык, но также учитывает культурные, социальные и лингвистические особенности Кубы, включая местные выражения, идиомы и культурные отсылки, как пояснил Альмейда.

План разработчиков включает завершение второй фазы обучения, известной как "инструктивная настройка", к концу 2025 года. На этом этапе модель будет обучена выполнять задания, принимать различные роли, отвечать на вопросы и вести полноценные диалоги.

Успешное завершение этой фазы позволит модели не просто повторять слова, но и понимать их контекст и значимость в рамках кубинской культуры.

Источник и фото - ria.ru