Сегодня 02 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-модель Wildberries вошла в топ-3 русскоязычного бенчмарка MERA

Большая языковая модель BerryLM-XL, которая была дообучена специалистами RWB, вошла в тройку лидеров текстового рейтинга русскоязычного бенчмарка MERA. По итогам тестирования алгоритм получил интегральную оценку 0,835. Для сравнения, эталонная оценка на основе ответов людей на аналогичные вопросы Human Benchmark составляет 0,852.

 Источник изображения: Steve Johnson / Unsplash

Источник изображения: Steve Johnson / Unsplash

В настоящее время BerryLM-XL расположилась на третьем месте общего рейтинга MERA и на втором среди ИИ-моделей. Оценка алгоритма сформирована по результатам выполнения 15 заданий, предназначенных для проверки работы с русскоязычным текстом, оценке знаний, логики и прикладных навыков. В первую пятёрку также вошла созданная RWB модель BerryLM-v2 — она заняла пятое место с оценкой 0,810.

ИИ-модели семейства BerryLM используются в продуктах Wildberries, включая ИИ-ассистента для покупателей, а также инструменты сравнения и поиска товаров. В дополнение к этому модели интегрированы в инструменты для продавцов. Они помогают формировать ответы на отзывы и вопросы пользователей. Параллельно с этим ИИ-алгоритмы помогают автоматизировать внутренние процессы RWB. По оценке компании, совокупный эффект от использования ИИ-инструментов на базе моделей BerryLM превышает 1 млрд рублей дополнительной выручки в год.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Авторитетный инсайдер опроверг закрытие Obsidian Entertainment и работу студии над новой Fallout 51 мин.
Правительство США снова взломали: хакеры проникли в федеральную платформу для обмена разведданными 57 мин.
«Не можешь — научим, не хочешь — заставим»: Microsoft мобилизует 6000 сотрудников для помощи клиентам во внедрении ИИ 2 ч.
Браузер Opera получил продвинутую защиту от ввода вредоносных команд через буфер обмена 2 ч.
Google начала тестировать новую reCAPTCHA — пользователей просят показать руки в камеру, и не обязательно свои 2 ч.
ИИ оказался слишком дорогим: компании урезают сотрудникам доступ к ChatGPT и Claude 2 ч.
Студия создателя Deus Ex и System Shock перестанет делать игры — после провала Thick as Thieves в OtherSide осталось меньше десяти человек 3 ч.
Google не смогла отбиться от рекордного штрафа в €4,1 млрд в Европе 3 ч.
Кризис Xbox поставил под угрозу закрытия Obsidian — студию в ответе за Fallout: New Vegas, Pillars of Eternity и South Park: The Stick of Truth 3 ч.
Toyota собирается при помощи ИИ навести порядок в своей документации и терминологии 4 ч.