Сегодня 02 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду

Проблема галлюцинаций, то есть заведомо неверных ответов, которые предоставляют ИИ-модели, по-прежнему актуальна. Хотя ИИ-инструменты стали делать это реже, они всё ещё выдают неточные ответы, при этом подкрепляя их сверхубедительной риторикой, пишет Axios.

 Источник изображения: Steve A Johnson/unsplash.com

Источник изображения: Steve A Johnson/unsplash.com

Ложные ответы гораздо сложнее распознать, когда они звучат убедительно. Это растущая проблема, поскольку пользователи всё больше полагаются на ИИ для исследований, медицинских консультаций и других задач.

Исследование Йельской медицинской школы, проведенное в этом месяце, показало, что инструменты для ведения записей с помощью ИИ (ИИ-писцы) могут помочь в медицинской практике, но только в сочетании с профессиональными рецензентами. Участвовавшие в опросе студенты первого курса, которые редактировали свои клинические записи с помощью черновиков, сгенерированных ИИ, отметили, что в записях ИИ часто опускались важные детали, включая продолжительность симптомов. По словам двух третей студентов, эти записи были «полезны в качестве первого черновика», но 21 % отметили, что использование ИИ-писцов «может снизить способность научиться делать хорошие записи».

Согласно исследованию Гарвардского университета, при попытке специалистов Boston Consulting Group выявить ошибки в результатах работы ИИ модель реагировала не раскаянием и исправлением, а «бомбардировкой убеждением», прибегая к различным методам и даже к лести.

Компании в сфере ИИ пытаются уменьшить количество ложных ответов с помощью таких технологий, как генерация с дополненной информацией (RAG), или обоснование ответов релевантными документами и данными, но это всё равно не даёт 100-процентной точности.

В свою очередь, проверка результатов работы ИИ может занять время, сэкономленное при использовании ИИ-инструментов. Как показало опубликованное в марте исследование, сотрудники часто пренебрегают проверкой результатов, сгенерированных ИИ, поскольку мало кто обращает внимание на ошибки.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Студия создателя Deus Ex и System Shock перестанет делать игры — после провала Thick as Thieves в OtherSide осталось меньше десяти человек 8 мин.
Google не смогла отбиться от рекордного штрафа в €4,1 млрд в Европе 16 мин.
Кризис Xbox поставил под угрозу закрытия Obsidian — студию в ответе за Fallout: New Vegas, Pillars of Eternity и South Park: The Stick of Truth 59 мин.
Toyota собирается при помощи ИИ навести порядок в своей документации и терминологии 2 ч.
Некоторые смартфоны Google Pixel перестали издавать звуки, когда на них звонят 2 ч.
В сервисе Apple Hide My Email обнаружена уязвимость, позволяющая раскрыть настоящий адрес почты 2 ч.
Anthropic удалила из Claude скрытую защиту от дистилляции ИИ-моделей китайскими разработчиками 3 ч.
Представлено решение Curator.Scanner для поиска уязвимостей во внешней IT-инфраструктуре 4 ч.
Власти США предложили разработчикам ИИ создать единые стандарты для моделей 4 ч.
Министерство юстиции Бразилии рассекретило продолжение легендарной серии Nintendo 5 ч.
Amazon запустила достаточно спутников для запуска конкурента Starlink 19 мин.
ИИ подрывает экологические цели: выбросы углекислого газа у Amazon подскочили на 16 % в 2025 году 22 мин.
«Яндекс» разрабатывает новые ИИ-устройства — «Пин», «Хронум» и другие загадочные продукты 28 мин.
Инвестиции с кешбэком: NVIDIA вкладывается в создание ИИ-инфраструктуры партнёров в обмен на доход от её эксплуатации 2 ч.
Weave представила бытового робота Isaac 1 — он будет наводить порядок, пока хозяев нету дома 2 ч.
Будущая Xbox Project Helix, вероятно, будет лишена дисковода 2 ч.
В центре Москвы открыли новый флагманский магазин Xiaomi Store 2 ч.
Getty Images отказалась поглощать Shutterstock — помешал британский регулятор 2 ч.
Intel без лишнего шума подняла рекомендованные цены Core Ultra 7 270K Plus и Core Ultra 5 250K Plus 2 ч.
Microsoft сняла с производства бюджетные Surface Go и Surface Laptop Go — вместо них предлагает Dell XPS 13 2 ч.