Добавить новость
103news.com
Все новости
Апрель
2025

Новые модели OpenAI галлюцинируют чаще - каждый третий их ответ неверный

Галлюцинации остаются одной из сложнейших проблем в сфере искусственного интеллекта. Обычно каждая новая ИИ-модель справляется немного лучше — выдает меньше недостоверной информации, чем предыдущие версии. Но, похоже, это не относится к o3 и o4-mini. Внутренние тесты OpenAI показали, что они галлюцинируют чаще, чем предыдущие «рассуждающие» модели компании (o1, o1-mini и o3-mini), а также чем их традиционные инструменты, например, GPT-4o.

При этом разработчики ChatGPT сами не до конца понимают, в чем тут дело. В техническом отчете о моделях o3 и o4-mini OpenAI признает необходимость дальнейших исследований, чтобы понять, почему улучшение аналитических способностей нейросети приводит к учащению случаев галлюцинаций. Хотя новые модели показывают лучшие результаты в программировании и математике, их склонность делать больше утверждений в целом приводит к парадоксальному эффекту: наряду с увеличением числа точных ответов растёт и количество ошибочных выводов.

Модель o3 галлюцинировала в ответ на 33% вопросов теста PersonQA — внутреннего бенчмарка компании для оценки точности знаний модели о людях. Этот показатель примерно вдвое превышает уровень галлюцинаций предыдущих «рассуждающих» моделей o1 и o3-mini, где частота ошибок составила 16% и 14,8% соответственно. Модель o4-mini показала ещё более тревожные результаты на PersonQA — выдавала ошибочные ответы в 48% случаев.

Сторонние испытания некоммерческой исследовательской лаборатории Transluce также выявили склонность модели o3 выдумывать действия, якобы совершенные для получения ответов. В одном из случаев o3 утверждала, что запускала код на MacBook Pro 2021 года «вне платформы ChatGPT», а затем вставила результаты в ответ. Хотя у o3 действительно есть доступ к некоторым инструментам, подобные действия она выполнить не способна. Кроме того, модель часто генерирует неработающие веб-ссылки, выдавая их за достоверные.

Галлюцинации могут способствовать генерации нестандартных идей и творческому «мышлению», однако они же делают модели малопригодными для сфер, где критически важна точность данных. Например, юридические фирмы вряд ли будут довольны ИИ, допускающим фактические ошибки в договорах. Один из перспективных методов повышения точности — интеграция веб-поиска. Например, GPT-4o с этой функцией достигает точности 90% в тесте SimpleQA.

В последний год отрасль переключилась на модели с развитым логическим мышлением, поскольку традиционные методы улучшения ИИ перестали давать значимый прогресс. Такие инструменты отлично справляются с разными задачами без необходимости в колоссальных вычислительных ресурсах и гигантских обучающих выборках. Однако проблему с галлюцинациями разработчикам еще предстоит решить.







Губернаторы России





Губернаторы России

103news.net – это самые свежие новости из регионов и со всего мира в прямом эфире 24 часа в сутки 7 дней в неделю на всех языках мира без цензуры и предвзятости редактора. Не новости делают нас, а мы – делаем новости. Наши новости опубликованы живыми людьми в формате онлайн. Вы всегда можете добавить свои новости сиюминутно – здесь и прочитать их тут же и – сейчас в России, в Украине и в мире по темам в режиме 24/7 ежесекундно. А теперь ещё - регионы, Крым, Москва и Россия.

Moscow.media


103news.comмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "103 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

103news.com — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.

Музыкальные новости




Спорт в России и мире



Новости Крыма на Sevpoisk.ru




Частные объявления в Вашем городе, в Вашем регионе и в России