Поддержать команду Зеркала
Беларусы на войне
  1. «Судья глаз не поднимает, а приговор уже готов». Беларуска решила съездить домой спустя семь лет эмиграции — но такого не ожидала
  2. Синоптики обещают сильные морозы. При какой температуре могут отменить занятия в школах?
  3. «Только присел, тебя „отлюбили“». Популярная блогерка-беларуска рассказала, как работает уборщицей в Израиле, а ее муж пошел на завод
  4. 20 лет назад беларус был вторым на Играх в Италии, но многие считали, что его кинули. Рассказываем историю знаменитого фристайлиста
  5. Украинские контратаки под Купянском тормозят планы России на Донбассе — ISW
  6. «Масштаб уступает только преследованиям за протесты 2020 года». Что известно об одном из крупнейших по размаху репрессий дел
  7. Лукашенко подписал изменения в закон о дактилоскопии. Кто будет обязан ее проходить
  8. Электричка в Вильнюс и возвращение посольств. Колесникова высказалась о диалоге с Лукашенко
  9. В Беларуси ввели новый налог. Чиновник объяснил, кто будет его платить и о каких суммах речь
  10. «За оставшихся в Беларуси вступиться просто некому». Как государство хотело наказать «беглых», а пострадали обычные люди
  11. Завещал беларуске 50 миллионов, а ее отец летал с ним на вертолете за месяц до ареста — что еще стало известно из файлов Эпштейна
  12. Блогер Паук дозвонился в Минобороны. Там отказались с ним говорить, но забыли повесить трубку — вот что было дальше
  13. В нескольких районах Беларуси отменили уроки в школах из-за мороза. А что с садиками
  14. Похоже, время супердешевого доллара заканчивается: когда ждать разворот? Прогноз курсов валют
  15. Январь в Минске был холоднее, чем в Магадане, а чего ждать в феврале? Прогноз
  16. Лукашенко потребовал «внятный, конкретный, выполнимый» антикризисный план для региона с «ужаснейшей ситуацией»


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.