Google представила обновлённую платформу Gemini 3 Deep Think — мощный инструмент на основе рассуждающего искусственного интеллекта, ориентированный на решение сложных задач в науке и инженерии. Разработка велась совместно с учёными для обработки неполных данных и задач без единственного правильного ответа. Новый режим доступен в приложении Gemini исключительно для подписчиков Google AI Ultra, а с 2026 года компания впервые открывает API для инженеров, исследователей и предприятий по заявке. Платформа вышла за рамки теории, предлагая практические применения, включая ИИ-агента Aletheia от Google DeepMind с механизмами проверки гипотез и итеративной корректировки решений.
В бенчмарках Gemini 3 Deep Think показал выдающиеся результаты: 48,4% в Humanity’s Last Exam без внешних инструментов, 84,6% в ARC-AGI-2, рейтинг Эло 3455 в Codeforces, уровень золотой медали в Международной математической олимпиаде 2025 года, а также в олимпиадах по химии и физике. В CMT-Benchmark модель набрала 50,5%, демонстрируя сильные навыки в теоретической физике. Aletheia оценили по пяти градациям достижений: в автономном режиме агент предложил пути решения трёх открытых задач математика Пала Эрдёша на нулевом уровне «незначительной новизны» и одной — на первом «минимальной новизны». На втором уровне «пригодном для публикации» результаты достигнуты в автономном, совместном с человеком и вспомогательном режимах. Из 700 нерешённых задач Эрдёша Aletheia решила 13, но лишь 4 впервые, а 9 имели существующие решения.
Разработчики отметили ограничения: ИИ склонен «неверно понимать вопрос таким образом, чтобы на него было легче ответить» и «крайне подвержен ошибкам по сравнению с людьми», не заменяя математиков. Для рынка это усиливает конкуренцию в ИИ для науки — доступ через API стимулирует интеграцию в исследования, снижая барьеры для предприятий, но подчёркивает зависимость от премиум-подписок. Пользователи-научники получат инструмент для ускорения гипотез, однако риски ошибок требуют человеческого контроля, потенциально повышая эффективность на 20–50% в задачах вроде моделирования, но не революционизируя фундаментальные прорывы.
Платформа Gemini 3 Deep Think открывает новые горизонты для исследований, предлагая мощные инструменты для обработки данных и решения научных задач. Интеграция API обещает революционизировать подход к научной работе.
Источник: https://openai.com/index/new-result-theoretical-physics

Комментарии(0)
Оставьте комментарий
Войдите, чтобы присоединиться к обсуждению