GPT‑5: что нового в ChatGPT 5, чем он отличается от предыдущих версий и как смотрится на фоне конкурентов - 5OB

Кратко: почему GPT‑5 — важный релиз

Единая система с умной маршрутизацией: GPT‑5 автоматически решает, когда отвечать быстро, а когда «думать» дольше (расширенное рассуждение).
Реальный прирост в полезности: меньше галлюцинаций, лучше следование инструкциям, меньше угодничества (sycophancy).
Топ‑перформанс на практических задачах: кодинг (SWE‑bench Verified 74,9%; Aider Polyglot 88%), мультимодальная логика (MMMU 84,2%), математика (AIME 2025 — 94,6% без инструментов), здоровье (HealthBench Hard — 46,2%).
Новый уровень честности: лучше распознаёт невозможные или недоопределённые задачи и корректно сообщает о лимитах.
GPT‑5 Pro для максимальной глубины рассуждения: SOTA на GPQA (88,4% без инструментов) и меньше критичных ошибок.
Доступ для всех: GPT‑5 — модель по умолчанию в ChatGPT, с расширенными лимитами для платных планов, и fallback на GPT‑5 mini при превышении лимитов.

Что такое GPT‑5: единая «умная» система с маршрутизатором

Главная идея GPT‑5 — не просто более мощная модель, а единая система, которая:

включает «основную» быструю модель для большинства запросов;
включает «GPT‑5 thinking» (глубокое рассуждение) для трудных задач;
использует real‑time router — интеллектуальный маршрутизатор, который в реальном времени выбирает режим по типу диалога, сложности, необходимости инструментов и вашему намерению (например, фраза в подсказке «подумай тщательно над этим»).

Маршрутизатор обучается на реальных сигналах: на том, как пользователи вручную переключают модели, на рейтингах предпочтений ответов и на измеряемой корректности. Со временем он становится точнее — это важная инженерная часть «унификации», которая делает систему заметно более полезной в реальном мире.

Когда пользовательские лимиты достигаются, запросы продолжает обрабатывать соответствующая «mini»‑версия каждой модели. В перспективе OpenAI планирует интегрировать всё в один объединённый «мозг».

Почему это важно:

Вы получаете скорость там, где она важнее глубины.
Там, где цена ошибки высока (сложная математика, кодинг, медицинские вопросы), система автоматически «включает» более глубокое рассуждение.
Меньше необходимости вручную выбирать режим — логика выбора теперь встроена в систему.

Ключевые нововведения GPT‑5: меньше галлюцинаций, лучше следование инструкциям и стиль общения

OpenAI заметно прокачала то, что «чувствуется» каждый день:

Снижение галлюцинаций. По данным OpenAI, с включённым веб‑поиском на де‑идентифицированном трафике ChatGPT ответы GPT‑5 примерно на 45% реже содержат фактическую ошибку, чем у GPT‑4o. В режиме «thinking» GPT‑5 примерно на 80% реже ошибается, чем OpenAI o3.
Новые стресс‑тесты фактичности для открытых вопросов, включая LongFact и FActScore: «GPT‑5 thinking» показывает примерно в 6 раз ниже частоту галлюцинаций по сравнению с o3.
Больше честности и прозрачности: GPT‑5 лучше распознаёт, когда задача невозможна или инструменты недоступны, и внятно объясняет ограничения. В тестах с удалёнными изображениями (CharXiv) o3 уверенно «галлюцинировал» ответы 86,7% времени, у GPT‑5 — всего 9%. В боевом трафике доля «обманчивых» ответов снизилась с 4,8% (o3) до 2,1% (GPT‑5 thinking).
Меньше угодничества (sycophancy) и излишней «эмодзи‑доброжелательности»: модель меньше поддакивает, лучше уточняет, аккуратнее спорит по сути. В таргетированных оценках доля «слюнтяйских» ответов сокращена более чем вдвое (с ~14,5% до <6%) — без потери качества беседы.

Важное изменение в подходе к безопасности — переход от доминирующей стратегии «refusal only» к «safe completions»:

если можно безопасно ответить частично — модель делает это вместо необоснованного отказа;
если нужно отказать — объясняет почему и предлагает безопасные альтернативы.

Результат: больше полезности при той же или более высокой безопасности, особенно в «двойного назначения» темах (например, биология).

Письмо и креатив: GPT‑5 пишет глубже, точнее и менее шаблонно

Для миллионов пользователей ChatGPT — это прежде всего «помощник по текстам». GPT‑5 ощутимо сильнее:

держит сложную форму (белый стих, нерифмованный ямб, свободный верлибр);
передаёт культурные отсылки и образы без «плоских» клише;
помогает из сырых идей собирать тексты с хорошим ритмом и сюжетом;
лучше редактирует деловые документы — отчёты, письма, презентации.

OpenAI в материалах приводит параллельные тексты GPT‑4o и GPT‑5 на одной поэтической задумке: версия GPT‑5 ярче в образах, выпуклее в финале и точнее в культурных деталях. На практике это почти всегда конвертируется в более сильные письма, тосты, приветственные речи, статьи и сценарии.

Совет по использованию:

Прямо задавайте желаемую глубину: «Сохрани голос автора, усили разметку, добавь примеры и резюме для busy‑читателя».
Попросите «перевести» не только язык, но и стиль: минимализм, репортёрский тон, публицистика, «человечный корпоративный».
Уточняйте целевую аудиторию и канал: LinkedIn‑пост, письмо клиенту, пресс‑релиз, сайт. GPT‑5 лучше держит контекст и намерение.

Кодинг: от красивых фронтов до редактирования крупных репозиториев

GPT‑5 — лучший на сегодня кодовый ассистент OpenAI:

Сильнейший фронтенд «с одного промпта»: сборка красивых, отзывчивых сайтов и мини‑игр с адекватным чувством визуального вкуса (цвет, типографика, ритм, отступы, «воздух»).
Улучшенная отладка больших репозиториев, многошаговые правки кода.
Сильнее в multi‑language редактировании (по Aider Polyglot — 88%).
На SWE‑bench Verified — 74,9%, что подтверждает реальную пользу на инженерных задачах.

Примеры, которые OpenAI демонстрирует как «one‑prompt»:

мини‑игры (rolling ball runner, typing game),
пиксель‑арт‑генераторы,
визуализатор lofi,
барабанный симулятор.

Практические подсказки:

В промпте указывайте NFR’ы интерфейса: сетка, адаптив, шрифты, доступность (ARIA), состояния, «темы ночи/дня».
Просите комментировать архитектурные решения: зачем та или иная библиотека, как масштабировать, как тестировать.
Для «старых» репозиториев — дайте минимальный индекс (архитектуру, скрипты запуска и тестов, список известных багов). GPT‑5 лучше соотносит задачи и контекст.

Медицина: грамотнее, безопаснее, полезнее для «человека у руля»

В «здоровье» GPT‑5 показывает лучший прогресс OpenAI:

На HealthBench и особенно HealthBench Hard — новый уровень (46,2% на «Hard»).
Ведёт себя как «партнёр по размышлению»: proactively подсказывает, где стоит насторожиться, какие уточняющие вопросы задать врачу, как подготовиться к приёму.
Лучше подстраивается под контекст, уровень знаний и географию пользователя.

Важно: ChatGPT не заменяет врача. Роль GPT‑5 — помочь понять результаты, сформулировать вопросы, сопоставить варианты. В любых клинических решениях — финальное слово за медицинским профессионалом.

Полезные сценарии:

разбор анализов и выписок «человеческим языком»,
подготовка списка вопросов на приём,
сравнение рекомендаций разных гайдлайнов,
объяснение терминов и исследований.

Оценки и бенчмарки: не только «бумажные» рекорды, но и пользу в реальных задачах

По данным OpenAI, GPT‑5 ставит новые SOTA‑планки и там, где «зачёт на бумаге», и там, где важны реальные результаты:

Математика и наука:

AIME 2025 (без инструментов): 94,6%.
GPQA (сложные научные вопросы): GPT‑5 Pro — 88,4% без инструментов, новый SOTA.
HMMT: очень высокие показатели на разных режимах.

Кодинг:

SWE‑bench Verified: 74,9% (реальные инженерные задачи).
Aider Polyglot: 88% (multi‑lang редактирование кода).

Мультимодальность (изображения, видео, графики, диаграммы):

MMMU: 84,2% (вузовский уровень),
MMMU Pro: сильные результаты на «grad‑level»,
VideoMMMU: уверенное видео‑рассуждение (с ограничением по кадрам),
CharXiv‑Reasoning: научные фигуры и графики,
ERQA: пространственная мультимодальная логика.

Инструкции и «агентность»:

Scale MultiChallenge: сильный рост в многоходовом следовании инструкциям,
BrowseComp: заметно лучшее агентное веб‑бронирование/поиск,
Tau2‑bench: повышенная точность function calling,
COLLIE: корректность в свободном письме по инструкциям.

Экономически ценные задачи:

На внутренних тестах OpenAI по «комплексным видам знания» GPT‑5 с рассуждением сравним или лучше экспертов примерно в половине случаев, при этом обгоняя o3 и ChatGPT Agent на широкой корзине задач (право, логистика, продажи, инженерия).

Важно: OpenAI акцентирует, что все модели оценивались на «высоком уровне усилий рассуждения». Это отражает верхнюю границу того, что пользователь может видеть в ChatGPT, когда система решает «включить» глубокое мышление.

Быстрее и экономнее: больше качества при меньшем «объёме мыслей»

В сравнениях с OpenAI o3 GPT‑5 (в режиме «thinking»):

достигает тех же или лучших результатов, генерируя на 50–80% меньше выходных токенов на ряде сложных задач (визуальная логика, агентный кодинг, научное решение задач).
Практически это означает: быстрее приходят ответы, меньше стоимость расчёта (для поставщика), больше «полезного на токен» (для пользователя).

Для команд и компаний это критично: высокая глубина без «словесной воды» и с меньшей задержкой.

Честность, безопасность и «safe completions»: меньше «пустых отказов», больше полезной сути

Разработчики OpenAI признают, что «жёсткое» обучение отказам (refusal‑based) является грубоватым инструментом, особенно в темах двойного назначения. GPT‑5 переносит акцент на «safe completions»:

если можно ответить безопасно на высоком уровне — модель отвечает;
если нужно отказать — объясняет и предлагает безопасные альтернативы.

В тестах это дало:

более тонкую навигацию в задачах с неясными намерениями,
меньше ложных отказов,
более высокую полезность при той же (или большей) безопасности.

Для «био и химии» OpenAI классифицирует «GPT‑5 thinking» как High capability и включает многослойные барьеры: threat‑моделирование, обучение безопасным комплишенам, всегда‑включённые классификаторы и мониторы рассуждения, чёткие пайплайны эскалации. Проведено 5000+ часов ред‑тиминга с партнёрами (CAISI, UK AISI).

Персонализация и стили: новые пресеты и лучшее следование кастом‑инструкциям

GPT‑5 лучше «держит» ваши инструкции и тон. Вместо длинных промптов с «характером», доступны готовые пресеты‑личности (исследовательский превью): Cynic, Robot, Listener, Nerd.

Их можно включать/выключать в настройках и подстраивать под свой стиль общения.
Все новые личности проходят планку по снижению sycophancy.

Это не косметика — steerability выросла. Итог: меньше «перепрошивки» промптов и больше предсказуемости поведения ассистента.

GPT‑5 Pro: когда нужно «думать ещё дольше»

Для самых сложных задач OpenAI предлагает GPT‑5 Pro — преемника o3‑pro:

масштабируемое, но эффективное параллельное test‑time compute,
более полные и точные ответы,
SOTA на GPQA, меньше крупных ошибок, сильен в медицине, науке, математике и коде.

На 1000+ задачах реального мира эксперты предпочли GPT‑5 Pro ~67,8% времени, отмечая релевантность, полезность и полноту.

Доступ, планы и «как включить»

GPT‑5 — модель по умолчанию в ChatGPT вместо GPT‑4o, OpenAI o3, o4‑mini, GPT‑4.1, GPT‑4.5 для авторизованных пользователей.
Платные пользователи всё ещё могут явно выбрать «GPT‑5 Thinking» в селекторе модели или написать в промпт «подумай тщательно над этим», чтобы гарантировать режим рассуждения.
Роллаут: Plus, Pro, Team и Free — уже начинают получать доступ; Enterprise и Edu — через неделю.
Разработчики могут начать кодить с GPT‑5 в Codex CLI, авторизовавшись учёткой ChatGPT.
Лимиты:
- Pro — безлимитный GPT‑5 и доступ к GPT‑5 Pro.
- Plus и Team — комфортный «дефолт» для повседневной работы, лимиты выше, чем у Free.
- Free — по достижении лимитов переключение на GPT‑5 mini (шустрый и достаточно умный «младший»).

GPT‑5 vs GPT‑4o и OpenAI o3: в чём суть прогресса

Ниже — конспект отличий. Цифры — по материалам OpenAI (неофициальное сводное резюме).

Критерий	GPT‑4o	OpenAI o3	GPT‑5
Единая система с маршрутизатором	Нет	Частично	Да: быстрый + «thinking» + роутер
Режим глубокого рассуждения	Ограниченный	Сильный упор	Встроен, умный выбор + Pro‑вариант
Фактичность и галлюцинации	База	Лучше 4o	С заметным снижением ошибок; 6× меньше галлюцинаций vs o3 на открытых фактуальных бенчах (в «thinking»)
Честность и «анти‑обман»	Средняя	В сложных режимах бывают ошибки уверенности	Ниже «обманчивости» (2,1% vs 4,8% на прод‑трафике)
Кодинг	Хорошо	Сильное рассуждение	Топ по SWE‑bench Verified (74,9%) и Aider Polyglot (88%)
Письмо и креатив	Хорошо	Фокус на reasoning	Глубже и «литературнее» в широкой воронке задач
Мультимодальность	Сильная	Сильное reasoning	Новый пик на MMMU/VideoMMMU/CharXiv
Инструкции и агентность	Норм	Сильный reasoning	Сильный рост в MultiChallenge, BrowseComp, Tau2
Эффективность «thinking»	—	Хорошо	Лучше при меньшем объёме токенов (50–80% сокращение)
Персонализации	Базово	Базово	Новые пресеты (Cynic/Robot/Listener/Nerd), лучшее следование
Безопасность	Refusal‑heavy	—	«Safe completions»: более тонкая полезность в dual‑use темах

Сравнение с конкурентами: Claude, Gemini и open‑weights

Ниже — высокоуровневый взгляд, без «соревнования» цифрами из закрытых бенчей. Я фокусируюсь на ощущении продукта и типичных кейсах.

Claude (семейство Claude 3/3.5 от Anthropic)
Сильные стороны: стиль письма и «деликатный» диалог, хорошие правки текста, аккуратная фактичность, бережная безопасность. В ряде задач «редактура и объяснение сложного простыми словами» — эталонный опыт. В инструментальных цепочках — уверенный исполнитель. В корпоративной среде — ценится за аккуратность и «мягкий» UX.
Где GPT‑5 выглядит сильнее: мультимодальная логика (особенно видео и научные фигуры), «агентность» в веб‑поиске/браузинге, снижение галлюцинаций на открытых фактуальных бенчах, кодинг на реальных трекерах (SWE‑bench Verified), честность в условиях недоопределённости. Плюс — единая система с умным роутером и Pro‑вариантом.
Google Gemini (семейство 1.5 Pro/Flash)
Сильные стороны: длиннющий контекст, мультимодальность; в экосистеме Google — интеграции и разработка с данными/доками, видео/изображениями, инструментами Google. Для задач «положи сюда 300‑страничный документ и навигируй» — крайне удобно.
Где GPT‑5 выглядит сильнее: глубина рассуждения на сложных научных/математических вопросах (по данным OpenAI), честность и снижение галлюцинаций в открытых бенчах, «агентная» работа в браузинге, реальный кодинг (SWE‑bench Verified, Aider Polyglot), а также «умный роутер» между быстрым и «thinking».
Open‑weights (Llama, Mistral и др.)
Сильные стороны: приватность, контроль, кастом‑fine‑tuning, низкая стоимость владения на своём железе, гибкость интеграций. Для компаний с жёсткими комплаенс‑трековками это решающий плюс.
Где GPT‑5 выглядит сильнее: «из коробки» на широкой корзине задач (особенно мультимодальных и «агентных»), фактичность/честность, письма/кодинг/здоровье. Для критичных задач open‑weights часто требуют серьёзной инженерии вокруг.

Итого:

Ещё год назад можно было сказать «выбирайте по стилю и стоимости». Сегодня в ряде «экономически важных» задач GPT‑5 демонстрирует реальное преимущество по качеству и стабильности.
Если ваш фокус — длиннющие контексты и плотная интеграция с Google‑средой, Gemini — по‑прежнему хороший выбор.
Если важна приватность и контроль — open‑weights.
Для редакторских задач и «сопровождающей» аналитики — Claude остаётся сильным, но GPT‑5 догнал/обошёл по важным метрикам и честности.

Где GPT‑5 реально меняет правила игры

Продуктовые команды: быстрое прототипирование интерфейсов «с одного промпта», генерация дизайн‑системных примеров, фиксы в реальных кодовых базах, аналитический разбор логов/диаграмм/таблиц.
Аналитики и консультанты: мультимодальные разборы презентаций и графиков, сборки отчётов с источниками (с безопасными комплишенами), подготовка «пакетов вопросов» для разговоров с экспертами.
Маркетинг и контент: исследования, брифы, тексты в нужном голосе, локализация с переносом смысла и ритма.
Образование: объяснения сложных тем с разными стилями подачи, «сократ‑режим» вопросов‑наводок, проверка понимания.
Здоровье: грамотная подготовка к визиту к врачу, расшифровка результатов с оговоркой «не диагноз», навигация по гайдлайнам и терминам.
DevOps/инфраструктура: «агентные» цепочки для рутин (поиск, чтение доков, пошаговые планы), аккуратный отказ при недоступности инструментов (меньше ложных «сделано»).

Практические советы: как «раскрыть» GPT‑5

Подсказка «подумай тщательно над этим» включает reasoning более явно. Туда же: «пройди шаги 1–2–3», «объясни альтернативы и компромиссы».
Форматируйте ожидание: «верни план, затем код, затем тесты», «сначала спроси уточнения, если контекст недостаточен».
Для кодинга — давайте минимум контекста о проекте: структура, зависимости, тесты, CI. GPT‑5 умеет, но не телепат.
Для фактуры — включайте web‑поиск, но задавайте ограничения (источники, даты, списки ссылок).
В письмах — задавайте целевую аудиторию, голос, длину, обязательные «усилители» (примеры, call‑to‑action, резюме в начале).
Используйте пресеты‑личности, если часто пишете в одном стиле; это сокращает «разогрев» промптов.
Для задач «двойного назначения» просите безопасную детализацию «только на высоком уровне»: GPT‑5 обучен делать это правильно.

Ограничения и этика

GPT‑5, несмотря на прогресс, не всеведущ. Всегда проверяйте критичные факты и код в production‑сценариях.
В медицине ChatGPT не заменяет специалиста; используйте как «интеллектуального переводчика» и помощника.
В «bio/chem» и других чувствительных областях — строго следуйте законам и внутренним политикам, GPT‑5 будет частично отвечать или отказывать по «safe completions».

Что под капотом

Обучение на суперкомпьютерах Microsoft Azure AI.
Новый стек безопасности: threat‑моделирование, safe completions, мониторы рассуждения, пайплайны enforcement.
Интеллектуальный роутер, обучаемый на реальных сигналам взаимодействия и корректности.

FAQ

Чем GPT‑5 отличается от GPT‑4o?
Существенно лучше в фактичности, честности, мультимодальной логике и кодинге; добавлена умная маршрутизация между быстрыми ответами и глубоким рассуждением; меньше угодничества, лучше следование инструкциям и персонализация.
Что такое GPT‑5 Thinking и GPT‑5 Pro?
Thinking — режим с расширенным рассуждением, который система включает автоматически на сложных задачах (или по вашей просьбе). GPT‑5 Pro — отдельный вариант для максимальной глубины, который чаще всего даёт самые полные и точные ответы на экстремально трудные вопросы.
Как «включить» рассуждение вручную?
Напишите в промпт: «подумай тщательно над этим», «пройди шаги 1–2–3», «обоснуй альтернативы и риски». Или выберите «GPT‑5 Thinking» в селекторе модели.
Доступен ли GPT‑5 бесплатно?
Да, GPT‑5 — дефолт для всех авторизованных пользователей. Разница — в лимитах: у Free лимиты ниже, после их достижения — переключение на GPT‑5 mini. Платные планы дают большее/безлимитное использование и доступ к Pro.
Поддерживается ли кодинг из CLI?
Да, через Codex CLI (войти учёткой ChatGPT). Это удобно для разработчиков, чтобы быстро «разговаривать» с моделью из терминала.
Насколько он безопасен?
Выше, чем предыдущие модели, благодаря «safe completions» и многослойной защите. При этом GPT‑5 старается быть максимально полезным в рамках безопасных границ.

Вывод: GPT‑5 — не просто ещё один номер, а новая «норма» полезности

С релизом GPT‑5 разговоры про «тот же ChatGPT, но побыстрее» теряют смысл. Это действительно новая ступень: система, которая сама выбирает, когда думать глубже; которая стала заметно честнее; которая лучше пишет, кодит, разбирает графики и видео; которая полезнее в медицине, но осторожнее в рисковых доменах.

Если вы:

создаёте цифровые продукты — это ваш лучший «второй разработчик» на сегодня;
пишете и редактируете — получите больше «литературности» и точности;
работаете с аналитикой — мультимодальная логика и честная сигнализация ограничений экономят часы;
учитесь или обучаете — GPT‑5 даёт лучшие объяснения и контроль над формой;
в медицине — он поможет подготовиться к диалогу с врачом и понять результаты.

На фоне конкурентов GPT‑5 выглядит как новый стандарт «разумного» ассистента общего назначения: меньше «покивали и согласились», больше «довели до результата». А если вам нужно ещё глубже — есть GPT‑5 Pro.

С практической точки зрения — просто начните им пользоваться. Чем больше реальных задач вы на него повесите, тем ярче заметите: от «проще и быстрее» до «по‑другому уже не хочется».

Примечание об источниках: конкретные метрики (AIME 2025, SWE‑bench Verified, Aider Polyglot, MMMU, HealthBench и др.), а также описанные механики маршрутизации, безопасности и доступности взяты из официальной информации OpenAI о GPT‑5.