Gemini 3 Flash против Pro: Google забрал 2025 год? Сравнение архитектуры, тестов и креатива.

На рынке LLM сейчас такой темп, что за ним физически сложно успевать. Новые модели выходят почти ежедневно: сегодня обсуждают Claude, вчера спорили про Gemini, а сегодня весь интернет затаил дыхание в ожидании GPT 5.2.

И тут Google выходит из тени со словами: «Секунду».

Пока внимание было приковано к OpenAI, Google без лишнего шума выпустил Gemini 3 Flash. Ни презентаций, ни фанфар — просто аккуратный анонс в X и модель уже доступна. Тайминг — почти идеальный.

В этом году Google ведёт себя как опытный стратег: пока все следят за главной фигурой на доске, он методично усиливает позиции по краям. И на этом не останавливается — на подходе ещё и Nano Banana 2 Flash.

Если раньше Gemini воспринимался как «нормальный, но не выдающийся», то теперь Google последовательно закрывает ключевые направления. Конкурентам становится тесно.


Немного контекста

В конце года Google выпустил Gemini 3 Pro — модель под сложную аналитику и рассуждения. Мы её уже разбирали, и тогда в комментариях всплыла странная деталь: после выхода Flash пользователи начали замечать, что Pro будто бы стала отвечать хуже.

Что это было — перераспределение ресурсов, субъективные ощущения или подкрутки на бэкенде — гадать бессмысленно. Поэтому вместо теорий мы просто взяли и протестировали обе модели в одинаковых условиях.


Что по цифрам

Gemini 3 Pro

Главное оружие Pro — контекстное окно. До 2 миллионов токенов. Это десятки часов видео, гигантские кодовые базы или целые библиотеки книг, загруженные за один раз. Тест Needle In A Haystack модель проходит с точностью около 99%.

В задачах на математику и программирование (MATH, HumanEval) результаты уверенно держатся выше 90%. Pro заточена под «медленное мышление»: она умеет строить длинные логические цепочки, проверять себя и не спешить с ответом. Там, где Flash может ускориться и ошибиться, Pro чаще останавливается и перепроверяет вывод.

В работе с кодом это особенно заметно. Pro понимает архитектуру проекта целиком: может рефакторить модули с учётом зависимостей или разбираться в легаси-коде, к которому никто не прикасался годами.

Google позиционирует Pro как решение для корпоративных задач, науки и R&D. Модель глубоко встроена в экосистему Google Workspace и Vertex AI. Да, она дороже и медленнее Flash — и это важно держать в голове.

Gemini 3 Flash сдвигает границу Парето в соотношении между производительностью, стоимостью и скоростью

Gemini 3 Flash

Flash неожиданно оказался сильнее, чем от него ждали.

На GPQA Diamond (экспертное логическое мышление) — 90%+, в мультимодальном MMMU — 80%+. Почти уровень Pro, но при этом Flash быстрее и заметно дешевле.

Контекст — 1 миллион токенов. Можно загрузить огромный документ, длинный диалог или кодовую базу целиком и не бояться, что модель «потеряет нить». Для автоматизации и корпоративных сценариев это огромный плюс: меньше костылей, меньше разбиений, меньше ошибок.

По скорости Flash обходит предыдущие версии и в некоторых сценариях даже Pro. Google явно оптимизировал модель под real-time-задачи: поиск, агентные системы, интерактивные интерфейсы.

С кодом всё более чем достойно. На SWE Bench Verified результаты на уровне тяжёлых моделей, но с меньшей задержкой и ценой. Генерация, объяснение логики, дебаг, рефакторинг — без сюрпризов, всё стабильно.

Flash фактически сдвигает границу Парето между качеством, скоростью и стоимостью.

Мультимодальность осталась сильной стороной: текст, изображения, аудио и видео в одном запросе. Модель умеет анализировать визуал, вытаскивать смысл из роликов и выдавать структурированные выводы — и делает это быстрее предшественников.

Ключевой ход Google — Flash теперь стоит по умолчанию в приложении Gemini и в AI-поиске. Пользователю не нужно разбираться в версиях — всё просто работает. Для разработчиков модель доступна через Gemini API, Google AI Studio и Vertex AI.

Gemini 3 Pro


Тесты

Логика

Простая загадка с подвохом:

Автобус едет со скоростью 88 миль в час. В последнем ряду — 5 человек, в предпоследнем — 6. Сколько людей в автобусе?

Flash дал несколько интерпретаций, отметил наиболее реалистичную и даже уточнил, какой именно подвох имелся в виду. Pro ответил коротко и строго — водитель тоже человек.

Обе модели справились.

В более сложной логической задаче Flash пошёл креативным путём и формально решил её, найдя лазейку в условиях. Pro же честно объяснил, почему задача в исходной формулировке нерешаема, сославшись на ограничения по количеству информации.

И да — технически Flash задачу решил.


Математика

Когда дело дошло до построения матриц и расчёта рангов элементов графа, обе модели уверенно стартовали… и одинаково споткнулись на финальном шаге.

Вывод простой: нейросети пока не заменяют студентов старших курсов в сложной математике без пошагового сопровождения.


Визуал и код

При восстановлении интерфейса по скриншоту Pro выглядел увереннее: аккуратнее разложил элементы и лучше попал в стилистику.

Зато в алгоритмической задаче с LeetCode обе модели выдали практически идентичное, оптимальное решение: жадный алгоритм, O(n), чистый код, понятные переменные и разбор примеров.

И вот тут возникает ключевой вопрос: если результат одинаковый, зачем платить больше и ждать дольше?


Тексты и креатив

Обе модели справились с креативной задачей — продать бесполезную вещь в стиле презентации Apple.
Pro был чуть точнее в деталях и шутках, Flash — глубже ушёл в философию и пафос. Тут уже дело вкуса.


Цена вопроса

И вот здесь начинается самое интересное.

  • Gemini 3 Flash:
    — ~$0.50 за 1 млн входящих токенов
    — ~$3 за генерацию
  • Gemini 3 Pro:
    — ~$2 за вход
    — ~$12 за выход

Разница — примерно в 4 раза.

С учётом того, что в большинстве тестов Flash показал себя на уровне Pro, экономическая целесообразность старшей версии для повседневных задач выглядит сомнительно.


Итог

Наблюдать за гонкой ИИ — удовольствие. И после всех тестов остаётся ощущение, что Gemini 3 Flash сейчас выглядит даже интереснее, чем ожидаемый GPT 5.2. Google в этом году явно проснулся и включился в игру по-настоящему.

Но без иллюзий: нейросети всё ещё ошибаются, галлюцинируют и уверенно выдают неверные факты. Это отличный второй пилот, но не автопилот.

Перепроверяем, думаем головой и используем с умом.

Если выбирать победителя в этой паре — Flash.
Pro мощнее в отдельных сценариях, но для 90% задач переплачивать просто не имеет смысла.

Спасибо, что читали. И да — с наступающим 🚀