22.05.2026 Обзор

Google I/O 2026: Gemini Omni, Spark и почему Google бросает спагетти на стену

Google выпустила статью под названием «100 вещей, которые мы анонсировали на Google I/O 2026». Сто. Вещей. Это не конференция — это лавина. За три часа ключевого доклада компания представила новое семейство моделей Gemini 3.5, видеогенератор Omni, облачного агента Spark, обновлённую платформу Genie 2 с картами, AI-очки в партнёрстве с Warby Parker, систему маркировки SynthID, которую подхватывает даже OpenAI, и ещё девяносто с чем-то мелочей. Я был на мероприятии, тестировал инструменты, разговаривал с людьми, которые их строили, и у меня сложилось одно впечатление: Google больше не гонится за званием самой умной модели. Он гонится за то, чтобы ИИ был везде — и пусть пользователи сами решат, что приживётся.

Что такое Google I/O 2026

Google I/O — ежегодная конференция для разработчиков, но в 2026 году она превратилась в демонстрацию экосистемной стратегии. Если в 2025 году фокус был на интеграции — VO3, Flow, Android XR, Project Mariner — то в 2026-м акцент сместился на масштабирование и ценообразование. Google не показал прорывной модели, которая раздавила бы GPT 5.5 или Claude Opus 4.7 на всех бенчмарках. Вместо этого он показал модель, которая стоит в три раза дешевле, работает втрое быстрее и при этом держится на том же уровне интеллекта. Это другая игра — не «кто умнее», а «кто выгоднее в продакшене».

Ключевой тезис конференции можно свести к одной фразе: ИИ должен исчезнуть как отдельный продукт и появиться как воздух — везде, всегда, незаметно. Но есть и обратная сторона: когда ты запускаешь сто продуктов одновременно, ни один из них не получает должного внимания. И пользователи начинают путаться.

Gemini 3.5 Flash: скорость важнее интеллекта

Самая обсуждаемая модель конференции — Gemini 3.5 Flash. Это не флагман. Флагман, Gemini 3.5 Pro, обещают позже. Flash — это компактная, быстрая и дешёвая версия, которая при этом держится на уровне Claude Opus 4.7 и GPT 5.5 по общему интеллекту. На бенчмарках кодинга Terminal Bench она занимает место между GPT 5.5 и Opus 4.7, а на SWE-bench Pro уступает обоим. Но там, где она вырывается вперёд, — это агентные задачи. На бенчмарках для агентов Gemini 3.5 Flash обходит и Anthropic, и OpenAI.

Главное преимущество — соотношение скорости к интеллекту. Google показал график, где по горизонтали скорость, а по вертикали — уровень интеллекта. Gemini 3.5 Flash сидит почти на одной линии с Claude Opus 4.7 по интеллекту, но работает более чем в два раза быстрее Gemini 3.1 Pro и более чем в три раза быстрее GPT 5.5 и Claude Opus. Для разработчиков, которые запускают агентов в продакшене, это не просто цифры — это экономика. Модель, которая отвечает втрое быстрее, позволяет обслуживать втрое больше пользователей на том же железе или снизить задержку до уровня, при котором ИИ-интерфейс начинает чувствоваться мгновенным.

Но настоящий удар по конкурентам — цена. Входящие токены для Gemini 3.5 Flash стоят $1.50 за миллион, исходящие — $9. Для сравнения: Claude Opus 4.7 берёт $5 за вход и $25 за выход, а GPT 5.5 — $5 за вход и $30 за выход. То есть Flash не просто быстрее — он в несколько раз дешевле. Если вы строите продукт, где маржа важна, это меняет выбор модели с эмоционального («у кого лучше бенчмарки») на экономический («сколько я заплачу за миллион запросов»).

Gemini Omni: видео из любого входа

Вторая модель, представленная на I/O, — Gemini Omni. Это не текстовая модель и не просто видеогенератор. Omni задуман как «anything-in, anything-out» система, которая сейчас принимает текст, изображения, видео и аудио и выдаёт видео, а в будущем сможет выдавать любой модальности. Команда Omni описывает её как «nano banana для видео» — то есть инструмент, который понимает естественный язык и редактирует видео, сохраняя при этом консистентность персонажей.

На практике это работает так: вы загружаете фото себя, и модель генерирует видео, где вы объясняете квантовые вычисления на доске. Или вы загружаете 11-секундное видео с мечом-лазером и просите превратить его в пиксель-арт — модель меняет стиль, сохраняя ключевые объекты. Или вы просите добавить в существующее видео обезьяну, которая уворачивается от меча — и она появляется в кадре. Пока что Omni генерирует только по 10 секунд за раз, но это уже не игрушка — это инструмент для создания эксплейнеров, маркетинговых роликов и прототипов сцен.

Что отличает Omni от конкурентов вроде VO или Kling, — это grounding в мировых знаниях. Когда вы просите «claymation-эксплейнер о фолдинге белков», модель не просто рисует глиняные фигурки — она встраивает научно точную информацию о том, как аминокислоты складываются в альфа-спирали и бета-листы. То есть видео одновременно является и визуальным контентом, и образовательным материалом. Для EdTech и научной коммуникации это качественный сдвиг: раньше нужна была команда из аниматора и научного консультанта, теперь — один промпт.

Есть и функция аватара. Вы снимаете короткое селфи-видео, и модель запоминает вашу внешность и голос. После этого можно генерировать видео, где вы сами объясняете темы, играете в баскетбол или сражаетесь с собственным клоном. На демонстрации результат был смешанным: сходство распознавалось, но пропорции тела иногда уходили в фантастику, а движения — в физически невозможные. Тем не менее, для маркетинга, персональных брендов и образовательных каналов это уже полезно — особенно если учитывать, что альтернатива — студийная съёмка с хромакеем и монтажёром.

Gemini Spark: агент, который живёт в облаке

Если Omni — про творчество, то Spark — про автоматизацию. Это ответ Google на OpenClaw и Hermes, но с ключевым отличием: Spark работает не на вашем компьютере и не на VPS, а полностью в облаке Google. Это значит, что агент продолжает работать, даже когда ваши устройства выключены. Вы можете поставить ему задачу «каждое утро присылай мне мотивационное письмо» или «суммаризируй новости и запиши в документ» — и он будет делать это регулярно, без вашего участия.

Каре, CTO Google DeepMind, описывал Spark как полноценный компьютер в облаке, который имеет доступ к вашей почте, календарю, Google Drive и может выполнять действия от вашего имени. Примеры из блога Google: inbox summary по запросу, сбор информации из писем и календаря в единую таблицу, создание рабочих процессов по расписанию. Spark умеет учиться новым навыкам: вы показываете ему, как выполнять рутинную задачу, и он запоминает.

Это важно, потому что меняет модель доверия. Когда агент работает локально — как OpenClaw — вы видите, что он делает, и можете в любой момент остановить. Когда агент работает в облаке Google, вы доверяете инфраструктуре компании, которая зарабатывает на рекламе и уже анонсировала внедрение рекламы в ИИ-продукты. Вопрос «хочу ли я, чтобы Google знал о моих финансах, переписке и рабочих процессах» становится не абстрактным, а практическим — особенно на фоне новости о том, что OpenAI теперь тоже собирает банковские данные через Plaid внутри ChatGPT.

Genie 2, очки, SynthID и хаос выбора

Помимо моделей и агентов, Google показал несколько продуктов, которые говорят о более широкой стратегии. Genie 2 — платформа для создания интерактивных миров — теперь поддерживает grounding в реальных картах. Вы выбираете локацию на Google Maps, добавляете персонажа — например, обезьяну на роликах — и получаете интерактивную сцену, где персонаж перемещается по реальным улицам Сан-Диего. Это не просто генерация: это связь между виртуальным контентом и геопространственными данными, и она открывает сценарии от геймификации туризма до обучения городскому ориентированию.

AI-очки, созданные в партнёрстве с Gentle Monster и Warby Parker, выходят осенью в двух версиях: с камерой и аудио (как Meta Ray-Ban) и с дисплеем. Дата выхода версии с дисплеем не названа. Очки умеют всё то же, что и конкуренты от Meta — переводить речь, отвечать на вопросы о том, что вы видите, управлять звонками — но Google подчёркивает, что они «предназначены быть включёнными всё время». Это другая философия: не гаджет, который вы достаёте по необходимости, а второй слой восприятия, который постоянно работает в фоне.

SynthID — система невидимой маркировки ИИ-контента — получила поддержку конкурентов. OpenAI, ElevenLabs, Cacao и другие компании заявили, что будут внедрять этот стандарт. Это редкий случай, когда конкурирующие платформы договариваются об общем протоколе, и он говорит о том, что проблема дипфейков и дезинформации стала настолько острой, что даже врамы признают: без единого стандарта ни одна компания не справится.

Но за всем этим многообразием скрывается проблема: Google запустил слишком много пересекающихся продуктов. Для видео есть Flow, VO и Gemini Omni. Для изображений — Imagine и Nano Banana. Для кода — AI Studio, Anti-Gravity и генерация прямо в AI Search. Для сайтов — полдюжины инструментов с ИИ. Пользователи, которым Google обещает простоту, внезапно обнаруживают, что им нужно решать, в каком из шести продуктов делать одно и то же. Это не интеграция — это фрагментация, замаскированная под инновацию.

Часто задаваемые вопросы

Чем Gemini 3.5 Flash отличается от Gemini 3.5 Pro?

Flash — компактная и быстрая версия, ориентированная на агентные задачи и API-использование. Pro — флагман, который выйдет позже и, вероятно, превзойдёт Flash на сложных задачах вроде математики и научного рассуждения. Flash выигрывает в цене и скорости.

Безопасно ли давать Spark доступ к Gmail и календарю?

Технически Google использует те же механизмы авторизации OAuth, что и другие приложения. Но стратегически это означает, что ещё один аспект вашей жизни — переписка, расписание, документы — становится доступен для анализа ИИ в облаке. Если вы обеспокоены приватностью, ограничьте доступ или используйте локальных агентов вроде OpenClaw.

Можно ли использовать Gemini Omni бесплатно?

Нет, Omni доступен только на платных тарифах: AI Plus, Pro или Ultra. Google также снизил цены: новый тариф Ultra стоит $100 в месяц, а старый Ultra снижен с $250 до $200. Минимальный платный тариф начинается с $7.99.

Итог

Google I/O 2026 — это конференция о количестве, а не о качестве отдельного прорыва. Gemini 3.5 Flash не раздавил бенчмарки, но он раздавил цены. Omni не заменил киностудию, но он заменил аниматора для 10-секундных эксплейнеров. Spark не изобрёл агента, но он сделал его облачным и постоянным. Google бросает спагетти на стену — десятки продуктов, функций, тарифов, моделей — и смотрит, что прилипнет. Некоторые вещи исчезнут через год. Другие станут инфраструктурой, которую мы перестанем замечать.

Главный вывод для разработчиков и бизнеса: выбор ИИ-модели в 2026 году — это не выбор «лучшей», а выбор «достаточно хорошей для моей задачи по моей цене». Gemini 3.5 Flash доказывает, что скорость и стоимость могут перевесить последние проценты на бенчмарках. А Omni и Spark показывают, что следующая граница конкуренции — не в моделях, а в том, как модели встраиваются в рабочие процессы и творческие процессы. Кто сделает ИИ невидимым — тот выиграет. Но пока что Google сделал ИИ очень заметным своим количеством.