Самая дорогая модель искусственного интеллекта Google, похоже, достигла важного рубежа: победа в 29-летней видеоигре.
Вчера вечером генеральный директор Google Сундар Пичаи торжественно опубликовал на X: \"Какой финиш! Gemini 2.5 Pro только что завершил PokГ©mon Blue!\"
Чтобы быть ясным, стрим Gemini Plays Pokemon был создан (по его собственным словам) 30-летним программистом, не связанным с Google, по имени Джоэл З. Но руководители Google поддерживали усилия.
Например, Логан Килпатрик, руководитель продукта в Google AI Studio, опубликовал в прошлом месяце, что Gemini продвигается вперед в завершении PokГ©mon и получил пятый значок (следующая лучшая модель имеет только 3 значка, хотя с другим агентом), что заставило Пичаи пошутить: \"Мы работаем над API, Artificial PokГ©mon Intelligence:)\ "
Почему PokГ©mon? Еще в феврале Anthropic подчеркнул прогресс, который достигли его модели искусственного интеллекта Claude в PokГ©mon Red, написав, что расширенное мышление и тренировка агентов у Клода дает ему значительное преимущество в выполнении более неожиданных задач, таких как игра в классическую игру. (PokГ©mon Red и Blue - различные версии игры для GameBoy, выпущенные впервые в 1996 году и связанные с долгоживущим франчайзом PokГ©mon). Даже есть канал Twitch Claude Plays Pokemon, на который ссылался Джоэл З как на вдохновение.
Несмотря на свой прогресс, Клод, кажется, пока не победил PokГ©mon Red. Это значит, что Gemini объективно лучше в игре? На своей странице в Twitch Джоэл З призвал зрителей: \"Пожалуйста, не считайте это бенчмарком того, насколько хорошо LLM может играть в Pokémon. Нельзя делать прямые сравнения - у Gemini и Claude разные инструменты и получают разную информацию.\"
И обе модели искусственного интеллекта нуждаются в помощи для игры - вот где вступают в игру упомянутые агентские утяжелители, предоставляющие моделям игровые снимки с дополнительной информацией, позволяя модели решить, как реагировать (что может включать обращение к специализированным агентам), а затем нажимать кнопку, которая соответствует инструкции ИИ.
Джоэл З признал, что были и другие вмешательства разработчиков, чтобы помочь Gemini завершить игру, но настаивает, что это не читерство.
Мои вмешательства улучшают общие способности принятия решений и аргументации у Gemini, - говорит он. - Я не даю конкретных подсказок - нет прохождений или прямых инструкций для определенных вызовов, таких как Mt. Moon. Единственное, что хоть сколько-нибудь близко, - это сообщить Gemini, что ему нужно поговорить с Рокет Грантом дважды, чтобы получить ключ лифта, что было ошибкой, которая позже была исправлена в Pokemon Yellow.\"
Кроме того, он сказал: \"Gemini Plays PokГ©mon по-прежнему активно развивается, и структура продолжает эволюционировать\".
Эта статья первоначально появилась на TechCrunch по адресу https://techcrunch.com/2025/05/03/google-gemini-has-beaten-pokemon-blue-with-a-little-help/