Browser Act: как браузерный агент оформил заказ в пиццерии за 2 минуты

Browser Act: как браузерный агент оформил заказ в пиццерии за 2 минуты

Вчера я увидел демо, которое разрушило моё представление о том, что умеют AI-агенты в браузере. Блогер Костя запустил Browser Act — бесплатный скилл для Claude Code — и попросил его оформить заказ в пиццерии. Полностью: от просмотра меню до оплаты. Заняло меньше двух минут. Без кода. Без настройки. Просто текстовая инструкция.

Что такое Browser Act

Browser Act — это скилл для AI-ассистентов вроде Claude Code, Cursor, Gemini или OpenCode. Он превращает вашего AI-ассистента в полноценного браузерного агента: открывает страницы, читает контент, кликает по кнопкам, заполняет формы, авторизуется и даже оформляет заказы. В отличие от классических скраперов, он работает с динамическими интерфейсами, обходит капчи и защиты от ботов.

Чем Browser Act отличается от обычного скрапера

Большинство инструментов для работы с вебом умеют одно: забирать текст со страницы. Browser Act идёт дальше — он взаимодействует с интерфейсом как живой пользователь. Он не только читает данные, но и кликает, заполняет поля, нажимает «Оформить заказ». Входит в аккаунты по логину и паролю и работает с защищёнными страницами. Спокойно проходит капчи и антибот-системы, потому что действует через реальный браузер. Переходит между страницами, проверяет корзину, заполняет формы доставки — всё в одном сценарии.

Как установить Browser Act

Скилл бесплатный. Вы платите только за токены вашего AI-ассистента. Установка занимает пару минут. Найдите скилл Browser Act в каталоге скиллов или по ссылке автора. Установите его в свой редактор — Claude Code, Cursor, Windsurf, Gemini, OpenCode, работает везде. Запустите ассистент и скажите: «Установи этот скилл». Пройдите авторизацию по ссылке — просто откройте её в браузере и нажмите «Hello». После этого Browser Act готов к работе. Никаких API-ключей, никакой настройки прокси.

Реальный кейс: заказ в пиццерии за 117 секунд

Костя специально за час собрал тестовый проект — пиццерию с каталогом, корзиной, авторизацией и оформлением заказа. Задача для Browser Act была многошаговой. Сначала открыть страницу меню и прислать список товаров. Потом войти в аккаунт по логину и паролю. Добавить в корзину ролл «Микаса», напиток «Тархун» и торт «Медовик». Перейти в корзину, нажать «Оформить заказ», заполнить форму доставки — имя Константин, телефон, адрес «улица Пушкина, дом Колотушкина». Нажать «Заказать» и подтвердить результат.

Browser Act справился со всем за 1 минуту 57 секунд. Костя проверил личный кабинет — заказ действительно появился: ролл, тархун, медовик. Агент самостоятельно прошёл по нескольким страницам, заполнил все поля и завершил сценарий.

Где применять Browser Act

После просмотра демо стало очевидно: это не игрушка, а рабочий инструмент для реальных задач. Можно попросить агента «прокликать все кнопки» и прислать список ошибок или битых ссылок — так вы тестируете интерфейсы. Можно автоматизировать отклики на вакансии на HeadHunter или LinkedIn — Browser Act заполнит формы отклика за вас. Сайты, требующие входа в аккаунт, больше не преграда для сбора данных. Рутинные операции вроде проверки баланса, выгрузки отчётов или обновления профилей тоже перекладываются на агента. А ещё Browser Act может заходить на сайт раз в день, проверять изменения и сообщать вам — получается мониторинг без написания кода.

Ограничения и что учитывать

Browser Act мощный, но не волшебный. Каждое действие в браузере тратит токены и время — простые задачи занимают секунды, сложные многошаговые сценарии уходят в минуты. Чем конкретнее промпт, тем лучше результат. «Оформи заказ» работает хуже, чем «добавь ролл Микаса, тархун и медовик, затем оформи заказ на имя Константин». И ещё один момент: доверяйте логины и пароли только проверенным скиллам. Browser Act требует авторизации — это нормально, но используйте уникальные пароли для тестовых аккаунтов.

Часто задаваемые вопросы

Browser Act платный?

Сам скилл бесплатный. Вы платите только за токены вашего AI-ассистента — Claude, GPT и т.д. Расход токенов минимальный, обычно несколько центов за задачу.

В каких редакторах работает Browser Act?

Claude Code, Cursor, Windsurf, Gemini, OpenCode, VS Code с AI-расширениями — любой редактор, поддерживающий MCP-скиллы или пользовательские инструменты.

Может ли Browser Act сломать мой аккаунт?

Теоретически агент может совершить нежелательные действия — удалить что-то или изменить настройки. Поэтому начинайте с тестовых аккаунтов и читайте, что агент собирается сделать, перед подтверждением.

Итог

Browser Act — это шаг от «AI читает интернет» к «AI работает в интернете». Он не просто извлекает данные, а выполняет задачи: логинится, кликает, заполняет, заказывает. Если вы тестируете интерфейсы, автоматизируете рутину или собираете данные с закрытых ресурсов — этот скилл сэкономит многие часы ручной работы. Попробуйте на тестовом проекте, как это сделал Костя, и придумайте свой сценарий.

← Все записи
← Все записи