Сравнительный обзор 🦾 ИИ-агенты

Anthropic Computer Use vs AgentQL 2026: developer-API против query-language

Сравнили два инструмента для агентов: Computer Use от Anthropic — vision-based примитив на скриншотах, и AgentQL — query-language над Playwright. Разные ниши, разные цены, разный потолок.

📅 · ✍️ Редакция AIRatings · ⏱️ ~27 мин чтения · 💬 Обсуждение

Anthropic Computer Use и AgentQL часто появляются в одних и тех же роадмапах команд, которые хотят автоматизировать веб-задачи. Но это не дуэль одинаковых продуктов: Computer Use — это developer-API от Anthropic Computer Use, который смотрит на скриншот экрана и возвращает действия (клик, набор текста, скролл), а AgentQL от Tinyfish — это структурированный query-language поверх Playwright, который описывает элементы страницы и адаптируется к смене вёрстки.

Мы держим оба ключа в продакшене редакции AIRatings и за полгода прогнали через них больше двух сотен сценариев — от скрейпинга цен с маркетплейсов до полу-RPA внутри корпоративного SaaS. Короткий спойлер: Computer Use берёт там, где нужна гибкость и работа с произвольным UI (включая десктоп через VM), AgentQL — там, где нужна предсказуемость, дешевизна и стабильность при изменениях сайтов. Если вас интересует расширенная картина категории, начните с общего обзора ИИ-агентов.

Дальше — 15 подтем с конкретикой по цене, скорости, доступности из РФ, безопасности и сценариям, где выигрывает каждый.

1

Карта подгрупп: что эти два сервиса реально делают

Перед выбором

Команда смотрит видео с Anthropic Computer Use, где Claude сам бронирует столик, и ставит его в спринт. К концу спринта выясняется: для скрейпинга карточек товаров с Wildberries это был не тот инструмент. AgentQL решил задачу за полдня и за десятые доли цены.

Anthropic Computer Use и AgentQL формально оба в категории ИИ-агентов, но в реальности живут в разных подгруппах. Computer Use — это computer-use API от крупного LLM-провайдера. Anthropic даёт три tool-примитива: computer (скриншот, клик, мышь, клавиши), text_editor (просмотр и редактирование файлов) и bash (shell-команды). Никакого готового интерфейса, никакого консьюмерского продукта — разработчик собирает агента сам, на своей инфраструктуре, и платит за токены Claude по обычным API-тарифам.

AgentQL устроен иначе. Это developer tool узкого назначения: query-language для веб-страниц, обёртка над Playwright с AI-слоем. Разработчик пишет структурированный запрос (синтаксис близок к GraphQL), AgentQL находит на странице элементы по описанию и возвращает их Python- или JS-объектами. Никаких скриншотов как первичного канала, никакого desktop-control, никакого выполнения произвольных bash-команд — только web.

Подгруппы: developer-API vs query-language над PlaywrightAnthropic Computer Use — vision-based developer-API, AgentQL — структурированный query-language поверх PlaywrightПодгруппы внутри категории ai-agentsAnthropic Computer UseПодгруппа: computer-use агентыКанал: screenshot + Claude reasoningОбъект управления: весь компьютерTools: computer / text_editor / bashГотовый продукт: нет, только примитивыКому: разработчик AI-агентов с инфройИсточник: docs.anthropic.com/.../computer-useAgentQLПодгруппа: open-source-style web toolКанал: HTML + AI-разметка элементовОбъект управления: только браузерСлой: query-language над PlaywrightГотовый продукт: SDK + REST API + Chrome extКому: Python/JS dev с опытом PlaywrightИсточник: docs.agentql.com

Из карты следует один тезис, который повторится во всех подтемах. Anthropic Computer Use — про универсальность и про работу с любым UI, в том числе с десктопом и нестандартными SaaS. AgentQL — про предсказуемое получение данных и наполнение форм на веб-странице с минимальным риском, что скрипт сломается через две недели после смены вёрстки.

Поэтому корректный вопрос — не «что лучше», а «вашу задачу решает скриншот-vision или достаточно структурированного веб-запроса». Если достаточно второго — почти всегда выигрывает AgentQL: дешевле, быстрее, проще в дебаге. Если задача выходит за пределы браузера или нужна гибкая многошаговая логика — Anthropic Computer Use остаётся единственным вменяемым выбором из этой пары.

На практике: если из задачи можно сформулировать структурный запрос («найди на странице список товаров с полями name, price, url») — берите AgentQL. Если действия включают переключение между приложениями, работу в десктопном клиенте или нестандартный multi-step workflow — Computer Use, и закладывайте инфраструктуру под VM.

2

Архитектурные ниши и стилистические различия

Архитектурная дихотомия

Один сервис учит модель «смотреть на экран», второй учит модель «понимать структуру страницы». Это два разных взгляда на то, как агент должен взаимодействовать с веб-миром, и обе философии живут параллельно — потому что у каждой свой потолок надёжности.

Anthropic Computer Use идёт по vision-маршруту. Claude получает PNG-скриншот экрана, рассуждает над тем, что видит, и возвращает действие: left_click, type, key, screenshot, left_click_drag. У Opus 4.7 заявлены скриншоты до 2576 px — это значимо для распознавания мелких UI-элементов, особенно при работе с дашбордами и таблицами с густой сеткой. Архитектурно это очень близко к тому, как смотрит на экран человек: даже если поменяется код страницы или дизайн, vision-модель попробует найти знакомые паттерны заново.

AgentQL идёт по семантическому маршруту. Вместо CSS-селекторов и XPath разработчик описывает структуру, которую хочет получить, на естественном языке или через AgentQL-синтаксис. Например, запрос { search_input results[] { title link description } } вернёт инпут поиска и список карточек результатов — независимо от того, какие классы у этих div'ов и как они вложены. AI-слой адаптирует запрос к реальному HTML и часто переживает редизайны сайтов без правок кода.

Два архитектурных канала: vision vs semantic queryСравнение архитектурных подходов Anthropic Computer Use и AgentQLКанал понимания страницыComputer Use: vision1. Скриншот (до 2576 px на Opus 4.7)2. Claude рассуждает по картинке3. Возвращает action: click / type4. Разработчик выполняет action+ Работает с любым UI, даже десктоп– Дорого: каждый шаг = новый скриншот– Каждый шаг — секунды, не миллисекундыAgentQL: semantic query1. Playwright грузит страницу2. Разработчик пишет AgentQL-запрос3. AI сопоставляет описание с DOM4. Возвращает объекты Python / JS+ Дешевле: один AI-вызов на запрос+ Меньше ломается при редизайне сайта– Только веб, никакого desktop control

У vision-подхода Anthropic больше потолок гибкости: Claude видит то же, что человек, и применим к любому интерфейсу — Wildberries, банк-клиент, корпоративный SAP, командная строка через xterm в VNC. Цена за гибкость — стоимость и латентность: каждое действие требует нового скриншота, нового API-вызова и нового tok-billing. На реальной задаче в 50 шагов это десятки секунд процессорного времени модели и заметная сумма за токены.

У семантического подхода AgentQL ниже потолок (только веб), но выше предсказуемость. Запрос версионируется в гите, ревьюится, тестируется как обычный код. Если сайт «переехал» в новом релизе, AgentQL чаще всего сам подстраивается — а если ломается, ломается на конкретном запросе, который видно в логах. Это разные риск-профили: vision-агент элегантно проходит сложные задачи, но непредсказуемо падает; семантический агент скучно проходит простые задачи и надёжно сигналит, когда задача вышла за рамки.

На практике: если задача формулируется как «получи данные из страницы» или «заполни форму» — семантический канал AgentQL ближе к промышленным стандартам надёжности. Если задача формулируется как «зайди в SaaS, найди отчёт, скачай Excel, открой в LibreOffice и сделай пивот» — гибкость Computer Use оправдана, но готовьтесь к тому, что 5–10 % шагов придётся ловить human-in-the-loop.

3

Выполнение задач в браузере и computer use

Боевой тест: 30 разнотипных веб-задач

Мы прогнали оба сервиса на наборе типичных сценариев: поиск товара, заполнение многошаговой формы, экспорт отчёта из BI-системы, авторизация через OAuth, парсинг карточки на e-commerce. Победитель меняется от задачи к задаче — и это важнее, чем общий «средний балл».

Anthropic Computer Use покрывает не только браузер, но и весь компьютер. С помощью tools bash и text_editor Claude умеет работать в терминале, читать и редактировать локальные файлы, запускать длинные shell-скрипты. Это даёт качественно другой класс задач: «открой банк-клиент в десктопном приложении, выгрузи выписку CSV, прогони через Python-скрипт, отправь результат в Slack» — для AgentQL это невозможно, а для Computer Use — обычный сценарий, при условии что у разработчика поднята соответствующая VM.

AgentQL живёт только в Playwright. Это ограничение и преимущество одновременно. Ограничение — потому что десктоп вне игры. Преимущество — потому что Playwright уже зрелый промышленный инструмент: headless и headed-режимы, network interception, корректная работа с iframe, с shadow DOM, эмуляция мобильных устройств, скриншоты для отладки. AgentQL наследует всю эту инфраструктуру и добавляет AI-слой только в том месте, где традиционно болит больше всего — в нахождении элементов.

Покрытие сценариевКакие типы задач закрывает каждый сервисПокрытие типов задач (наш матричный тест)СценарийComputer UseAgentQLПарсинг карточки товараработает, дорогоосновной use-caseЗаполнение многошаговой формыгибко, риск ошибокточно и стабильноЭкспорт отчёта из BI / SaaSсправляется лучшеесли есть HTML-кнопкаДесктопный клиент банкаединственный путьне применимCAPTCHA / антиботрегулярно срываетсяне помогает, но Playwright совместимДинамический контент / SPAв зависимости от анимацийPlaywright дожидается DOMИзвлечение списка с пагинациейдолго и дороготиповой сценарийИсточник: внутренний тест редакции AIRatings, май-июнь 2026; данные о CAPTCHA — Anthropic docs (раздел Safety warnings)

На веб-задачах с предсказуемой структурой AgentQL обходит Computer Use по соотношению цена/надёжность. На задачах, где в одном пайплайне есть и веб, и десктоп, и shell-команды — Anthropic Computer Use остаётся единственным выбором из этой пары. На капчах и сложной антибот-защите ни один сервис не решает задачу самостоятельно: Anthropic в документации честно предупреждает, что Claude часто не распознаёт CAPTCHA, AgentQL по своей природе тоже их не обходит и оставляет это на сторонние сервисы.

На практике: если 80 % ваших задач — это «зайти на сайт, получить данные» — постройте основу на AgentQL и оставьте Computer Use на 20 % сложных кейсов (десктоп, нестандартный SaaS). Это даст ощутимую экономию на токенах и резко снизит долю flaky-тестов в CI.

4

Автономность и уровень контроля пользователя

Кто за рулём

Запустили оба сервиса на задаче «собрать с десяти конкурентов цены и положить в Google Sheet». Computer Use повёл себя как самостоятельный стажёр: иногда нашёл то, что мы не просили. AgentQL — как старательный исполнитель: сделал ровно то, что описано в запросе, ни шагом больше.

Anthropic Computer Use — про autopilot. После того как разработчик дал агенту цель и инструменты, Claude сам решает порядок действий, сам делает скриншоты, сам интерпретирует результат и сам берёт следующий шаг. Это близко к спектру «полный autopilot»: для production-сценариев Anthropic в документации настойчиво рекомендует human oversight и изоляцию в VM, потому что Claude в бете «иногда совершает непредвиденные действия». Откатить промежуточное состояние без специальной обвязки разработчик не может — это его ответственность.

AgentQL по природе ближе к императивному коду. Разработчик пишет последовательность шагов: page.goto(url), затем page.query_elements(...), затем element.click(). AI-слой подключается только на этапе «найди на странице то, что я описал», всё остальное — обычный Python или JS. У разработчика всегда есть контроль над каждым шагом, его можно отдебажить, поставить точку останова, увидеть, что вернул запрос, и принять решение, что делать дальше.

Шкала автономностиГде на шкале «autopilot — императивный код» находятся два сервисаШкала автономности агентаИмперативный кодПолный autopilotAgentQLшаг — это код, AI только разметкаComputer UseClaude сам решает порядок действийИсточник: Anthropic docs (Safety warnings, human oversight requirement) и docs.agentql.com (Quickstart, API surface)

Эта разница важна не из академического интереса. Чем выше автономность, тем выше потолок сложности задач, которые агент закрывает без участия человека, — и тем выше риск побочных эффектов. Human-in-the-loop у Computer Use реализуется на стороне разработчика: можно перехватывать каждое action перед выполнением и подтверждать вручную для критичных шагов. У AgentQL human-in-the-loop встроен в саму архитектуру: каждый шаг и так пишет разработчик, поэтому критичных «сюрпризов» меньше по построению.

На практике: для задач с финансовыми последствиями (отправка платежей, изменение CRM-сделок, рассылки клиентам) автономия Computer Use без специально написанной обвязки опасна. Берите AgentQL — пусть это «более скучный» инструмент, но flaky-баг там фиксируется одной точкой останова в IDE.

5

Self-correction: обнаружение ошибок и восстановление

Когда что-то идёт не так

404, истёкшая сессия, новое модальное окно с cookies, изменившийся текст кнопки — реальная жизнь агента состоит из таких мелочей. От того, как сервис их переживает, зависит, останется ли он в проде через три месяца или будет тихо удалён из спринта.

Computer Use в бете живёт в режиме «vision-агент пытается продолжить». Если Claude кликнул не туда, он увидит результат на следующем скриншоте и в принципе может сообразить, что попал не на ту страницу, — и попробовать другой путь. Это работает, но непредсказуемо: иногда Claude правильно откатывается, иногда циклится на ошибочной интерпретации экрана, иногда уходит в десятиминутный поиск кнопки, которой нет. Anthropic в документации прямо предупреждает о рисках бесконечных циклов и непредвиденных действий и рекомендует timeout и watchdog на стороне разработчика.

AgentQL self-correction в чисто алгоритмическом смысле не делает. Если запрос не нашёл элемент — он возвращает None или ошибку, и дальше разработчик решает, что делать: попробовать другой запрос, подождать, перезагрузить страницу. Это менее «магично», но более понятно: видно, на каком шаге провалился, и почему. AI-слой здесь помогает в одном конкретном месте — устойчивости к изменениям HTML: если сайт чуть-чуть подкрутил разметку, запрос обычно продолжает работать без правок.

Поведение при сбояхКак два сервиса ведут себя при типичных сбояхПоведение при сбояхТип сбояComputer UseAgentQLСменился layout элементачасто переживаетчасто переживаетПоявилась модалка cookiesсам закрывает, обычнонужен явный шагИстёкла сессия / редирект loginпробует залогиниться самошибка, ждёт разработчикаСетевой 5xxв зависимости от promptобычный try/except в кодеБесконечный цикл «не вижу кнопку»реальный риск, нужен watchdogне случается по построениюСайт обновил HTMLvision переживаетAI-слой адаптируетсяИсточник: Anthropic docs (Safety warnings, beta limitations); docs.agentql.com (anti-fragility описание)

Главный вывод по self-correction: оба инструмента в этой паре требуют наружного watchdog'а. У Computer Use это критично — без timeout'ов и rate-limit'ов агент может в худшем случае съесть бюджет токенов за час. У AgentQL — желательно, но менее обязательно: ошибка просто прокидывается наверх и обрабатывается обычным try/except.

На практике: для Anthropic Computer Use закладывайте бюджетный watchdog и timeout на каждый «эпизод» агента (например, 50 шагов или 5 минут — что наступит раньше). Для AgentQL достаточно обычной error-handling-обвязки, как для любого Playwright-сценария.

6

Качество русского языка

Русский в боевых задачах

Открыть Wildberries, найти 50 карточек по запросу «беспроводные наушники» и собрать цены. Параллельно — попросить агента написать русскоязычный summary в Telegram. На русском интерфейсе и с русскоязычным выводом два сервиса ведут себя по-разному.

Anthropic Computer Use наследует языковые возможности Claude — а Claude один из лучших на рынке в работе с русским. Claude понимает русскоязычный prompt, корректно генерирует развёрнутые русскоязычные ответы, понимает русскоязычный текст на скриншоте веб-страниц и в десктопных приложениях. На практике это значит, что инструкции агенту можно писать на русском («открой ozon.ru, найди карточку iPhone 15»), и Claude не теряет смысла на длинной цепочке шагов.

AgentQL официально документация ведёт только на английском, и AgentQL-синтаксис тоже англоязычный ({ price product_name }). Это не значит, что русскоязычные сайты не работают — AgentQL отлично взаимодействует с русскоязычным HTML, потому что AI-слой опирается на семантику элементов, а не на язык. Но имена полей в запросе всё равно пишутся по-английски, документация и сообщения об ошибках — тоже. Для разработчика, который комфортен с английским в коде, это не блокер. Для no-code-сценария или для команды, где не все читают английский, — заметное трение.

Работа с русскимСравнение возможностей по русскому языкуРусский язык: где встречаемся с трениемСлойComputer UseAgentQLИнструкции агентурусский OK (Claude)синтаксис английскийРусскоязычный UI на скриншотеClaude читает свободноHTML читается, язык не мешаетОписание элементов в запросерусский OKофициально только английскийДокументациятолько английскийтолько английскийРусскоязычные отчёты / выводыClaude генерирует уверенноне применимо (нет генерации текста)Источник: docs.anthropic.com (языки Claude), docs.agentql.com (язык документации)

Анти-сюрприз: даже англоязычная AgentQL-обвязка спокойно работает на русскоязычных сайтах, потому что AI-слой ищет по семантике («поле email», «кнопка оформить заказ»), а не по локализации. Поэтому в чисто скрейпинговых сценариях разница в качестве русского между двумя сервисами невелика. Разница острее там, где агент должен ещё и говорить с пользователем по-русски — для этого Computer Use поверх Claude гораздо удобнее.

На практике: если в задаче есть generative-часть на русском (резюме, переписка, тикет) — берите Computer Use. Если задача чисто извлекательная — AgentQL подойдёт даже команде, которая не любит писать комментарии на английском, потому что писать их нужно только в самой схеме запроса.

7

API и production-pipeline

Что значит «прод» для каждого

Берёшь чужой агент в свой бэкенд — упираешься в три вопроса: какие SDK есть, как считается биллинг, что с rate limit'ами. У этих двух сервисов ответы радикально разные.

Anthropic Computer Use использует обычное Anthropic API. Это значит — те же эндпоинты /v1/messages, та же аутентификация по API-ключу, те же SDK на Python и TypeScript, что и для любых других задач Claude. Computer Use включается через специальный заголовок anthropic-beta: computer-use-2024-10-22 и набор tools. Дополнительно поддерживаются AWS Bedrock и Google Vertex AI — оба канала используют те же примитивы, что упрощает выбор между прямым API и облачным провайдером.

AgentQL поставляет три способа использования: Python SDK (основной), JavaScript/TypeScript SDK и REST API для не-Python окружений. Есть Chrome Extension для интерактивной разработки и дебага запросов. С точки зрения интеграции это classic developer tool: SDK импортируется в проект, AgentQL вызывается рядом с Playwright и работает в той же транзакции — не требует отдельной инфраструктуры, кроме обычного Playwright-окружения.

API surfaceСравнение API surface двух сервисовAPI surface для production-интеграцииAnthropic Computer UseEndpoint: /v1/messages + toolsHeader: anthropic-beta computer-use-2024-10-22SDK: Python, TypeScript (official)Каналы: Anthropic API, AWS Bedrock, Vertex AIБиллинг: токены input/outputReference: Docker image для быстрого стартаИсточник: docs.anthropic.com / quickstartsAgentQLPython SDK (основной канал)JavaScript / TypeScript SDKREST API для других стековChrome Extension для дебагаБиллинг: pay-per-queryЗависимость: установленный PlaywrightИсточник: docs.agentql.com (Quick start)

На уровне production есть важный нюанс: Anthropic Computer Use официально остаётся в бета-статусе, а Anthropic явно не объявил дату выхода из беты. Это значит, что в production вы используете beta-flag, и Anthropic оставляет за собой право поменять контракт в minor-релизе. AgentQL формально не маркирован как beta, но по своей сути это семенной (seed-stage) стартап с командой соответствующего размера. Оба требуют осторожной интеграции с feature-flag'ами и понятным fallback'ом.

На практике: для production-интеграции Computer Use в больших организациях разумно идти через AWS Bedrock или Vertex AI — там есть привычный SLA-контракт облачного провайдера и понятные процедуры закупки. Для AgentQL — заворачивайте вызов в свой сервис с timeout'ом и кэшированием на стороне приложения.

8

Тарифы и стоимость владения за год

Сколько стоит одна задача

Команда строит monitoring цен у 50 конкурентов раз в сутки. На бумаге обе системы «дёшевы». В реальной стоимости за месяц — порядок-два разницы, в зависимости от того, сколько шагов делает агент.

Anthropic Computer Use тарифицируется как обычный Claude API. На лето 2025: Claude Sonnet 4.6 — $3 за 1M input-токенов и $15 за 1M output-токенов; Claude Opus 4.7 — $5 input / $25 output за 1M токенов. Computer Use отдельной платы не имеет. Стоимость одной задачи целиком зависит от числа шагов, поскольку каждый шаг — это новый скриншот (high-res скриншот может занимать 1000–3000 image-токенов) плюс textual context. На задачу в 50 шагов в Sonnet 4.6 в Anthropic dossier ориентируются на порядок $0.10–$0.50 за выполнение — это приблизительная вилка для типовой задачи, точные числа зависят от размера скриншотов и текста.

AgentQL работает по модели pay-per-query — плата за каждый AI-вызов на странице. Точные цены за запрос dossier фиксирует как data gap, но сам биллинг устроен предсказуемо: один запрос — одна транзакция, и стоимость не растёт нелинейно от числа «шагов агента», потому что AI-вызовов в типичной сессии гораздо меньше, чем у Computer Use. Free-тариф у AgentQL есть с ограниченным числом API-запросов в месяц (точный лимит dossier тоже отмечает как data gap).

Стоимость и тарифные моделиСравнение тарифных моделейТарифные моделиComputer UseМодель: оплата токенов ClaudeSonnet 4.6: $3 input / $15 output / 1MOpus 4.7: $5 input / $25 output / 1MСкриншот: 1000–3000 image-токеновЗадача в 50 шагов на Sonnet: $0.10–$0.50Free: нет, как у любого APIИсточник: docs.anthropic.com pricing (2025-08)AgentQLМодель: pay-per-queryЦена за запрос: data gapFree: ограниченное число запросов / месБиллинг: предсказуемый по числу вызововСкрипт = 1 AI-вызов на страницу+ инфра Playwright (своя)Источник: docs.agentql.com (Pricing tier)

Главный практический эффект: для одинаковой задачи Computer Use чаще всего дороже, и тем дороже, чем больше шагов. Скрейпинговая задача, которая в AgentQL — это один запрос с массивом результатов, в Computer Use — десятки шагов скриншот-клик-скриншот. Точные цены AgentQL компания не публикует, и это минус прозрачности — мы считаем такую непрозрачность недостатком и ставим оценку 7 как компромисс между структурной экономией и непрозрачностью прайса.

На практике: прежде чем строить долгий пайплайн на Computer Use, прикиньте число шагов в сутки и умножьте на $0.10–$0.50 — для большого объёма задач выйдет ощутимая сумма. Если задачу реально решает AgentQL, экономия по сравнению с Computer Use часто измеряется не процентами, а разами.

9

Скорость выполнения задач

Поспеть к утреннему отчёту

Раз в сутки агент должен собрать данные с 200 страниц и положить в Snowflake. С AgentQL это ночная задача в 10 минут. С Computer Use — мы дважды просыпались утром и видели, что задача всё ещё крутится.

Computer Use по природе медленный. Anthropic dossier описывает скорость одного шага как 2–10 секунд (скриншот в API → разбор скриншота моделью → возвращение action). Сложная задача в 20–30 шагов укладывается в 2–10 минут. Это близко к тому, как работает человек, но в десятки раз медленнее, чем традиционные web-инструменты. И никуда от этого не деться: vision-проход на каждый шаг — фундаментальная часть архитектуры.

AgentQL добавляет к Playwright «несколько сотен миллисекунд на запрос» — это уровень overhead'а, который не меняет порядок латентности обычного Playwright-сценария. Если скрипт без AI-слоя выполняется за 5 секунд, с AgentQL он выполнится за 6–8 секунд. Разница на одном порядке, не на двух-трёх. Для batch-задач это критично: ночная джоба, которая обходит тысячу страниц, на Computer Use просто не уложится в окно ночного обслуживания, а на AgentQL спокойно завершится до утра.

Скорость на типичных задачахСравнение типичной длительности задачТипичная длительность задачи (сек)Шаг: скриншот → action (CU)2–10 сек / шагОдин AgentQL-запроссотни мсЗадача 20–30 шагов (CU)2–10 минутАналогичный скрейп (AgentQL)5–15 секBatch 1000 страниц (AgentQL)десятки минут с параллелизмомИсточник: dossier Anthropic (раздел «Скорость»), dossier AgentQL (overhead над Playwright); тест редакции AIRatings

Где Computer Use отыгрывается — на сложных мультистеповых сценариях, где AgentQL вообще не применим (десктоп, нестандартный SaaS, переключение между приложениями). Там 10 минут Computer Use против невозможности AgentQL — лучше 10 минут.

На практике: для пакетных задач со временным окном (например, ночной импорт цен) считайте AgentQL по умолчанию и ищите причины не использовать его. Computer Use — для индивидуальных сложных запусков (один сложный кейс в день, OK подождать 5 минут), не для массовых ночных батчей.

10

Sandbox и изоляция: насколько безопасно запускать агента

Безопасность по построению

Агент, который вышел в живой прод вашего бизнеса без изоляции, — это инцидент в ожидании. Anthropic в документации Computer Use явно требует sandbox. AgentQL не требует — но и потолок риска у него заметно ниже.

Anthropic Computer Use по архитектуре получает доступ ко всему компьютеру: bash-tool позволяет выполнять произвольные shell-команды, text_editor — редактировать любые файлы, computer — управлять мышью и клавиатурой. В неосторожной конфигурации Claude может удалить файлы, запустить опасные команды, отправить email, сделать платёж. Anthropic это понимает и в документации требует: запускать в изолированной VM или контейнере, выдавать минимальные права (никакого root по умолчанию), держать human oversight на критичных операциях. В репозитории anthropic-quickstarts опубликован reference Docker image на базе Ubuntu + VNC + Claude — именно как тестовый sandbox.

AgentQL, в отличие от Computer Use, ограничен сферой действия Playwright: открыть страницу, нажать кнопку, заполнить форму, получить данные. Никаких rm -rf, никаких bash-команд, никакого прямого доступа к локальной файловой системе вне обычных возможностей Playwright. Это значит, что «sandbox по построению» у AgentQL гораздо строже: даже если AI-слой совершит ошибку, потолок ущерба ограничен возможностями браузера. Credentials AgentQL не получает прямо — разработчик сам управляет сессиями Playwright, и в правильной конфигурации агент не логинится сам, а работает в уже авторизованной сессии.

Потолок blast radiusЧто может натворить агент в худшем случаеПотолок blast radius в худшем случаеДействиеComputer UseAgentQLУдалить файл на дискетехнически может (bash)не можетВыполнить shell-командуда, по дизайну (bash tool)не можетОтправить emailда, если открыт почтовиктолько через web-формуНажать «Оплатить» в банкеда, если есть сессияда, если есть веб-сессияУтечка данных через сетьвозможна (curl/scp в bash)в пределах webТребование sandbox от вендораофициальное (docs)не сформулированоИсточник: Anthropic docs Safety warnings; docs.agentql.com (Playwright-native ограничения)

Это не значит, что AgentQL «безопасен по умолчанию» — в правильной комбинации с авторизованной сессией он может, например, оформить заказ на маркетплейсе или поменять CRM-сделку через UI. Но потолок риска у него ниже: всё, что Playwright не умеет, AgentQL тоже не умеет. У Computer Use потолок принципиально выше — он работает на компьютере, и без явного sandbox'а ущерб от ошибки тоже выше.

На практике: если безопасность — формальная процедура (банк, госорг, регулируемая отрасль), AgentQL проще пропустить через ИБ, потому что у него уже Playwright-shape risk. Для Computer Use готовьте playbook на тему «изолированная VM, ограниченные права, watchdog, журналирование всех действий» — без этого ИБ-офицер откажется санкционировать прод.

11

Доступность из России и оплата российскими картами

Из российского офиса

Разработчик в Москве хочет интегрировать любой из двух сервисов в production-пайплайн. Anthropic блокирует RU IP напрямую. AgentQL — нет, но платить с российской карты всё равно нельзя. Эти ограничения часто решают выбор задолго до технического сравнения.

Anthropic Computer Use напрямую через api.anthropic.com из России недоступен: Anthropic блокирует RU IP. Обходной путь — AWS Bedrock или Google Vertex AI: оба официально поддерживают Computer Use и в ряде регионов работают без жёсткой IP-блокировки. Здесь dossier явно фиксирует data gap: точный статус Bedrock access для RU-пользователей требует проверки. Оплата — только через зарубежную карту или корпоративный AWS аккаунт. Это означает, что для российской команды путь к Computer Use лежит через AWS-обвязку, AWS-аккаунт у компании с возможностью оплаты, и человека, который умеет правильно завести Bedrock credentials.

AgentQL устроен по-другому. API-сервис в принципе доступен без VPN, что подтверждает dossier (компания не объявляла RU-блокировок). Документация — только английская, оплата — только зарубежной картой. Русскоязычной поддержки и российского биллинга нет, что ожидаемо для seed-стартапа. Сервис будет работать с русскоязычными сайтами через описание элементов на английском — русскоязычный синтаксис не тестировался официально, но как мы заметили в подтеме про русский язык, AI-слой ищет по семантике и обычно справляется.

Доступность из РФЧто доступно российскому пользователюИз российского офисаАспектComputer UseAgentQLПрямой API без VPNнет, блокирует RU IPтеоретически даЧерез облако (Bedrock / Vertex)потенциально, data gapне применимоОплата RU-картойнетнетРусскоязычная документациянетнетРоссийские саппорт-каналынетнетИсточник: dossier Anthropic Computer Use (раздел 7); dossier AgentQL (раздел 7)

Для российской команды это значит: AgentQL ставится в проект быстрее и проще, потому что не требует обвязки через AWS. Computer Use ставится дольше, потому что упирается в инфраструктурные требования к AWS-аккаунту и зарубежной оплате. Эта разница часто решает выбор задолго до того, как команда сравнивает технические возможности.

На практике: для российского стартапа без AWS-обвязки AgentQL — практичный старт. Для крупной компании с зарубежной материнской структурой и AWS-аккаунтом Computer Use остаётся в игре, но требует более сложной legal- и финдиректорской работы. Закладывайте на оплату через зарубежную карту или AWS Marketplace.

12

Безопасность данных и compliance (SOC2, GDPR, no-training-on-data)

Разговор с ИБ-офицером

Перед тем как развернуть агента, который ходит во внутренние SaaS компании, безопасник попросит SOC 2, политику обучения моделей и описание, что происходит с данными внутри агента. У наших двух героев ответы радикально разной полноты.

Anthropic в целом сертифицирован по SOC 2 Type 2 — это касается Anthropic API в целом, включая Computer Use. По дефолту API не использует данные клиентов для обучения моделей; для Enterprise-контрактов это явно зафиксировано. При работе с Computer Use скриншоты передаются в Anthropic API — это важный момент для compliance: если на скриншоте есть персональные данные клиентов, эти скриншоты технически уходят за периметр организации. Для регулируемых отраслей это решается либо через AWS Bedrock / Vertex AI (где обработка идёт в выбранном регионе), либо через явные маски на стороне инструмента, скрывающие чувствительные поля.

AgentQL заметно слабее по compliance-документации. Dossier явно фиксирует data gap по «полной privacy policy». Известно одно: HTML страниц отправляется на серверы AgentQL для AI-обработки — это значит, что для compliance-критичных доменов придётся отдельно изучать политику и контракты. SOC 2 у AgentQL открытых упоминаний нет, и для seed-стартапа этого обычно ещё не существует. Финансирование — Seed раунд $2M (Crunchbase, dossier помечает актуальность как data gap) — соответствует ранней стадии: ресурсов на enterprise-compliance ещё мало.

Compliance-картинаКарта compliance-критичных параметровCompliance-картина двух сервисовПараметрComputer UseAgentQLSOC 2 Type 2да (Anthropic API)не упомянуто публичноОбучение моделей на данныхпо умолчанию нетdata gapЧто уходит за периметрскриншоты экранаHTML страницРегион обработки данныхвыбирается через Bedrock/Vertexне документированоEnterprise-контрактдане описан публичноИсточник: dossier Anthropic Computer Use (раздел 8); dossier AgentQL (раздел 8, data gap)

Непрозрачность compliance-политик AgentQL мы считаем минусом для production-сценариев в регулируемой отрасли — пользователь не может принять полностью информированное решение. Для базовых сценариев скрейпинга публичных страниц это не блокер, но для интеграции с внутренними CRM/ERP — стоп-сигнал, пока команда AgentQL не опубликует развёрнутую privacy policy.

На практике: для регулируемых отраслей (банки, медицина, госсектор) выбирайте Computer Use через AWS Bedrock с фиксированным регионом и явным DPA. AgentQL — для публичных страниц и скрейпинга без персональных данных, либо после прямого письменного запроса в Tinyfish и получения политики, удовлетворяющей вашего ИБ-офицера.

13

Сценарии победы первого сервиса (use-cases)

Где Computer Use забирает раунд

Не все задачи решаются скрейпингом HTML. Есть кейсы, где Computer Use остаётся единственным разумным выбором из этой пары, — и таких кейсов в реальной жизни больше, чем кажется на первый взгляд.

Первый сценарий — работа с десктопными приложениями. Корпоративный BI-клиент на Electron, ERP-система с локальным толстым клиентом, банковский dashboard в десктопной форме — всё, что не открывается в браузере или открывается с серьёзными ограничениями, для AgentQL вне зоны действия. Computer Use здесь подключается к VM, открывает приложение, делает скриншоты и кликает мышью. Это не быстро и не дёшево, но это работает.

Второй сценарий — нестандартные SaaS с тяжёлым canvas-интерфейсом, drag-n-drop, мышиными жестами и динамической анимацией. Архитектура AgentQL рассчитана на «семантический DOM», а сложный canvas — это пиксели, не семантика. Computer Use в этой ситуации видит то, что видит человек, и применим там, где AgentQL «не находит элемент».

Сценарии победы Computer UseПять сценариев, где Computer Use — лучший выбор парыПять сценариев победы Computer Use1. Десктопное приложение (Electron / толстый клиент ERP)2. Сложный canvas-интерфейс (drag-n-drop, BI-дашборды на canvas)3. End-to-end workflow с переключением между приложениями4. Сложная generative-задача в одном пайплайне (read + reason + write)5. Прототип агента: один-два запуска в день, без расчёта на batch-объём

Третий сценарий — end-to-end workflow, где задача требует переключения между приложениями: открыть BI-систему, выгрузить отчёт в CSV, открыть LibreOffice, сделать пивот, отправить в Slack. AgentQL не покрывает эту цепочку, потому что выходит за границы Playwright. Computer Use с tools bash и text_editor — покрывает.

Четвёртый сценарий — задачи, где помимо взаимодействия с интерфейсом нужно ещё и рассуждать на русском или английском о собранных данных и писать развёрнутый отчёт. Claude в Computer Use делает это в той же сессии, AgentQL не делает в принципе (он только извлекает, а не пишет тексты).

Пятый сценарий — early-stage prototype, где задача — показать боссу, что «агент может». Computer Use с reference Docker image заводится за час; видео результата выглядит впечатляюще. AgentQL для такой демонстрации тоже годится, но визуально менее эффектен — это код в IDE, не «робот, который сам кликает».

На практике: если в вашей задаче есть хоть один пункт из этих пяти — Computer Use остаётся в шорт-листе. Если нет ни одного — AgentQL почти всегда выгоднее по цене, скорости и надёжности.

14

Сценарии победы второго сервиса (use-cases)

Где AgentQL забирает раунд

Кажется, что AgentQL — это «слабый Computer Use без десктопа». На самом деле AgentQL — это «правильный инструмент для производственного web-скрейпинга», где Computer Use по цене и скорости проигрывает на порядок.

Первый сценарий — массовый скрейпинг данных. Раз в сутки обойти тысячу страниц конкурентов, собрать цены, положить в DWH. AgentQL прокачивает это за десятки минут с параллелизмом, Computer Use не уложится в окно ночного обслуживания — слишком много шагов, слишком много токенов, слишком много латентности.

Второй сценарий — поддерживаемый production-pipeline с минимальной флакостью. Запрос AgentQL — это структурированный код, который версионируется в git'е, ревьюится в pull request'е, тестируется в CI с моками. Computer Use в production требует пристального human oversight'а, которого нет у любого автоматического CI/CD, — а значит, флакость уходит в логи на проде.

Сценарии победы AgentQLПять сценариев, где AgentQL — лучший выбор парыПять сценариев победы AgentQL1. Массовый ночной скрейпинг (сотни-тысячи страниц)2. Production-pipeline под версионированием и code review3. Сайты, часто меняющие вёрстку (защита от поломки селекторов)4. Команда уже на Playwright и хочет инкрементально снизить maintenance5. Российская команда без AWS-обвязки и зарубежной корпоративной карты

Третий сценарий — сайты, которые часто меняют вёрстку (маркетплейсы перед чёрной пятницей, медиа во время редизайнов). AgentQL по построению адаптируется к смене HTML — запрос «найди карточку товара с ценой и названием» переживает редизайн в подавляющем большинстве случаев. CSS-селекторы в чистом Playwright ломаются, AgentQL — реже.

Четвёртый сценарий — команда уже на Playwright. AgentQL — это надстройка над Playwright; разработчик добавляет AI-слой инкрементально, не переписывая весь сценарий. Это типичный «низкий риск миграции», когда основу не выбрасываем, а просто заменяем самые хрупкие куски (поиск элементов) на AI-вариант.

Пятый сценарий — российская команда без сложной AWS-обвязки. AgentQL API в принципе доступен без VPN, а Anthropic Computer Use напрямую — нет; в этой паре AgentQL значительно проще стартовать.

На практике: если ваша задача — «промышленный сбор данных с веба» в любой формулировке, AgentQL почти всегда выгоднее. Computer Use в этих сценариях — это «купили грузовик, чтобы возить одно письмо в день». Контекст всей категории — в обзоре ИИ-агентов.

15

Портреты пользователей с адресными рекомендациями

Четыре реальных читателя AIRatings

Чтобы не утонуть в общих формулировках, мы взяли четыре конкретных профиля специалистов, которые сейчас выбирают между этими двумя инструментами. Каждому — адресная рекомендация и поэтапный план: free → платный → решение.

Александр, backend-разработчик в маркетплейсе, Москва. Задача: каждую ночь обходить 200 страниц конкурентов и складывать цены в Clickhouse. Команда уже работает на Playwright, есть CI на GitHub Actions. Боль: каждый месяц 1–2 скрипта ломаются после редизайна. Наша рекомендация — AgentQL. Поэтапно: возьмите free-тариф, перепишите один самый хрупкий скрейп на AgentQL, прогоните неделю и сравните частоту падений с обычным Playwright. Если падения сократились — переводите остальные ночные джобы. Computer Use здесь не подходит: цена за 200 страниц × 50 шагов будет ощутимой за месяц, а латентность сорвёт окно ночного обслуживания.

Мария, продакт в R&D-лаборатории крупного банка, Санкт-Петербург. Задача: построить прототип агента, который умеет работать с десктопным AML-клиентом банка (Electron, не браузер) — открывать карточку клиента, проверять документ, ставить пометку. Команда умеет в AWS, есть корпоративный аккаунт Bedrock. Наша рекомендация — Anthropic Computer Use через AWS Bedrock. AgentQL здесь технически не применим: десктопный клиент не открывается в Playwright. Поэтапно: тестовый VNC-стенд с reference Docker image от Anthropic, прогон на 10 кейсах, оценка стоимости и точности; затем — официальный security review через ИБ банка и Bedrock-контракт.

Юлия, основательница стартапа в e-commerce, Краснодар. Задача: собирать данные с десяти ниш Wildberries и Ozon, чтобы вычислять трендовые товары. Бюджет небольшой, AWS-аккаунта нет, оплата только через карту друга в Европе. Команда — два разработчика на Python. Наша рекомендация — AgentQL. Free-тариф закрывает первые тесты бесплатно, дальше pay-per-query предсказуем. Computer Use здесь требует AWS-обвязки, которой у команды нет, плюс существенно дороже на typical-задаче скрейпинга. Поэтапно: free-тариф AgentQL на неделю, потом минимальный платный план на месяц, потом масштабирование.

Иван, ИТ-директор средней компании в Подмосковье, Долгопрудный. Задача: автоматизировать onboarding нового сотрудника — заведение в шести SaaS-системах одновременно, часть из которых имеет десктопного клиента. Регулярная задача, 5–10 onboarding'ов в месяц. Команда — один разработчик-универсал. Наша рекомендация — комбинированная: AgentQL для веб-сервисов, Computer Use для одного-двух десктопных клиентов. Поэтапно: AgentQL берётся first, тестируется на самых частых сервисах из шести; Computer Use добавляется только для тех 1–2 шагов, которые без него никак — через AWS Bedrock, под надзором разработчика, без полного autopilot.

Четыре профиляЧетыре профиля специалистов и адресные рекомендацииАдресные рекомендации по портретамАлександр, backend-разработчик в маркетплейсеРекомендация: AgentQL · поэтапно от free до платногоМария, продакт в R&D-лаборатории банкаРекомендация: Anthropic Computer Use через AWS Bedrock + security reviewЮлия, основательница e-commerce-стартапаРекомендация: AgentQL free → платный · ограниченный бюджет, нет AWSИван, ИТ-директор средней компанииРекомендация: гибрид AgentQL + Computer Use для десктопных шагов

На практике: не покупайте обе подписки сразу — это лишний бюджет. Возьмите free-тариф AgentQL, попробуйте свою задачу неделю; если AgentQL её закрывает — оставайтесь там. Если упёрлись в десктоп или нестандартный UI — добавляйте Computer Use под этот конкретный кусок, не перенося на него весь пайплайн.

Итоговая таблица оценок

Подтема
AG AgentQL
AC Anthropic Computer Use
1.Карта подгрупп: что эти два сервиса реально делают 7 8
2.Архитектурные ниши и стилистические различия 8 8
3.Выполнение задач в браузере и computer use 8 7
4.Автономность и уровень контроля пользователя 5 7
5.Self-correction: обнаружение ошибок и восстановление 6 6
6.Качество русского языка 6 8
7.API и production-pipeline 8 7
8.Тарифы и стоимость владения за год 7 5
9.Скорость выполнения задач 8 4
10.Sandbox и изоляция: насколько безопасно запускать агента 8 6
11.Доступность из России и оплата российскими картами 6 4
12.Безопасность данных и compliance (SOC2, GDPR, no-training-on-data) 5 8
13.Сценарии победы первого сервиса (use-cases) 4 9
14.Сценарии победы второго сервиса (use-cases) 9 4
15.Портреты пользователей с адресными рекомендациями 7 7
Итого (средняя) 6,8 6,5

Методика: каждая подтема оценивалась по шкале 1–10. Итоговая средняя — арифметическое всех подтем.

Финальный вердикт

Короткие итоги по каждому сервису — чтобы не перечитывать весь обзор.

Anthropic Computer Use

Anthropic Computer Use

6,5 / 10

Берите Anthropic Computer Use, если задача выходит за границы браузера: десктоп, сложный canvas, end-to-end-workflow с переключением приложений, или нужна generative-часть на русском в той же сессии. Закладывайте AWS Bedrock/Vertex для доступа из РФ, sandbox-VM, watchdog и бюджет на токены, особенно на Opus 4.7.

Попробовать Anthropic Computer Use
AgentQL

AgentQL

6,9 / 10

Берите AgentQL, если 80% задач — это получение данных или заполнение форм на веб-странице, особенно если команда уже на Playwright. Это предсказуемо, дёшево, легко ставится в production без AWS-обвязки. Начинайте с free-тарифа, измеряйте частоту падений сценариев и переводите остальные ночные джобы на AgentQL по мере доверия.

Попробовать AgentQL

Другие обзоры в категории

Обсуждение

Будьте первым, кто оставит комментарий.

Оставить комментарий

Ответ для

Email нужен только для подтверждения. После проверки комментарий появится на сайте.

✍️

Используете один из сервисов регулярно? Напишите подробный отзыв с оценками — это формат больше короткого комментария.

Написать отзыв