Anthropic Computer Use vs AgentQL 2026: developer-API против query-language
Сравнили два инструмента для агентов: Computer Use от Anthropic — vision-based примитив на скриншотах, и AgentQL — query-language над Playwright. Разные ниши, разные цены, разный потолок.
Содержание
Anthropic Computer Use и AgentQL часто появляются в одних и тех же роадмапах команд, которые хотят автоматизировать веб-задачи. Но это не дуэль одинаковых продуктов: Computer Use — это developer-API от Anthropic Computer Use, который смотрит на скриншот экрана и возвращает действия (клик, набор текста, скролл), а AgentQL от Tinyfish — это структурированный query-language поверх Playwright, который описывает элементы страницы и адаптируется к смене вёрстки.
Мы держим оба ключа в продакшене редакции AIRatings и за полгода прогнали через них больше двух сотен сценариев — от скрейпинга цен с маркетплейсов до полу-RPA внутри корпоративного SaaS. Короткий спойлер: Computer Use берёт там, где нужна гибкость и работа с произвольным UI (включая десктоп через VM), AgentQL — там, где нужна предсказуемость, дешевизна и стабильность при изменениях сайтов. Если вас интересует расширенная картина категории, начните с общего обзора ИИ-агентов.
Дальше — 15 подтем с конкретикой по цене, скорости, доступности из РФ, безопасности и сценариям, где выигрывает каждый.
Карта подгрупп: что эти два сервиса реально делают
Перед выбором
Команда смотрит видео с Anthropic Computer Use, где Claude сам бронирует столик, и ставит его в спринт. К концу спринта выясняется: для скрейпинга карточек товаров с Wildberries это был не тот инструмент. AgentQL решил задачу за полдня и за десятые доли цены.
Anthropic Computer Use и AgentQL формально оба в категории ИИ-агентов, но в реальности живут в разных подгруппах. Computer Use — это computer-use API от крупного LLM-провайдера. Anthropic даёт три tool-примитива: computer (скриншот, клик, мышь, клавиши), text_editor (просмотр и редактирование файлов) и bash (shell-команды). Никакого готового интерфейса, никакого консьюмерского продукта — разработчик собирает агента сам, на своей инфраструктуре, и платит за токены Claude по обычным API-тарифам.
AgentQL устроен иначе. Это developer tool узкого назначения: query-language для веб-страниц, обёртка над Playwright с AI-слоем. Разработчик пишет структурированный запрос (синтаксис близок к GraphQL), AgentQL находит на странице элементы по описанию и возвращает их Python- или JS-объектами. Никаких скриншотов как первичного канала, никакого desktop-control, никакого выполнения произвольных bash-команд — только web.
Из карты следует один тезис, который повторится во всех подтемах. Anthropic Computer Use — про универсальность и про работу с любым UI, в том числе с десктопом и нестандартными SaaS. AgentQL — про предсказуемое получение данных и наполнение форм на веб-странице с минимальным риском, что скрипт сломается через две недели после смены вёрстки.
Поэтому корректный вопрос — не «что лучше», а «вашу задачу решает скриншот-vision или достаточно структурированного веб-запроса». Если достаточно второго — почти всегда выигрывает AgentQL: дешевле, быстрее, проще в дебаге. Если задача выходит за пределы браузера или нужна гибкая многошаговая логика — Anthropic Computer Use остаётся единственным вменяемым выбором из этой пары.
На практике: если из задачи можно сформулировать структурный запрос («найди на странице список товаров с полями name, price, url») — берите AgentQL. Если действия включают переключение между приложениями, работу в десктопном клиенте или нестандартный multi-step workflow — Computer Use, и закладывайте инфраструктуру под VM.
Архитектурные ниши и стилистические различия
Архитектурная дихотомия
Один сервис учит модель «смотреть на экран», второй учит модель «понимать структуру страницы». Это два разных взгляда на то, как агент должен взаимодействовать с веб-миром, и обе философии живут параллельно — потому что у каждой свой потолок надёжности.
Anthropic Computer Use идёт по vision-маршруту. Claude получает PNG-скриншот экрана, рассуждает над тем, что видит, и возвращает действие: left_click, type, key, screenshot, left_click_drag. У Opus 4.7 заявлены скриншоты до 2576 px — это значимо для распознавания мелких UI-элементов, особенно при работе с дашбордами и таблицами с густой сеткой. Архитектурно это очень близко к тому, как смотрит на экран человек: даже если поменяется код страницы или дизайн, vision-модель попробует найти знакомые паттерны заново.
AgentQL идёт по семантическому маршруту. Вместо CSS-селекторов и XPath разработчик описывает структуру, которую хочет получить, на естественном языке или через AgentQL-синтаксис. Например, запрос { search_input results[] { title link description } } вернёт инпут поиска и список карточек результатов — независимо от того, какие классы у этих div'ов и как они вложены. AI-слой адаптирует запрос к реальному HTML и часто переживает редизайны сайтов без правок кода.
У vision-подхода Anthropic больше потолок гибкости: Claude видит то же, что человек, и применим к любому интерфейсу — Wildberries, банк-клиент, корпоративный SAP, командная строка через xterm в VNC. Цена за гибкость — стоимость и латентность: каждое действие требует нового скриншота, нового API-вызова и нового tok-billing. На реальной задаче в 50 шагов это десятки секунд процессорного времени модели и заметная сумма за токены.
У семантического подхода AgentQL ниже потолок (только веб), но выше предсказуемость. Запрос версионируется в гите, ревьюится, тестируется как обычный код. Если сайт «переехал» в новом релизе, AgentQL чаще всего сам подстраивается — а если ломается, ломается на конкретном запросе, который видно в логах. Это разные риск-профили: vision-агент элегантно проходит сложные задачи, но непредсказуемо падает; семантический агент скучно проходит простые задачи и надёжно сигналит, когда задача вышла за рамки.
На практике: если задача формулируется как «получи данные из страницы» или «заполни форму» — семантический канал AgentQL ближе к промышленным стандартам надёжности. Если задача формулируется как «зайди в SaaS, найди отчёт, скачай Excel, открой в LibreOffice и сделай пивот» — гибкость Computer Use оправдана, но готовьтесь к тому, что 5–10 % шагов придётся ловить human-in-the-loop.
Выполнение задач в браузере и computer use
Боевой тест: 30 разнотипных веб-задач
Мы прогнали оба сервиса на наборе типичных сценариев: поиск товара, заполнение многошаговой формы, экспорт отчёта из BI-системы, авторизация через OAuth, парсинг карточки на e-commerce. Победитель меняется от задачи к задаче — и это важнее, чем общий «средний балл».
Anthropic Computer Use покрывает не только браузер, но и весь компьютер. С помощью tools bash и text_editor Claude умеет работать в терминале, читать и редактировать локальные файлы, запускать длинные shell-скрипты. Это даёт качественно другой класс задач: «открой банк-клиент в десктопном приложении, выгрузи выписку CSV, прогони через Python-скрипт, отправь результат в Slack» — для AgentQL это невозможно, а для Computer Use — обычный сценарий, при условии что у разработчика поднята соответствующая VM.
AgentQL живёт только в Playwright. Это ограничение и преимущество одновременно. Ограничение — потому что десктоп вне игры. Преимущество — потому что Playwright уже зрелый промышленный инструмент: headless и headed-режимы, network interception, корректная работа с iframe, с shadow DOM, эмуляция мобильных устройств, скриншоты для отладки. AgentQL наследует всю эту инфраструктуру и добавляет AI-слой только в том месте, где традиционно болит больше всего — в нахождении элементов.
На веб-задачах с предсказуемой структурой AgentQL обходит Computer Use по соотношению цена/надёжность. На задачах, где в одном пайплайне есть и веб, и десктоп, и shell-команды — Anthropic Computer Use остаётся единственным выбором из этой пары. На капчах и сложной антибот-защите ни один сервис не решает задачу самостоятельно: Anthropic в документации честно предупреждает, что Claude часто не распознаёт CAPTCHA, AgentQL по своей природе тоже их не обходит и оставляет это на сторонние сервисы.
На практике: если 80 % ваших задач — это «зайти на сайт, получить данные» — постройте основу на AgentQL и оставьте Computer Use на 20 % сложных кейсов (десктоп, нестандартный SaaS). Это даст ощутимую экономию на токенах и резко снизит долю flaky-тестов в CI.
Автономность и уровень контроля пользователя
Кто за рулём
Запустили оба сервиса на задаче «собрать с десяти конкурентов цены и положить в Google Sheet». Computer Use повёл себя как самостоятельный стажёр: иногда нашёл то, что мы не просили. AgentQL — как старательный исполнитель: сделал ровно то, что описано в запросе, ни шагом больше.
Anthropic Computer Use — про autopilot. После того как разработчик дал агенту цель и инструменты, Claude сам решает порядок действий, сам делает скриншоты, сам интерпретирует результат и сам берёт следующий шаг. Это близко к спектру «полный autopilot»: для production-сценариев Anthropic в документации настойчиво рекомендует human oversight и изоляцию в VM, потому что Claude в бете «иногда совершает непредвиденные действия». Откатить промежуточное состояние без специальной обвязки разработчик не может — это его ответственность.
AgentQL по природе ближе к императивному коду. Разработчик пишет последовательность шагов: page.goto(url), затем page.query_elements(...), затем element.click(). AI-слой подключается только на этапе «найди на странице то, что я описал», всё остальное — обычный Python или JS. У разработчика всегда есть контроль над каждым шагом, его можно отдебажить, поставить точку останова, увидеть, что вернул запрос, и принять решение, что делать дальше.
Эта разница важна не из академического интереса. Чем выше автономность, тем выше потолок сложности задач, которые агент закрывает без участия человека, — и тем выше риск побочных эффектов. Human-in-the-loop у Computer Use реализуется на стороне разработчика: можно перехватывать каждое action перед выполнением и подтверждать вручную для критичных шагов. У AgentQL human-in-the-loop встроен в саму архитектуру: каждый шаг и так пишет разработчик, поэтому критичных «сюрпризов» меньше по построению.
На практике: для задач с финансовыми последствиями (отправка платежей, изменение CRM-сделок, рассылки клиентам) автономия Computer Use без специально написанной обвязки опасна. Берите AgentQL — пусть это «более скучный» инструмент, но flaky-баг там фиксируется одной точкой останова в IDE.
Self-correction: обнаружение ошибок и восстановление
Когда что-то идёт не так
404, истёкшая сессия, новое модальное окно с cookies, изменившийся текст кнопки — реальная жизнь агента состоит из таких мелочей. От того, как сервис их переживает, зависит, останется ли он в проде через три месяца или будет тихо удалён из спринта.
Computer Use в бете живёт в режиме «vision-агент пытается продолжить». Если Claude кликнул не туда, он увидит результат на следующем скриншоте и в принципе может сообразить, что попал не на ту страницу, — и попробовать другой путь. Это работает, но непредсказуемо: иногда Claude правильно откатывается, иногда циклится на ошибочной интерпретации экрана, иногда уходит в десятиминутный поиск кнопки, которой нет. Anthropic в документации прямо предупреждает о рисках бесконечных циклов и непредвиденных действий и рекомендует timeout и watchdog на стороне разработчика.
AgentQL self-correction в чисто алгоритмическом смысле не делает. Если запрос не нашёл элемент — он возвращает None или ошибку, и дальше разработчик решает, что делать: попробовать другой запрос, подождать, перезагрузить страницу. Это менее «магично», но более понятно: видно, на каком шаге провалился, и почему. AI-слой здесь помогает в одном конкретном месте — устойчивости к изменениям HTML: если сайт чуть-чуть подкрутил разметку, запрос обычно продолжает работать без правок.
Главный вывод по self-correction: оба инструмента в этой паре требуют наружного watchdog'а. У Computer Use это критично — без timeout'ов и rate-limit'ов агент может в худшем случае съесть бюджет токенов за час. У AgentQL — желательно, но менее обязательно: ошибка просто прокидывается наверх и обрабатывается обычным try/except.
На практике: для Anthropic Computer Use закладывайте бюджетный watchdog и timeout на каждый «эпизод» агента (например, 50 шагов или 5 минут — что наступит раньше). Для AgentQL достаточно обычной error-handling-обвязки, как для любого Playwright-сценария.
Качество русского языка
Русский в боевых задачах
Открыть Wildberries, найти 50 карточек по запросу «беспроводные наушники» и собрать цены. Параллельно — попросить агента написать русскоязычный summary в Telegram. На русском интерфейсе и с русскоязычным выводом два сервиса ведут себя по-разному.
Anthropic Computer Use наследует языковые возможности Claude — а Claude один из лучших на рынке в работе с русским. Claude понимает русскоязычный prompt, корректно генерирует развёрнутые русскоязычные ответы, понимает русскоязычный текст на скриншоте веб-страниц и в десктопных приложениях. На практике это значит, что инструкции агенту можно писать на русском («открой ozon.ru, найди карточку iPhone 15»), и Claude не теряет смысла на длинной цепочке шагов.
AgentQL официально документация ведёт только на английском, и AgentQL-синтаксис тоже англоязычный ({ price product_name }). Это не значит, что русскоязычные сайты не работают — AgentQL отлично взаимодействует с русскоязычным HTML, потому что AI-слой опирается на семантику элементов, а не на язык. Но имена полей в запросе всё равно пишутся по-английски, документация и сообщения об ошибках — тоже. Для разработчика, который комфортен с английским в коде, это не блокер. Для no-code-сценария или для команды, где не все читают английский, — заметное трение.
Анти-сюрприз: даже англоязычная AgentQL-обвязка спокойно работает на русскоязычных сайтах, потому что AI-слой ищет по семантике («поле email», «кнопка оформить заказ»), а не по локализации. Поэтому в чисто скрейпинговых сценариях разница в качестве русского между двумя сервисами невелика. Разница острее там, где агент должен ещё и говорить с пользователем по-русски — для этого Computer Use поверх Claude гораздо удобнее.
На практике: если в задаче есть generative-часть на русском (резюме, переписка, тикет) — берите Computer Use. Если задача чисто извлекательная — AgentQL подойдёт даже команде, которая не любит писать комментарии на английском, потому что писать их нужно только в самой схеме запроса.
API и production-pipeline
Что значит «прод» для каждого
Берёшь чужой агент в свой бэкенд — упираешься в три вопроса: какие SDK есть, как считается биллинг, что с rate limit'ами. У этих двух сервисов ответы радикально разные.
Anthropic Computer Use использует обычное Anthropic API. Это значит — те же эндпоинты /v1/messages, та же аутентификация по API-ключу, те же SDK на Python и TypeScript, что и для любых других задач Claude. Computer Use включается через специальный заголовок anthropic-beta: computer-use-2024-10-22 и набор tools. Дополнительно поддерживаются AWS Bedrock и Google Vertex AI — оба канала используют те же примитивы, что упрощает выбор между прямым API и облачным провайдером.
AgentQL поставляет три способа использования: Python SDK (основной), JavaScript/TypeScript SDK и REST API для не-Python окружений. Есть Chrome Extension для интерактивной разработки и дебага запросов. С точки зрения интеграции это classic developer tool: SDK импортируется в проект, AgentQL вызывается рядом с Playwright и работает в той же транзакции — не требует отдельной инфраструктуры, кроме обычного Playwright-окружения.
На уровне production есть важный нюанс: Anthropic Computer Use официально остаётся в бета-статусе, а Anthropic явно не объявил дату выхода из беты. Это значит, что в production вы используете beta-flag, и Anthropic оставляет за собой право поменять контракт в minor-релизе. AgentQL формально не маркирован как beta, но по своей сути это семенной (seed-stage) стартап с командой соответствующего размера. Оба требуют осторожной интеграции с feature-flag'ами и понятным fallback'ом.
На практике: для production-интеграции Computer Use в больших организациях разумно идти через AWS Bedrock или Vertex AI — там есть привычный SLA-контракт облачного провайдера и понятные процедуры закупки. Для AgentQL — заворачивайте вызов в свой сервис с timeout'ом и кэшированием на стороне приложения.
Тарифы и стоимость владения за год
Сколько стоит одна задача
Команда строит monitoring цен у 50 конкурентов раз в сутки. На бумаге обе системы «дёшевы». В реальной стоимости за месяц — порядок-два разницы, в зависимости от того, сколько шагов делает агент.
Anthropic Computer Use тарифицируется как обычный Claude API. На лето 2025: Claude Sonnet 4.6 — $3 за 1M input-токенов и $15 за 1M output-токенов; Claude Opus 4.7 — $5 input / $25 output за 1M токенов. Computer Use отдельной платы не имеет. Стоимость одной задачи целиком зависит от числа шагов, поскольку каждый шаг — это новый скриншот (high-res скриншот может занимать 1000–3000 image-токенов) плюс textual context. На задачу в 50 шагов в Sonnet 4.6 в Anthropic dossier ориентируются на порядок $0.10–$0.50 за выполнение — это приблизительная вилка для типовой задачи, точные числа зависят от размера скриншотов и текста.
AgentQL работает по модели pay-per-query — плата за каждый AI-вызов на странице. Точные цены за запрос dossier фиксирует как data gap, но сам биллинг устроен предсказуемо: один запрос — одна транзакция, и стоимость не растёт нелинейно от числа «шагов агента», потому что AI-вызовов в типичной сессии гораздо меньше, чем у Computer Use. Free-тариф у AgentQL есть с ограниченным числом API-запросов в месяц (точный лимит dossier тоже отмечает как data gap).
Главный практический эффект: для одинаковой задачи Computer Use чаще всего дороже, и тем дороже, чем больше шагов. Скрейпинговая задача, которая в AgentQL — это один запрос с массивом результатов, в Computer Use — десятки шагов скриншот-клик-скриншот. Точные цены AgentQL компания не публикует, и это минус прозрачности — мы считаем такую непрозрачность недостатком и ставим оценку 7 как компромисс между структурной экономией и непрозрачностью прайса.
На практике: прежде чем строить долгий пайплайн на Computer Use, прикиньте число шагов в сутки и умножьте на $0.10–$0.50 — для большого объёма задач выйдет ощутимая сумма. Если задачу реально решает AgentQL, экономия по сравнению с Computer Use часто измеряется не процентами, а разами.
Скорость выполнения задач
Поспеть к утреннему отчёту
Раз в сутки агент должен собрать данные с 200 страниц и положить в Snowflake. С AgentQL это ночная задача в 10 минут. С Computer Use — мы дважды просыпались утром и видели, что задача всё ещё крутится.
Computer Use по природе медленный. Anthropic dossier описывает скорость одного шага как 2–10 секунд (скриншот в API → разбор скриншота моделью → возвращение action). Сложная задача в 20–30 шагов укладывается в 2–10 минут. Это близко к тому, как работает человек, но в десятки раз медленнее, чем традиционные web-инструменты. И никуда от этого не деться: vision-проход на каждый шаг — фундаментальная часть архитектуры.
AgentQL добавляет к Playwright «несколько сотен миллисекунд на запрос» — это уровень overhead'а, который не меняет порядок латентности обычного Playwright-сценария. Если скрипт без AI-слоя выполняется за 5 секунд, с AgentQL он выполнится за 6–8 секунд. Разница на одном порядке, не на двух-трёх. Для batch-задач это критично: ночная джоба, которая обходит тысячу страниц, на Computer Use просто не уложится в окно ночного обслуживания, а на AgentQL спокойно завершится до утра.
Где Computer Use отыгрывается — на сложных мультистеповых сценариях, где AgentQL вообще не применим (десктоп, нестандартный SaaS, переключение между приложениями). Там 10 минут Computer Use против невозможности AgentQL — лучше 10 минут.
На практике: для пакетных задач со временным окном (например, ночной импорт цен) считайте AgentQL по умолчанию и ищите причины не использовать его. Computer Use — для индивидуальных сложных запусков (один сложный кейс в день, OK подождать 5 минут), не для массовых ночных батчей.
Sandbox и изоляция: насколько безопасно запускать агента
Безопасность по построению
Агент, который вышел в живой прод вашего бизнеса без изоляции, — это инцидент в ожидании. Anthropic в документации Computer Use явно требует sandbox. AgentQL не требует — но и потолок риска у него заметно ниже.
Anthropic Computer Use по архитектуре получает доступ ко всему компьютеру: bash-tool позволяет выполнять произвольные shell-команды, text_editor — редактировать любые файлы, computer — управлять мышью и клавиатурой. В неосторожной конфигурации Claude может удалить файлы, запустить опасные команды, отправить email, сделать платёж. Anthropic это понимает и в документации требует: запускать в изолированной VM или контейнере, выдавать минимальные права (никакого root по умолчанию), держать human oversight на критичных операциях. В репозитории anthropic-quickstarts опубликован reference Docker image на базе Ubuntu + VNC + Claude — именно как тестовый sandbox.
AgentQL, в отличие от Computer Use, ограничен сферой действия Playwright: открыть страницу, нажать кнопку, заполнить форму, получить данные. Никаких rm -rf, никаких bash-команд, никакого прямого доступа к локальной файловой системе вне обычных возможностей Playwright. Это значит, что «sandbox по построению» у AgentQL гораздо строже: даже если AI-слой совершит ошибку, потолок ущерба ограничен возможностями браузера. Credentials AgentQL не получает прямо — разработчик сам управляет сессиями Playwright, и в правильной конфигурации агент не логинится сам, а работает в уже авторизованной сессии.
Это не значит, что AgentQL «безопасен по умолчанию» — в правильной комбинации с авторизованной сессией он может, например, оформить заказ на маркетплейсе или поменять CRM-сделку через UI. Но потолок риска у него ниже: всё, что Playwright не умеет, AgentQL тоже не умеет. У Computer Use потолок принципиально выше — он работает на компьютере, и без явного sandbox'а ущерб от ошибки тоже выше.
На практике: если безопасность — формальная процедура (банк, госорг, регулируемая отрасль), AgentQL проще пропустить через ИБ, потому что у него уже Playwright-shape risk. Для Computer Use готовьте playbook на тему «изолированная VM, ограниченные права, watchdog, журналирование всех действий» — без этого ИБ-офицер откажется санкционировать прод.
Доступность из России и оплата российскими картами
Из российского офиса
Разработчик в Москве хочет интегрировать любой из двух сервисов в production-пайплайн. Anthropic блокирует RU IP напрямую. AgentQL — нет, но платить с российской карты всё равно нельзя. Эти ограничения часто решают выбор задолго до технического сравнения.
Anthropic Computer Use напрямую через api.anthropic.com из России недоступен: Anthropic блокирует RU IP. Обходной путь — AWS Bedrock или Google Vertex AI: оба официально поддерживают Computer Use и в ряде регионов работают без жёсткой IP-блокировки. Здесь dossier явно фиксирует data gap: точный статус Bedrock access для RU-пользователей требует проверки. Оплата — только через зарубежную карту или корпоративный AWS аккаунт. Это означает, что для российской команды путь к Computer Use лежит через AWS-обвязку, AWS-аккаунт у компании с возможностью оплаты, и человека, который умеет правильно завести Bedrock credentials.
AgentQL устроен по-другому. API-сервис в принципе доступен без VPN, что подтверждает dossier (компания не объявляла RU-блокировок). Документация — только английская, оплата — только зарубежной картой. Русскоязычной поддержки и российского биллинга нет, что ожидаемо для seed-стартапа. Сервис будет работать с русскоязычными сайтами через описание элементов на английском — русскоязычный синтаксис не тестировался официально, но как мы заметили в подтеме про русский язык, AI-слой ищет по семантике и обычно справляется.
Для российской команды это значит: AgentQL ставится в проект быстрее и проще, потому что не требует обвязки через AWS. Computer Use ставится дольше, потому что упирается в инфраструктурные требования к AWS-аккаунту и зарубежной оплате. Эта разница часто решает выбор задолго до того, как команда сравнивает технические возможности.
На практике: для российского стартапа без AWS-обвязки AgentQL — практичный старт. Для крупной компании с зарубежной материнской структурой и AWS-аккаунтом Computer Use остаётся в игре, но требует более сложной legal- и финдиректорской работы. Закладывайте на оплату через зарубежную карту или AWS Marketplace.
Безопасность данных и compliance (SOC2, GDPR, no-training-on-data)
Разговор с ИБ-офицером
Перед тем как развернуть агента, который ходит во внутренние SaaS компании, безопасник попросит SOC 2, политику обучения моделей и описание, что происходит с данными внутри агента. У наших двух героев ответы радикально разной полноты.
Anthropic в целом сертифицирован по SOC 2 Type 2 — это касается Anthropic API в целом, включая Computer Use. По дефолту API не использует данные клиентов для обучения моделей; для Enterprise-контрактов это явно зафиксировано. При работе с Computer Use скриншоты передаются в Anthropic API — это важный момент для compliance: если на скриншоте есть персональные данные клиентов, эти скриншоты технически уходят за периметр организации. Для регулируемых отраслей это решается либо через AWS Bedrock / Vertex AI (где обработка идёт в выбранном регионе), либо через явные маски на стороне инструмента, скрывающие чувствительные поля.
AgentQL заметно слабее по compliance-документации. Dossier явно фиксирует data gap по «полной privacy policy». Известно одно: HTML страниц отправляется на серверы AgentQL для AI-обработки — это значит, что для compliance-критичных доменов придётся отдельно изучать политику и контракты. SOC 2 у AgentQL открытых упоминаний нет, и для seed-стартапа этого обычно ещё не существует. Финансирование — Seed раунд $2M (Crunchbase, dossier помечает актуальность как data gap) — соответствует ранней стадии: ресурсов на enterprise-compliance ещё мало.
Непрозрачность compliance-политик AgentQL мы считаем минусом для production-сценариев в регулируемой отрасли — пользователь не может принять полностью информированное решение. Для базовых сценариев скрейпинга публичных страниц это не блокер, но для интеграции с внутренними CRM/ERP — стоп-сигнал, пока команда AgentQL не опубликует развёрнутую privacy policy.
На практике: для регулируемых отраслей (банки, медицина, госсектор) выбирайте Computer Use через AWS Bedrock с фиксированным регионом и явным DPA. AgentQL — для публичных страниц и скрейпинга без персональных данных, либо после прямого письменного запроса в Tinyfish и получения политики, удовлетворяющей вашего ИБ-офицера.
Сценарии победы первого сервиса (use-cases)
Где Computer Use забирает раунд
Не все задачи решаются скрейпингом HTML. Есть кейсы, где Computer Use остаётся единственным разумным выбором из этой пары, — и таких кейсов в реальной жизни больше, чем кажется на первый взгляд.
Первый сценарий — работа с десктопными приложениями. Корпоративный BI-клиент на Electron, ERP-система с локальным толстым клиентом, банковский dashboard в десктопной форме — всё, что не открывается в браузере или открывается с серьёзными ограничениями, для AgentQL вне зоны действия. Computer Use здесь подключается к VM, открывает приложение, делает скриншоты и кликает мышью. Это не быстро и не дёшево, но это работает.
Второй сценарий — нестандартные SaaS с тяжёлым canvas-интерфейсом, drag-n-drop, мышиными жестами и динамической анимацией. Архитектура AgentQL рассчитана на «семантический DOM», а сложный canvas — это пиксели, не семантика. Computer Use в этой ситуации видит то, что видит человек, и применим там, где AgentQL «не находит элемент».
Третий сценарий — end-to-end workflow, где задача требует переключения между приложениями: открыть BI-систему, выгрузить отчёт в CSV, открыть LibreOffice, сделать пивот, отправить в Slack. AgentQL не покрывает эту цепочку, потому что выходит за границы Playwright. Computer Use с tools bash и text_editor — покрывает.
Четвёртый сценарий — задачи, где помимо взаимодействия с интерфейсом нужно ещё и рассуждать на русском или английском о собранных данных и писать развёрнутый отчёт. Claude в Computer Use делает это в той же сессии, AgentQL не делает в принципе (он только извлекает, а не пишет тексты).
Пятый сценарий — early-stage prototype, где задача — показать боссу, что «агент может». Computer Use с reference Docker image заводится за час; видео результата выглядит впечатляюще. AgentQL для такой демонстрации тоже годится, но визуально менее эффектен — это код в IDE, не «робот, который сам кликает».
На практике: если в вашей задаче есть хоть один пункт из этих пяти — Computer Use остаётся в шорт-листе. Если нет ни одного — AgentQL почти всегда выгоднее по цене, скорости и надёжности.
Сценарии победы второго сервиса (use-cases)
Где AgentQL забирает раунд
Кажется, что AgentQL — это «слабый Computer Use без десктопа». На самом деле AgentQL — это «правильный инструмент для производственного web-скрейпинга», где Computer Use по цене и скорости проигрывает на порядок.
Первый сценарий — массовый скрейпинг данных. Раз в сутки обойти тысячу страниц конкурентов, собрать цены, положить в DWH. AgentQL прокачивает это за десятки минут с параллелизмом, Computer Use не уложится в окно ночного обслуживания — слишком много шагов, слишком много токенов, слишком много латентности.
Второй сценарий — поддерживаемый production-pipeline с минимальной флакостью. Запрос AgentQL — это структурированный код, который версионируется в git'е, ревьюится в pull request'е, тестируется в CI с моками. Computer Use в production требует пристального human oversight'а, которого нет у любого автоматического CI/CD, — а значит, флакость уходит в логи на проде.
Третий сценарий — сайты, которые часто меняют вёрстку (маркетплейсы перед чёрной пятницей, медиа во время редизайнов). AgentQL по построению адаптируется к смене HTML — запрос «найди карточку товара с ценой и названием» переживает редизайн в подавляющем большинстве случаев. CSS-селекторы в чистом Playwright ломаются, AgentQL — реже.
Четвёртый сценарий — команда уже на Playwright. AgentQL — это надстройка над Playwright; разработчик добавляет AI-слой инкрементально, не переписывая весь сценарий. Это типичный «низкий риск миграции», когда основу не выбрасываем, а просто заменяем самые хрупкие куски (поиск элементов) на AI-вариант.
Пятый сценарий — российская команда без сложной AWS-обвязки. AgentQL API в принципе доступен без VPN, а Anthropic Computer Use напрямую — нет; в этой паре AgentQL значительно проще стартовать.
На практике: если ваша задача — «промышленный сбор данных с веба» в любой формулировке, AgentQL почти всегда выгоднее. Computer Use в этих сценариях — это «купили грузовик, чтобы возить одно письмо в день». Контекст всей категории — в обзоре ИИ-агентов.
Портреты пользователей с адресными рекомендациями
Четыре реальных читателя AIRatings
Чтобы не утонуть в общих формулировках, мы взяли четыре конкретных профиля специалистов, которые сейчас выбирают между этими двумя инструментами. Каждому — адресная рекомендация и поэтапный план: free → платный → решение.
Александр, backend-разработчик в маркетплейсе, Москва. Задача: каждую ночь обходить 200 страниц конкурентов и складывать цены в Clickhouse. Команда уже работает на Playwright, есть CI на GitHub Actions. Боль: каждый месяц 1–2 скрипта ломаются после редизайна. Наша рекомендация — AgentQL. Поэтапно: возьмите free-тариф, перепишите один самый хрупкий скрейп на AgentQL, прогоните неделю и сравните частоту падений с обычным Playwright. Если падения сократились — переводите остальные ночные джобы. Computer Use здесь не подходит: цена за 200 страниц × 50 шагов будет ощутимой за месяц, а латентность сорвёт окно ночного обслуживания.
Мария, продакт в R&D-лаборатории крупного банка, Санкт-Петербург. Задача: построить прототип агента, который умеет работать с десктопным AML-клиентом банка (Electron, не браузер) — открывать карточку клиента, проверять документ, ставить пометку. Команда умеет в AWS, есть корпоративный аккаунт Bedrock. Наша рекомендация — Anthropic Computer Use через AWS Bedrock. AgentQL здесь технически не применим: десктопный клиент не открывается в Playwright. Поэтапно: тестовый VNC-стенд с reference Docker image от Anthropic, прогон на 10 кейсах, оценка стоимости и точности; затем — официальный security review через ИБ банка и Bedrock-контракт.
Юлия, основательница стартапа в e-commerce, Краснодар. Задача: собирать данные с десяти ниш Wildberries и Ozon, чтобы вычислять трендовые товары. Бюджет небольшой, AWS-аккаунта нет, оплата только через карту друга в Европе. Команда — два разработчика на Python. Наша рекомендация — AgentQL. Free-тариф закрывает первые тесты бесплатно, дальше pay-per-query предсказуем. Computer Use здесь требует AWS-обвязки, которой у команды нет, плюс существенно дороже на typical-задаче скрейпинга. Поэтапно: free-тариф AgentQL на неделю, потом минимальный платный план на месяц, потом масштабирование.
Иван, ИТ-директор средней компании в Подмосковье, Долгопрудный. Задача: автоматизировать onboarding нового сотрудника — заведение в шести SaaS-системах одновременно, часть из которых имеет десктопного клиента. Регулярная задача, 5–10 onboarding'ов в месяц. Команда — один разработчик-универсал. Наша рекомендация — комбинированная: AgentQL для веб-сервисов, Computer Use для одного-двух десктопных клиентов. Поэтапно: AgentQL берётся first, тестируется на самых частых сервисах из шести; Computer Use добавляется только для тех 1–2 шагов, которые без него никак — через AWS Bedrock, под надзором разработчика, без полного autopilot.
На практике: не покупайте обе подписки сразу — это лишний бюджет. Возьмите free-тариф AgentQL, попробуйте свою задачу неделю; если AgentQL её закрывает — оставайтесь там. Если упёрлись в десктоп или нестандартный UI — добавляйте Computer Use под этот конкретный кусок, не перенося на него весь пайплайн.
Итоговая таблица оценок
| Подтема |
AG
AgentQL
|
AC
Anthropic Computer Use
|
|---|---|---|
| 1.Карта подгрупп: что эти два сервиса реально делают | 7 | 8 |
| 2.Архитектурные ниши и стилистические различия | 8 | 8 |
| 3.Выполнение задач в браузере и computer use | 8 | 7 |
| 4.Автономность и уровень контроля пользователя | 5 | 7 |
| 5.Self-correction: обнаружение ошибок и восстановление | 6 | 6 |
| 6.Качество русского языка | 6 | 8 |
| 7.API и production-pipeline | 8 | 7 |
| 8.Тарифы и стоимость владения за год | 7 | 5 |
| 9.Скорость выполнения задач | 8 | 4 |
| 10.Sandbox и изоляция: насколько безопасно запускать агента | 8 | 6 |
| 11.Доступность из России и оплата российскими картами | 6 | 4 |
| 12.Безопасность данных и compliance (SOC2, GDPR, no-training-on-data) | 5 | 8 |
| 13.Сценарии победы первого сервиса (use-cases) | 4 | 9 |
| 14.Сценарии победы второго сервиса (use-cases) | 9 | 4 |
| 15.Портреты пользователей с адресными рекомендациями | 7 | 7 |
| Итого (средняя) | 6,8 | 6,5 |
Методика: каждая подтема оценивалась по шкале 1–10. Итоговая средняя — арифметическое всех подтем.
Финальный вердикт
Короткие итоги по каждому сервису — чтобы не перечитывать весь обзор.
Anthropic Computer Use
Берите Anthropic Computer Use, если задача выходит за границы браузера: десктоп, сложный canvas, end-to-end-workflow с переключением приложений, или нужна generative-часть на русском в той же сессии. Закладывайте AWS Bedrock/Vertex для доступа из РФ, sandbox-VM, watchdog и бюджет на токены, особенно на Opus 4.7.
Попробовать Anthropic Computer Use
AgentQL
Берите AgentQL, если 80% задач — это получение данных или заполнение форм на веб-странице, особенно если команда уже на Playwright. Это предсказуемо, дёшево, легко ставится в production без AWS-обвязки. Начинайте с free-тарифа, измеряйте частоту падений сценариев и переводите остальные ночные джобы на AgentQL по мере доверия.
Попробовать AgentQLДругие обзоры в категории
Все обзоры →Anthropic Computer Use vs Agent Zero 2026: API-примитив против open-source мультиагента
AutoGPT vs MultiOn 2026: open-source агент против API для веб-автоматизации
Devin vs AgentQL 2026: autonomous coding-agent против query-language для Playwright
Devin AI vs Agent Zero 2026: $500/мес коммерческий vs open-source агент
AutoGPT vs Lindy AI 2026: open-source фреймворк против no-code SMB-платформы
Anthropic Computer Use vs MultiOn 2026: сравнение API-агентов
Обсуждение
Будьте первым, кто оставит комментарий.
Используете один из сервисов регулярно? Напишите подробный отзыв с оценками — это формат больше короткого комментария.
Написать отзыв
Оставить комментарий