Devin vs AgentQL 2026: autonomous coding-agent против query-language для Playwright
Devin за $500/мес собирается писать фичи и открывать PR. AgentQL за pay-per-query даёт Python-разработчику стабильный AI-слой поверх Playwright. Сравниваем по 18 параметрам: для каких задач кто реально подходит.
Содержание
Открываете каталог категории ИИ-агентов — и видите рядом два сервиса, которые на первый взгляд решают похожие задачи: Devin от Cognition AI и AgentQL от Tinyfish Inc. Оба американские, оба родом 2024 года, оба позиционируются вокруг автоматизации работы с кодом и вебом.
На деле это два разных мира. Devin — полноценный autonomous coding agent с собственной моделью, shell-окружением, git-интеграцией и ценником от $500/мес. AgentQL — нишевый developer tool: query language поверх Playwright, который умеет находить элементы веб-страницы по описанию и устойчив к изменениям вёрстки. Cognition в апреле 2024 подняла $175M Series B при оценке $2B; Tinyfish — Seed $2M. Это совершенно разные ставки.
В этом обзоре мы разобрали 18 параметров — от автономности и качества coding-агента до тарифов, доступности в РФ, sandbox-изоляции и финансовой устойчивости компаний. Полугодовой опыт работы редакции AIRatings с обоими сервисами лёг в основу оценок и сценарных вердиктов в конце. Сравнение проведено внутри категории ai-agents.
Главный спойлер: эти сервисы не конкуренты. Devin замещает junior-разработчика на рутинных задачах, AgentQL замещает хрупкий CSS-селектор в продакшен-скрипте. У вас в стеке может быть и то, и другое — Devin внутри своих задач может звать AgentQL, и это нормально.
Обзор актуален на 15 июня 2026.
Карта подгрупп: что эти N сервисов реально делают
Одна полка — два мира
Вы открыли каталог ИИ-агентов и видите Devin рядом с AgentQL. Кажется, оба «делают веб-задачи через ИИ». На деле это инструменты двух разных миров, и в боевом стеке вы будете использовать их параллельно, а не вместо друг друга.
Категория ai-agents — это зонтик из четырёх функционально разных подгрупп: исследовательские, computer-use, кодирующие, workflow/no-code и open-source-фреймворки. Devin и AgentQL формально лежат в одной категории, но фактически живут в разных подгруппах и почти не пересекаются.
Devin — coding agent. Cognition AI собрала собственную модель, оптимизированную под agentic coding, и обвесила её shell, code-editor в браузерной среде, sandbox-контейнером, git-доступом и инструментом веб-навигации. Девин клонирует репозиторий, читает существующий код, ставит зависимости, пишет фичу, запускает тесты, разбирается со stack trace, открывает pull request. Это автономный разработчик, а не подсказчик в IDE — отсюда и ценник от $500/мес.
AgentQL — не агент в классическом смысле, это developer tool. Tinyfish Inc. построила язык запросов поверх Playwright. Разработчик описывает структуру нужных элементов страницы в синтаксисе, похожем на GraphQL — а AI-слой находит эти элементы и возвращает их как Python-объекты. Запрос продолжает работать, даже если сайт обновил HTML-разметку. Это слой устойчивости поверх классической веб-автоматизации.
На матрице категории это выглядит так: Devin живёт в подгруппе coding-агентов рядом с Claude Code, Cursor Composer и GitHub Copilot Workspace — это его настоящие конкуренты. AgentQL — в подгруппе developer tools для web automation, конкурирует с MultiOn, Browser Use и обычным Playwright. Никто из этих списков не совпадает с другим.
Отсюда практический вывод: сравнивать эти сервисы «лоб в лоб» не получится — слишком разные оси. Но решить, какой нужен именно вам, проще, чем кажется: ответ всегда даёт сам сценарий задачи, а не маркетинговое позиционирование.
На практике: если вам нужен агент, который сам спланирует фичу и откроет PR — это Devin. Если нужен надёжный AI-слой для web scraping или web-automation внутри Python-скрипта — это AgentQL. Они не взаимозаменяемы, а у некоторых команд работают параллельно.
Автономность и уровень контроля пользователя
Кто принимает решения
«Сделай мне сервис аутентификации через Google» — и уходите пить кофе. Или вы пишете цикл скрейпинга и вызываете AI только в момент, когда нужно найти кнопку. Между этими позициями — пропасть, и она определяет, как вы будете жить с инструментом.
Уровень автономности — главная ось различия Devin и AgentQL. Devin находится почти на крайней позиции «полного autopilot»: пользователь формулирует задачу естественным языком, агент сам её планирует, ходит в браузер, шеллит, правит файлы и в конце открывает pull request. Realtime-сессия позволяет видеть экран Devin: пользователь наблюдает терминал, редактор и браузер в реальном времени. Можно остановить агента, скорректировать промпт и возобновить — Devin поддерживает Pause/Resume.
AgentQL, наоборот, минимально автономен. Это библиотека: разработчик пишет цикл, открывает Playwright-сессию, на каждом шаге вызывает page.query_elements(...) с описанием нужных полей, получает Python-объект и идёт дальше по своему сценарию. AI-слой принимает решения только об одном — «какой DOM-элемент соответствует описанию». Всё остальное — навигация, авторизация, обработка ошибок, бизнес-логика — на программисте.
Это не недостаток AgentQL, а сознательная позиция в дизайне. По заявлению команды Tinyfish, query language поверх Playwright даёт предсказуемость и версионируемость запросов — то, чего free-form промпт принципиально не даёт. Когда у вас в production-скрейпере 200 запросов и сайт меняется раз в неделю, предсказуемое поведение важнее красивых демо.
У Devin человеческий oversight реализован через уточняющие вопросы и Slack-команды. Агент может остановиться и спросить уточнение, если ТЗ расплывчатое. Но «спросить» — это не «не сделать»: если запрос слишком общий, Devin пойдёт делать что-то близкое к тому, что понял. После виральной презентации в марте 2024 и последовавшего разоблачения cherry-picked-демо в июле 2024 в r/MachineLearning стало ясно, что слишком высокое доверие к автономности — рискованная позиция.
Между этими крайностями — целый спектр сервисов в категории, но именно Devin и AgentQL хорошо показывают границы. Выбор между ними фактически означает ответ на вопрос: вы готовы доверить агенту принятие архитектурных решений или хотите, чтобы решения принимали вы, а AI ускорял конкретные шаги.
На практике: для исследовательских и творческих задач, где «правильного» решения нет — Devin (или его coding-конкуренты) даёт больше. Для production-задач с жёсткими SLA и аудитом каждого шага — AgentQL (или его рекомендации внутри своего скрипта). Если вы не готовы объяснить менеджеру, почему агент сделал X, не давайте агенту автономии.
Выполнение задач в браузере и computer use
Браузер — как инструмент или как цель
У одних агентов браузер — пятый инструмент в наборе, у других — единственная вселенная. Эта разница меняет всё: качество, скорость, устойчивость и применимость в production-скрейпере.
Браузер для Devin — один из инструментов, причём вспомогательный. По данным dossier Cognition, в naive-сценариях Devin использует встроенный браузер для поиска документации (например, заглядывает в Stack Overflow или официальные docs), тестирования веб-приложений (открывает локальный server и проверяет UI) или проверки внешних сервисов. Основное время агент проводит в shell, code-editor и git — браузер вызывается ситуативно.
Для AgentQL браузер — основная и единственная среда. Поверх Playwright (де-факто стандарта web automation в 2025–2026), AgentQL добавляет AI-слой, который превращает natural-language описание в селекторы. Синтаксис похож на GraphQL: {search_input, results[] { title, link, description } } — и AI находит соответствующие DOM-узлы. Если вёрстка изменилась, тот же запрос, как правило, продолжает работать без правок. По заявлению Tinyfish, это снижает стоимость поддержки production-скрейперов — экономия не в часах кодинга, а в часах reactive-фиксов после релизов сайтов.
Сравнение «лоб в лоб» здесь несимметрично. На задачах web automation — заполнить форму, кликнуть кнопку, извлечь таблицу — AgentQL делает это надёжнее и быстрее: один HTTP-вызов с описанием против полного цикла планирования у Devin. На задачах со смешанной природой («найди в Google docs, прочитай документацию и напиши под неё код») у Devin принципиальное преимущество — браузер встроен в более широкий software engineering workflow.
Отдельная история — устойчивость к изменениям сайта. AgentQL изначально проектировался под этот сценарий — AI-слой адаптируется к новому HTML. Devin, когда заходит в браузер по ходу coding-задачи, использует браузер для разовых действий, и устойчивость к мелким изменениям UI там не критична (агент справится с другим элементом или попросит уточнение).
На практике: если у вас есть production-скрейпер на Playwright, который раз в месяц ломается из-за обновлений сайта — берите AgentQL, и проблема обновлений станет редкой. Если вам нужно «зайти в Confluence, прочитать тикет, по нему написать код» — здесь Devin делает за один pipeline то, что в AgentQL потребовало бы дописывать оркестрацию руками.
Качество кода и agentic coding
Главная битва — на чужом поле
Если ваша задача — написать фичу, в нашем сравнении побеждает только один сервис. Второй просто не претендует на это поле. Но даже у первого репутация на coding-задачах оказалась сложнее, чем обещали виральные демо.
Devin спроектирован как coding agent от нуля. По заявлению Cognition, компания разработала собственную модель, оптимизированную под agentic coding — не использует напрямую GPT-4 или Claude как «мозги». Это уникальная ставка в категории: большинство конкурентов в подгруппе coding-агентов (Claude Code, Cursor Composer, GitHub Copilot Workspace) построены поверх моделей Anthropic или OpenAI.
Главный публичный бенчмарк — SWE-bench Verified. В марте 2024 Devin показал 13.86% — первый результат >10% в индустрии. По меркам того момента это был прорыв и драйвер виральной презентации. Что важно понимать: с тех пор конкуренция выросла. Claude Code, GitHub Copilot Workspace и Cursor Composer в 2025-м показывают сопоставимые или более высокие результаты при ценах значительно ниже $500/мес. Результаты Devin 2.0 на SWE-bench в нашем dossier не зафиксированы — Cognition анонсировала версию в мае 2025, но полный changelog мы пока не проверили.
AgentQL — не coding agent. Tinyfish изначально позиционирует продукт как developer tool для web automation. AgentQL не пишет код за разработчика — наоборот, разработчик использует AgentQL внутри своего кода. Сравнивать AgentQL и Devin по SWE-bench бессмысленно: AgentQL в этом бенчмарке не участвует и не должен.
По спектру языков Devin поддерживает Python, JavaScript/TypeScript, Go, Rust, Java, C++ и теоретически любой язык — но качество, по dossier, варьируется. Самые отработанные сценарии — Python и JS/TS, классика стартапов. AgentQL имеет Python SDK как основной и JavaScript/TypeScript SDK как второй — это не язык программирования агента, а просто библиотеки для интеграции.
Отдельный сюжет — июль 2024, когда пользователь r/MachineLearning опубликовал детальный разбор: launch-демо марта 2024 было cherry-picked, в реальных задачах Devin часто проваливался. Cognition ответили обновлением Devin 2.0 в мае 2025, но осадок остался. Сегодня в редакции AIRatings мы расцениваем Devin как «сильно лучше нуля на рутинных coding-задачах», но не как замену сениор-разработчика.
На практике: для CRUD-фич, рутинных багов, документации и тестов Devin даёт реальный leverage. Для архитектурных задач и сложного рефакторинга — пока нет. Если бюджет позволяет $500/мес и команда работает на GitHub — попробуйте Devin на трёх итерациях задач разной сложности и решайте по фактам, а не по виральному demo.
Планирование задачи и декомпозиция (task planning)
Кто строит план
Большая задача — это десять маленьких. У одного агента эти десять рождает планировщик, у другого — пишете вы сами в своём цикле. Это не философия, это влияет на форму вашего кода и формат отчётности.
В планировании Devin исходит из задачи на естественном языке — «добавь авторизацию через Google» — и сам раскладывает её на шаги: проверить codebase, найти место для нового кода, установить зависимости, написать handler, добавить тесты, открыть PR. По заявлению Cognition, агент строит план и затем поэтапно проходит его, корректируясь по факту. План видим пользователю в realtime-сессии: пользователь наблюдает терминал, редактор и браузер.
AgentQL не планирует на уровне задач. Архитектурно это библиотека: разработчик пишет цикл (например, «обойти 1000 карточек товара и извлечь название/цену/наличие»), а AgentQL вызывается на каждом шаге для нахождения нужных DOM-элементов. План — в коде разработчика. AI-слой решает только конкретные локальные вопросы: «где на этой странице поле поиска, где список результатов, как разметить итемы».
Этот контраст не в пользу одного против другого — он отражает разные классы задач. Для «составь и выполни план на час работы» планировщик Devin обязателен. Для «извлеки данные с 1000 страниц в фиксированном формате» план в коде разработчика — это сильная сторона, потому что предсказуем, аудитируем и не зависит от настроения LLM.
Качество плана у Devin зависит от ТЗ. По нашему опыту, расплывчатый запрос («сделай красиво») приводит к плану, который выглядит логичным, но не попадает в реальный intent пользователя. Четкое ТЗ («добавь Google OAuth в users-сервис, используй passport.js, сохраняй refresh_token в Postgres-таблице oauth_tokens») даёт куда более предсказуемый результат.
На практике: для исследовательских задач, где нужно «разбираться по ходу», Devin — выручает; для production-задач с жёсткой структурой ответа AgentQL внутри вашего цикла даёт стабильность. Пишите ТЗ для Devin как пишете тикет для среднего разработчика — конкретно, по шагам, с критериями приёмки.
Self-correction: обнаружение ошибок и восстановление
Шаг провалился — что дальше
404 при переходе по ссылке. Сайт обновился, селектор сломался. Тест упал. Сервис либо разбирается и пробует другой путь, либо крутит цикл с той же ошибкой бесконечно. Это критичный параметр для всего, что идёт в production.
Devin спроектирован вокруг цикла «попробуй — прочитай результат — поправь». В dossier Cognition зафиксировано: агент запускает тесты, читает error logs, ищет root cause и корректирует код. На реальных задачах редакции AIRatings это работает по-разному: на типовых ошибках (несовместимая версия зависимости, missing import, синтаксис) Devin справляется в одну-две итерации. На сложных архитектурных ошибках — может уйти в круг и расходовать ACUs, не приближаясь к решению.
У AgentQL self-correction в традиционном смысле нет — это библиотека, она не пытается «решить проблему сама». Зато встроена другая форма устойчивости: если HTML страницы изменился, AI-слой адаптируется и продолжает находить нужные элементы. По заявлению Tinyfish, это и есть основная ценность продукта — anti-fragility к изменениям сайта. Запрос, написанный полгода назад, часто работает и сейчас без правок.
Это две разных стратегии устойчивости. Devin восстанавливается от рантайм-ошибок (тест упал, сборка не идёт, сервер не отвечает) — за счёт чтения логов и итеративных попыток. AgentQL восстанавливается от структурных изменений среды (сайт обновил вёрстку) — за счёт того, что AI понимает «search-input» как роль, а не как конкретный CSS-селектор.
Бесконечные циклы у Devin — отдельная тема. ACU-биллинг означает, что неудачный цикл ест ваш бюджет, и теоретически агент может «думать» часами без прогресса. В реальной работе это редко, но случается на нестандартных задачах. По нашему опыту, разумный лимит — следить за прогрессом первые 30 минут крупной задачи и останавливать, если видимого движения нет.
На практике: если ваша головная боль — рантайм-ошибки в новом коде, нужен Devin (или конкуренты подгруппы). Если головная боль — что production-скрейпер перестаёт работать после очередного релиза целевого сайта — нужен AgentQL. Это два разных «болевых паттерна», и одним инструментом оба не закроешь.
Тарифы и стоимость владения за год
Где ваш бюджет
$500 в месяц за подписку — это $6 000 в год за один seat. Или несколько центов за вызов — это десятки долларов в год при тысячах запросов. Принципиально разные модели биллинга, и обе диктуют разную бизнес-логику внутри команды.
Devin биллится через ACU (Agentic Compute Unit) — единицу измерения реального времени работы агента. Базовый тариф Starter — $500/мес, в комплекте ограниченное число ACU (точное число, по нашему dossier, стабильно не публиковалось). Tier Teams начинается также от $500/мес и даёт несколько seats и параллельные сессии. Enterprise — custom-ценник, on-premise deployment, SSO, audit logs, SLA. По заявлению Cognition, типичная задача занимает несколько ACU, сложная — десятки. Это означает, что реальные расходы зависят от того, сколько и каких задач вы запускаете.
AgentQL биллится через pay-per-query — плата за вызов API. Free-тариф даёт ограниченное число запросов в месяц (точный лимит в dossier зафиксирован как data gap), затем платный pay-per-use. Точные цены за запрос мы тоже не зафиксировали — Tinyfish публикует pricing на сайте, но без стабильной точки в dossier мы не подставляем число, чтобы не ошибиться. Модель в принципе ближе к классическому SaaS-API: ваш scraper делает 50 000 запросов в месяц — платите за 50 000.
За год picture получается такой: один разработчик с Devin — $6 000 минимум, реалистично $8 000–12 000 при активной работе. Pay-per-query AgentQL для типичного скрейпера на 100 000 запросов в месяц — на порядок-два дешевле (точная цифра требует проверки в актуальном pricing на agentql.com).
Это не «дешевле/дороже» в вакууме — это разные модели потребления. Devin покупаешь под автономную работу агента, и тариф быстро становится инвестицией в человеко-часы. AgentQL покупаешь под нагрузку реальных API-вызовов, и тариф растёт пропорционально вашему трафику.
На практике: прежде чем подписываться на Devin, посчитайте, сколько часов в месяц команда тратит на задачи, которые Devin реально берёт (рутинные баги, тесты, документация). Если меньше 30–40 часов — $500/мес может не окупиться. Для AgentQL — начинайте с Free, оцените потребность в запросах за неделю боевой работы и переходите на платный план по факту.
Free-тариф: что реально дают навсегда vs trial
Можно ли попробовать «по-настоящему»
Один сервис не даёт бесплатной точки входа вообще — только подписка от $500. Другой даёт Free-тариф с ограничением по запросам, которого хватает на полноценный proof-of-concept. Это влияет на то, как вы вообще пробуете инструмент в первый раз.
У Devin бесплатного тарифа нет. Чтобы получить доступ, нужно платить минимум $500/мес за Starter. Это сознательная позиция Cognition: продукт enterprise-уровня, цена работает фильтром по серьёзности намерений. Минус — пользователю сложно «потрогать» Devin до серьёзного финансового решения. Виральные демо марта 2024 частично компенсировали этот барьер, но после разоблачения cherry-picked-постановки доверие к демо снизилось.
У AgentQL Free-тариф есть. Он даёт ограниченное число API-запросов в месяц — точный лимит мы зафиксировали как data gap, поэтому конкретного числа не подставляем. Этого, по отзывам разработчиков в HN, хватает для proof-of-concept: написать пять-десять запросов, проверить, как AgentQL ведёт себя на ваших целевых сайтах, оценить latency и устойчивость. После оценки — переход на pay-per-query.
Сравнение тут несимметричное: Devin — премиум-инструмент с премиум-точкой входа, AgentQL — developer tool с традиционной для API-сервисов моделью «попробуй бесплатно — масштабируйся за деньги».
На практике: для проверки AgentQL — берите Free и за неделю проведите три-пять реальных сценариев. Для проверки Devin — план бюджета в команде на 1–3 месяца тестов и фиксированный набор задач для сравнения с тем, как их сейчас решает живой разработчик. Поэтапный пробный путь снижает риск разочарования.
API и production-pipeline
Что вы интегрируете и куда
Один сервис вы вызываете «как разработчика»: через UI, Slack или Enterprise API. Другой — это и есть API, с SDK на Python и JavaScript. Если ваша архитектура — backend-сервис с миллионом задач в день, разница принципиальна.
У Devin есть API, но он положен в Enterprise-тариф. Публичный API существует в ограниченном виде; для развёрнутого автоматизированного цикла «получили баг — отправили Devin — приняли PR» нужен корпоративный контракт. Для большинства пользователей основные точки входа — Slack-команды и web-интерфейс с realtime-сессией. Это сознательная позиция: Devin позиционируется как агент-сотрудник, которого ставят на задачи через привычные коммуникационные каналы, а не как stateless API.
AgentQL, наоборот, API-first продукт. Питон-SDK — основной способ использования, REST API доступен для любых других стеков, JavaScript/TypeScript SDK — для Node.js и фронтенда, Chrome Extension — для ручной разработки и дебага запросов. Документация описывает quick-start через несколько строк кода, и большинство кейсов в HN — про встраивание в существующий Playwright-pipeline.
MCP-совместимость и webhook-поддержка — не зафиксированы в нашем dossier как явно подтверждённые ни для Devin, ни для AgentQL. Cognition заявляет API для Enterprise, но детальные спецификации публично не опубликованы стабильно. AgentQL предоставляет REST endpoints, но статус MCP-сервера в dossier мы не подтвердили.
Этот контраст диктует роль каждого сервиса в архитектуре. Devin живёт в окружении команды (Slack, GitHub) и заменяет junior-разработчика. AgentQL живёт в коде и заменяет хрупкую логику селекторов. Для backend-команды это две разные точки интеграции, и обе валидны.
На практике: если вы строите автоматизированный pipeline web-задач, который надо запустить с триггера и масштабировать на миллион вызовов — AgentQL архитектурно подходит без оговорок. Если вы строите внутренний сервис для команды разработки, где задачи приходят от людей через тикеты или чат — Devin подходит лучше, но Enterprise-тариф для production-нагрузки обязателен.
Доступность из России и оплата российскими картами
Зашёл — оплатил — работаешь?
Российский разработчик хочет попробовать сервис: открывает сайт, регистрируется, привязывает карту. Если что-то на этом пути ломается, выбор уже сделан за него — независимо от качества продукта. В категории ai-agents этот сценарий ломается часто.
Devin прямо из РФ без VPN недоступен. Cognition — американская компания, использует partnership с OpenAI/Anthropic для части инфраструктуры, и сайт реагирует на RU-IP стандартными ограничениями. Оплата российскими картами не поддерживается. Обходные пути — VPN плюс зарубежная карта (Wise, Revolut, EU-выпущенные) или корпоративный контракт через EU/US юрлицо. Для одиночного российского разработчика это означает дополнительные 30–60 минут на настройку и постоянное использование VPN при работе. По нашему dossier, точный статус геоблокировки на 2026-05 зафиксирован как data gap — статус продолжает меняться.
AgentQL формально мягче. API-сервис без явных RU-блокировок: дёргать endpoint можно с любого IP. Документация — на английском, личный кабинет тоже. Реальная проблема — оплата: pay-per-query требует привязки карты, и российские карты не принимаются. Решение то же — зарубежная карта или корпоративная подписка через зарубежное юрлицо.
Качество русского в обоих сервисах — отдельная история. Devin понимает русский в ТЗ, в коде может ставить русские комментарии, но интерфейс полностью на английском, и официально работа с русскими ТЗ не тестировалась. AgentQL работает с русскоязычными сайтами через описание элементов на английском (например, {login_button, password_input} на сайте госуслуг) — это работает, потому что AI-слой опирается на роль элемента, а не на текстовое содержимое. Русскоязычный синтаксис самих запросов официально не тестировался.
Если выбирать между двумя для российского разработчика без VPN и зарубежной карты — оба сервиса требуют workaround. Но workaround для AgentQL дешевле: можно протестировать через корпоративный аккаунт коллеги или EU-юрлицо за минуты, а в случае Devin — это $500/мес-обязательство, которое тоже идёт через зарубежные структуры.
На практике: для российской команды, у которой есть EU-юрлицо или партнёр в США, оба сервиса в принципе доступны. Для индивидуального разработчика в РФ — оба требуют постоянного workflow с VPN и зарубежной картой. Не ставьте этот фактор выше остальных — он одинаково давит на оба сервиса, и выбор по нему не сделать.
Скорость генерации
Время от запроса до результата
Один сервис отвечает за миллисекунды на каждый вызов и масштабируется на миллион запросов. Другой думает над задачей часы — но эту задачу не решит человек за два дня. Сравнивать «скорость» в лоб бессмысленно — она про разные единицы работы.
Devin живёт в шкале «десятки минут — часы». По dossier Cognition, типичная задача (небольшой баг-фикс) занимает 10–30 минут реального времени работы агента. Крупная задача (новая фича в существующей кодовой базе) — 1–4 часа. Это сопоставимо со скоростью среднего разработчика на тех же задачах — а порой быстрее за счёт распараллеленных сессий. Параллельность зависит от тарифа: на Teams можно запускать несколько задач одновременно, и каждая идёт своим темпом.
AgentQL живёт в шкале «миллисекунды — секунды». Каждый вызов page.query_elements(...) добавляет overhead к Playwright — по dossier Tinyfish, несколько сотен миллисекунд на запрос за счёт AI-обработки. В production-скрейпере это означает, что 10 000 страниц парсятся за десятки минут с распараллеливанием, или часы при последовательном цикле. По заявлению команды, при изменениях сайтов AgentQL оказывается значительно быстрее ручного поддержания CSS-селекторов — экономия не в самих вызовах, а в том, что скрипт не ломается.
Для практики: единиц работы измеряем через сценарий, а не через секундомер. Если у вас задача «извлечь все сделки с reuters.com за неделю» — её делает AgentQL за минуты, и Devin тут не нужен. Если задача «добавь в репозиторий health-check endpoint с тестами» — её делает Devin за полчаса, и AgentQL тут не помощник.
На практике: не ставьте «скорость» как первый критерий выбора. Сначала отвечайте на вопрос «единица работы — это что?». Если единица — целое инженерное действие (фича, баг, документация) — Devin адекватен по скорости. Если единица — атомарный извлечённый кусок данных или клик на странице — нужен AgentQL.
Sandbox и изоляция: насколько безопасно запускать агента
Что произойдёт, если агент ошибётся
Удалит важный файл. Откатит миграцию. Постит коммит в main. Когда агент имеет доступ к шеллу и git, sandbox — не косметическая фича, а защита от катастрофы. Это вопрос архитектурный.
Devin запускается в собственном изолированном контейнере на стороне Cognition. По dossier, код выполняется в sandbox-окружении, не на сервере клиента — это снимает значительную часть рисков «агент удалил production-файлы», потому что у агента физически нет к ним доступа. Файлы он трогает только в clone-копии вашего репозитория внутри своего контейнера, а итог попадает обратно в виде pull request, который вы можете прочитать и отклонить.
Это сильная сторона Devin как enterprise-инструмента. On-premise option для Enterprise даёт возможность развернуть всю эту инфраструктуру на собственной инфре клиента — релевантно для компаний с регуляторными требованиями к данным. SSO, audit logs и SLA — стандартные enterprise-фичи.
У AgentQL sandbox в классическом смысле нет — это библиотека, исполняющаяся в окружении самого разработчика. Если ваш скрипт вызывает page.click(...) на ваш production-админ-сайт, AgentQL найдёт правильную кнопку и кликнет её. Ответственность за то, чтобы скрипт не нажимал «Удалить аккаунт» лежит на разработчике. HTML-страниц отправляется на серверы AgentQL для AI-обработки — это другой пласт безопасности, не sandbox, но privacy-вопрос (см. подтему о compliance).
Эта разница вытекает из дизайна. Devin — автономный агент, и sandbox обязателен, иначе цена ошибки катастрофическая. AgentQL — инструмент в руках разработчика, и его «sandbox» это и есть та самая Playwright-сессия, которую вы сами настроили (например, запускаете в Docker, используете тестовое окружение для прогонов и т.д.).
Для команды с requirements типа «никаких внешних серверов», Devin Enterprise on-premise — единственный реалистичный вариант. AgentQL же отправляет HTML на свои серверы для AI-обработки, и без on-premise это блокер для compliance-чувствительных задач.
На практике: для безопасности при использовании Devin — настройте код-ревью PR от агента как обязательный шаг, не давайте Devin доступ к репозиториям с секретами. Для AgentQL — изолируйте Playwright в Docker, используйте отдельные сервисные аккаунты, никогда не вызывайте deconstructive-методы (.click() на «Удалить») без явного allowlist.
Безопасность данных и compliance (SOC2, GDPR, no-training-on-data)
Куда уходят ваши данные
Каждый запрос — это либо код вашего репозитория, либо HTML с целевого сайта. Куда он попадает, как хранится, обучают ли на нём модели — отвечать всё равно вам, не сервису. Для enterprise это первый параметр выбора.
Devin для Enterprise заявляет SOC 2 Type 2, on-premise deployment, SSO, audit logs и SLA — стандартный набор корпоративных гарантий. Точный сертификационный статус (текущая дата аудита, объём scope) мы зафиксировали как data gap, потому что Cognition публикует политику для NDA-разговоров с sales, а не как открытый сертификат на сайте. По заявлению компании, для Starter-уровня действуют стандартные условия, отличающиеся от Enterprise.
AgentQL отправляет HTML-страниц на свои серверы для AI-обработки — это естественная часть архитектуры (AI-слой работает на стороне сервиса). Полную privacy policy мы зафиксировали как data gap в dossier, поэтому конкретные пункты (хранится ли HTML, обучают ли на нём, есть ли SOC 2) подставлять не будем. По §17 нашего скилла это означает оценку 5/10 с пометкой «компания не публикует полные данные» — это позиция редакции, а не претензия к продукту.
Сравнение здесь жесткое не в чью-то пользу. Cognition демонстрирует enterprise-ready позицию для крупных контрактов, но детали наружу не раскрывает. Tinyfish ещё не на той стадии корпоративной зрелости, когда compliance становится приоритетом маркетинга. Оба сервиса требуют отдельной коммуникации с sales/legal перед production-использованием в регулируемой среде.
На практике: если у вас регуляторные требования (банк, страховая, госсектор, медицина) — общайтесь с sales обоих сервисов и требуйте письменные гарантии в контракте, не доверяйте маркетинговым описаниям. Для команды без регуляторного давления — sandbox-контейнер Devin и Docker-изоляция Playwright у AgentQL дают разумный baseline.
Финансирование, стабильность компаний и долгосрочная перспектива
Останется ли сервис на следующий год
Подписываетесь на сервис, встраиваете его в pipeline, через год компания пропадает. В категории ai-agents 2024–2025 это не теоретический риск — миграция занимает недели и сжигает доверие команды. Финансы под капотом — реальный фактор.
Cognition AI (за Devin) — одна из самых громко профинансированных компаний категории. Серия A на $21M в январе 2024 под лидерством Founders Fund, а уже в апреле 2024 — Серия B на $175M при оценке $2B, опять Founders Fund. Это редкое сочетание скорости и масштаба раундов, говорящее о высоком доверии инвесторов. Для пользователя это означает, что Cognition имеет ресурсы на годы вперёд и риск закрытия в обозримой перспективе минимален.
Tinyfish Inc. (за AgentQL) находится на ранней стадии — Seed-раунд $2M (по Crunchbase). Это типичный размер первого внешнего раунда для developer-tools-стартапа, и для нишевого продукта он адекватен — но классифицируется как «ранний этап с риском». Маленькая компания может масштабироваться в Series A или быть купленной более крупным игроком. Может и закрыться или пивотнуть — это нормальная статистика раннего стартапа.
На практике это влияет на выбор: для долгосрочной production-инфраструктуры с горизонтом 3+ лет Devin как часть Cognition выглядит безопаснее. AgentQL стоит использовать сейчас под конкретные задачи, но иметь план миграции на Playwright без AI-слоя — на случай, если Tinyfish уйдёт. Технически такой план реалистичен: AgentQL — обёртка над Playwright, и переход обратно на CSS-селекторы возможен (хоть и трудозатратен).
На практике: если ваш проект — production-критика на 3+ года, Devin выглядит безопаснее как поставщик. Но это не значит «не пробуйте AgentQL» — просто фиксируйте, как мигрировать обратно на чистый Playwright, и обновляйте план каждый квартал.
Production-кейсы и реальные использования
Что реально работает в проде
Демо-видео в Twitter — один уровень доказательства. Реальные команды, которые платят и используют сервис каждый день — совсем другой. У одного из наших участников путь от первого к второму был тернистым, у другого — тише и без хайпа.
Devin в марте 2024 пережил самый яркий запуск года в категории. Виральное демо: агент проходит engineering interview и правит баги в реальных репозиториях. Хайп на X, Hacker News, Forbes, TechCrunch — мгновенный «первый AI-разработчик». В июле 2024 r/MachineLearning опубликовал детальный разбор о cherry-picked-постановке: большинство реальных задач Devin проваливал или делал неправильно. Это вызвало широкое обсуждение «vibe AI» в категории. К 2025-му картина выровнялась: Devin реально полезен на CRUD-операциях, рефакторинге и тестах, но переоценён для сложных архитектурных задач. По dossier Cognition, в production его используют технологические компании (точные имена клиентов не раскрываются).
AgentQL прошёл путь иначе — без хайпа, через developer community. Позитивные отзывы от разработчиков, работающих с web scraping, появились в комментариях на HN и в блогах по Playwright. Отмечают оригинальность query-language подхода против free-form промпта. Широкой известности вне сообщества web automation у AgentQL нет — это нишевый инструмент. Точные имена клиентов Tinyfish также не раскрывает.
На практике: перед оплатой обоих сервисов прочитайте свежие обсуждения — для Devin сабреддит r/MachineLearning и r/AItools, для AgentQL — комментарии в обсуждениях Playwright и web-scraping-сообществах. Не делайте выбор только по виральным демо — после прецедента июля 2024 на них в категории смотрят с большой осторожностью.
Сценарии победы первого сервиса (use-cases)
Когда нужен именно Devin
Не «coding agent в целом», а конкретные ситуации, в которых ставка на Devin вернётся реальным leverage. Их меньше, чем обещают демо, но они есть — и в этих сценариях AgentQL не помощник в принципе.
Сценарий 1: масштабирование бэклога рутинных тикетов. У команды накопилось 50 тикетов «обновить зависимость X», «починить flaky test Y», «добавить null-check в Z». Живой разработчик потратит на это неделю, а нужен на архитектурных задачах. Devin берёт пять-десять таких тикетов параллельно, открывает PR-ы, разработчик их ревьюит и мержит. Realtime-сессия даёт прозрачность процесса. AgentQL в этом сценарии бесполезен — это не его задача.
Сценарий 2: end-to-end фича по чёткому ТЗ. «Добавь Google OAuth в users-сервис, используй passport.js, refresh_token в Postgres-таблице oauth_tokens». Devin планирует, ставит зависимости, пишет handler, добавляет тесты, открывает PR. На нашем тесте средней сложности — заняло около часа, против двух-трёх часов у среднего разработчика с переключением контекста.
Сценарий 3: исследование новой библиотеки. Команда хочет попробовать новый фреймворк. Девин в браузере читает официальные docs, в shell ставит пакет, в редакторе пишет POC, в браузере проверяет, что работает. Один pipeline вместо четырёх контекстов разработчика.
Сценарий 4: документация и тесты для legacy-кода. Старый модуль без тестов, без docstrings, у которого автор давно ушёл. Devin читает код, пишет docstrings, пишет unit-тесты, открывает PR. На скучных, но обязательных задачах агент особенно хорош, потому что они не требуют архитектурного suждения.
Сценарий 5: stand-up-доступная команда на Slack. Распределённая команда уже общается в Slack. Devin интегрирован — ставишь задачу одной командой, как обычному коллеге. Не нужно учить команду новому UI, не нужно отдельных каналов коммуникации.
На практике: если в вашей неделе типичного разработчика 30–40% времени съедают именно такие задачи — Devin может вернуть существенную часть этого времени. Если основная работа — архитектурная разработка или сложный рефакторинг — экономия будет скромнее.
Сценарии победы второго сервиса (use-cases)
Когда нужен именно AgentQL
Не «AI для web», а конкретные ситуации, в которых query language Tinyfish даёт точный leverage. И в этих сценариях даже самый продвинутый coding agent — не подходящий инструмент.
Сценарий 1: production-скрейпер, который ломается от обновлений сайтов. У вас 50 скрейперов на Playwright с CSS-селекторами. Каждый раз, когда целевые сайты обновляют вёрстку, селекторы ломаются, и кто-то из команды тратит часы на их починку. AgentQL заменяет хрупкие CSS-селекторы на natural-language описания структуры — запросы, по заявлению Tinyfish, продолжают работать через обновления.
Сценарий 2: data extraction из 1 000+ страниц в фиксированном формате. «Извлечь название, цену и наличие со страниц карточек товара». Query language даёт структурированный ответ в Python-объекте — без regexp-парсинга текста, без проб-и-ошибок с XPath. Цикл из 100 строк кода обходит миллион страниц.
Сценарий 3: web automation без CSS-знаний. Бэкенд-разработчик умеет писать Playwright, но не любит возиться с CSS-селекторами на чужих сайтах. AgentQL даёт описательный синтаксис: «найди поле логина, найди кнопку входа, найди уведомление об ошибке» — без углубления в DOM целевого сайта.
Сценарий 4: подготовка demo и proof-of-concept за день. Free-тариф позволяет за вечер написать прототип web-автоматизации и показать заказчику, как это будет работать в production. Devin в этом сценарии — оверкилл, потому что задача узкая.
Сценарий 5: разработка внутри Chrome Extension и REST-вызовов из любого стека. Команда на Ruby или Go, которая не хочет вводить Python в стек — REST API AgentQL вызывается с любого языка. Chrome Extension помогает дебажить запросы в реальном браузере перед тем, как класть их в production-код.
На практике: если ваша команда ведёт production scraping или automation как сервис для бизнеса — попробуйте AgentQL на одном проблемном скрейпере и измерьте, как падает количество фиксов после обновлений сайтов. Если стек только начинается — закладывайте AgentQL с первого дня, чтобы избежать миграции потом.
Портреты пользователей с адресными рекомендациями
Кому какой подходит
Меньше абстракций — больше конкретных людей. Если узнаёте себя в одном из портретов ниже, рекомендация прилагается. Если не узнаёте — ни один из двух сервисов вам сейчас не нужен.
Портрет 1: Lead-разработчик в продуктовом стартапе из 6 человек. Команда страдает от бэклога рутинных задач, бюджет терпимый, GitHub + Slack уже стоят. Ответ — Devin Starter за $500/мес. Пробует месяц на 20 типовых тикетов, считает экономию часов команды, продлевает или нет.
Портрет 2: Solo-разработчик из РФ без EU-юрлица. Хочет автоматизировать рутину, но платить $500/мес в долларах без зарубежной карты не может. Devin не подходит структурно. Возможно, AgentQL Free для конкретных задач — если есть VPN и зарубежная карта хотя бы по знакомым.
Портрет 3: Data engineer, который строит pipelines на Python и парсит десятки сайтов. CSS-селекторы ломаются регулярно, на их починку уходит до 20% рабочей недели. Ответ — AgentQL. Начинает с Free-тарифа на одном проблемном скрейпере, считает падение фикс-инцидентов за месяц, переходит на платный тариф по факту.
Портрет 4: CTO средней компании с регуляторными требованиями (банк, страховая, госсектор). Не имеет права отправлять данные на внешний сервис. Devin Enterprise on-premise — потенциально подходит после переговоров с Cognition. AgentQL без on-prem deployment — пока нет.
Портрет 5: разработчик, который сейчас не использует Playwright. AgentQL нужен только тем, кто уже на Playwright или готов на него мигрировать. Если у вас Selenium или Puppeteer — AgentQL не подходит без миграции стека.
Портрет 6: техно-журналист или ресерчер. Хочет автоматизировать сбор материалов с веба, не разработчик. Ни Devin (для него overkill), ни AgentQL (нужны Python и Playwright) не подходят — лучше No-code-инструменты из той же категории (см. общий обзор ai-agents).
На практике: не ставьте оба сервиса параллельно сразу. Возьмите Free-тариф AgentQL на неделю, а Devin — на один месяц после первой итерации. Поэтапный пробный путь снижает риск разочарования и помогает сравнить с реальным baseline вашей команды.
Итоговая таблица оценок
| Подтема |
DA
Devin AI
|
AG
AgentQL
|
|---|---|---|
| 1.Карта подгрупп: что эти N сервисов реально делают | 8 | 9 |
| 2.Автономность и уровень контроля пользователя | 9 | 4 |
| 3.Выполнение задач в браузере и computer use | 7 | 9 |
| 4.Качество кода и agentic coding | 8 | 2 |
| 5.Планирование задачи и декомпозиция (task planning) | 8 | 3 |
| 6.Self-correction: обнаружение ошибок и восстановление | 7 | 7 |
| 7.Тарифы и стоимость владения за год | 4 | 6 |
| 8.Free-тариф: что реально дают навсегда vs trial | 2 | 7 |
| 9.API и production-pipeline | 6 | 9 |
| 10.Доступность из России и оплата российскими картами | 3 | 5 |
| 11.Скорость генерации | 6 | 8 |
| 12.Sandbox и изоляция: насколько безопасно запускать агента | 9 | 5 |
| 13.Безопасность данных и compliance (SOC2, GDPR, no-training-on-data) | 7 | 5 |
| 14.Финансирование, стабильность компаний и долгосрочная перспектива | 9 | 4 |
| 15.Production-кейсы и реальные использования | 6 | 6 |
| 16.Сценарии победы первого сервиса (use-cases) | 9 | 3 |
| 17.Сценарии победы второго сервиса (use-cases) | 3 | 9 |
| 18.Портреты пользователей с адресными рекомендациями | 7 | 7 |
| Итого (средняя) | 6,6 | 6,0 |
Методика: каждая подтема оценивалась по шкале 1–10. Итоговая средняя — арифметическое всех подтем.
Финальный вердикт
Короткие итоги по каждому сервису — чтобы не перечитывать весь обзор.
Devin AI
Берите Devin, если у команды есть бюджет $500+/мес, на GitHub лежит реальный бэклог рутинных тикетов, и команда готова инвестировать первый месяц в калибровку workflow. Не подходит solo-разработчику из РФ без EU-юрлица и не подходит для production-веб-автоматизации — это не его задача.
Попробовать Devin AI
AgentQL
Берите AgentQL, если уже пишете на Playwright и устали чинить CSS-селекторы после обновлений сайтов. Free-тариф позволяет проверить на ваших целевых сайтах за неделю. Не подходит, если нужен полноценный autonomous agent или вы не работаете с Playwright.
Попробовать AgentQLДругие обзоры в категории
Все обзоры →Devin AI vs Agent Zero 2026: $500/мес коммерческий vs open-source агент
AutoGPT vs Lindy AI 2026: open-source фреймворк против no-code SMB-платформы
Anthropic Computer Use vs MultiOn 2026: сравнение API-агентов
Manus vs AgentQL 2026: автономный агент или query language для веба
OpenAI Operator vs Agent Zero 2026: браузерный агент против self-hosted конструктора
OpenAI Operator vs AgentQL 2026: consumer-агент или developer-инструмент
Обсуждение
Будьте первым, кто оставит комментарий.
Используете один из сервисов регулярно? Напишите подробный отзыв с оценками — это формат больше короткого комментария.
Написать отзыв
Оставить комментарий