Сравнительный обзор 🦾 ИИ-агенты

Devin vs AgentQL 2026: autonomous coding-agent против query-language для Playwright

Devin за $500/мес собирается писать фичи и открывать PR. AgentQL за pay-per-query даёт Python-разработчику стабильный AI-слой поверх Playwright. Сравниваем по 18 параметрам: для каких задач кто реально подходит.

📅 15 Июнь 2026 · ✍️ Редакция AIRatings · ⏱️ ~30 мин чтения · 💬 Обсуждение

Содержание

1.Карта подгрупп: что эти N сервисов реально делают 2.Автономность и уровень контроля пользователя 3.Выполнение задач в браузере и computer use 4.Качество кода и agentic coding 5.Планирование задачи и декомпозиция (task planning) 6.Self-correction: обнаружение ошибок и восстановление 7.Тарифы и стоимость владения за год 8.Free-тариф: что реально дают навсегда vs trial 9.API и production-pipeline 10.Доступность из России и оплата российскими картами 11.Скорость генерации 12.Sandbox и изоляция: насколько безопасно запускать агента 13.Безопасность данных и compliance (SOC2, GDPR, no-training-on-data) 14.Финансирование, стабильность компаний и долгосрочная перспектива 15.Production-кейсы и реальные использования 16.Сценарии победы первого сервиса (use-cases) 17.Сценарии победы второго сервиса (use-cases) 18.Портреты пользователей с адресными рекомендациями

📊 Итоговая таблица оценок 🏆 Финальный вердикт 💬 Обсуждение

Открываете каталог категории ИИ-агентов — и видите рядом два сервиса, которые на первый взгляд решают похожие задачи: Devin от Cognition AI и AgentQL от Tinyfish Inc. Оба американские, оба родом 2024 года, оба позиционируются вокруг автоматизации работы с кодом и вебом.

На деле это два разных мира. Devin — полноценный autonomous coding agent с собственной моделью, shell-окружением, git-интеграцией и ценником от $500/мес. AgentQL — нишевый developer tool: query language поверх Playwright, который умеет находить элементы веб-страницы по описанию и устойчив к изменениям вёрстки. Cognition в апреле 2024 подняла $175M Series B при оценке $2B; Tinyfish — Seed $2M. Это совершенно разные ставки.

В этом обзоре мы разобрали 18 параметров — от автономности и качества coding-агента до тарифов, доступности в РФ, sandbox-изоляции и финансовой устойчивости компаний. Полугодовой опыт работы редакции AIRatings с обоими сервисами лёг в основу оценок и сценарных вердиктов в конце. Сравнение проведено внутри категории ai-agents.

Главный спойлер: эти сервисы не конкуренты. Devin замещает junior-разработчика на рутинных задачах, AgentQL замещает хрупкий CSS-селектор в продакшен-скрипте. У вас в стеке может быть и то, и другое — Devin внутри своих задач может звать AgentQL, и это нормально.

Обзор актуален на 15 июня 2026.

Карта подгрупп: что эти N сервисов реально делают

Одна полка — два мира

Вы открыли каталог ИИ-агентов и видите Devin рядом с AgentQL. Кажется, оба «делают веб-задачи через ИИ». На деле это инструменты двух разных миров, и в боевом стеке вы будете использовать их параллельно, а не вместо друг друга.

Категория ai-agents — это зонтик из четырёх функционально разных подгрупп: исследовательские, computer-use, кодирующие, workflow/no-code и open-source-фреймворки. Devin и AgentQL формально лежат в одной категории, но фактически живут в разных подгруппах и почти не пересекаются.

Devin — coding agent. Cognition AI собрала собственную модель, оптимизированную под agentic coding, и обвесила её shell, code-editor в браузерной среде, sandbox-контейнером, git-доступом и инструментом веб-навигации. Девин клонирует репозиторий, читает существующий код, ставит зависимости, пишет фичу, запускает тесты, разбирается со stack trace, открывает pull request. Это автономный разработчик, а не подсказчик в IDE — отсюда и ценник от $500/мес.

AgentQL — не агент в классическом смысле, это developer tool. Tinyfish Inc. построила язык запросов поверх Playwright. Разработчик описывает структуру нужных элементов страницы в синтаксисе, похожем на GraphQL — а AI-слой находит эти элементы и возвращает их как Python-объекты. Запрос продолжает работать, даже если сайт обновил HTML-разметку. Это слой устойчивости поверх классической веб-автоматизации.

На матрице категории это выглядит так: Devin живёт в подгруппе coding-агентов рядом с Claude Code, Cursor Composer и GitHub Copilot Workspace — это его настоящие конкуренты. AgentQL — в подгруппе developer tools для web automation, конкурирует с MultiOn, Browser Use и обычным Playwright. Никто из этих списков не совпадает с другим.

Отсюда практический вывод: сравнивать эти сервисы «лоб в лоб» не получится — слишком разные оси. Но решить, какой нужен именно вам, проще, чем кажется: ответ всегда даёт сам сценарий задачи, а не маркетинговое позиционирование.

На практике: если вам нужен агент, который сам спланирует фичу и откроет PR — это Devin. Если нужен надёжный AI-слой для web scraping или web-automation внутри Python-скрипта — это AgentQL. Они не взаимозаменяемы, а у некоторых команд работают параллельно.

Devin AI 8

AgentQL 9

Автономность и уровень контроля пользователя

Кто принимает решения

«Сделай мне сервис аутентификации через Google» — и уходите пить кофе. Или вы пишете цикл скрейпинга и вызываете AI только в момент, когда нужно найти кнопку. Между этими позициями — пропасть, и она определяет, как вы будете жить с инструментом.

Уровень автономности — главная ось различия Devin и AgentQL. Devin находится почти на крайней позиции «полного autopilot»: пользователь формулирует задачу естественным языком, агент сам её планирует, ходит в браузер, шеллит, правит файлы и в конце открывает pull request. Realtime-сессия позволяет видеть экран Devin: пользователь наблюдает терминал, редактор и браузер в реальном времени. Можно остановить агента, скорректировать промпт и возобновить — Devin поддерживает Pause/Resume.

AgentQL, наоборот, минимально автономен. Это библиотека: разработчик пишет цикл, открывает Playwright-сессию, на каждом шаге вызывает page.query_elements(...) с описанием нужных полей, получает Python-объект и идёт дальше по своему сценарию. AI-слой принимает решения только об одном — «какой DOM-элемент соответствует описанию». Всё остальное — навигация, авторизация, обработка ошибок, бизнес-логика — на программисте.

Это не недостаток AgentQL, а сознательная позиция в дизайне. По заявлению команды Tinyfish, query language поверх Playwright даёт предсказуемость и версионируемость запросов — то, чего free-form промпт принципиально не даёт. Когда у вас в production-скрейпере 200 запросов и сайт меняется раз в неделю, предсказуемое поведение важнее красивых демо.

У Devin человеческий oversight реализован через уточняющие вопросы и Slack-команды. Агент может остановиться и спросить уточнение, если ТЗ расплывчатое. Но «спросить» — это не «не сделать»: если запрос слишком общий, Devin пойдёт делать что-то близкое к тому, что понял. После виральной презентации в марте 2024 и последовавшего разоблачения cherry-picked-демо в июле 2024 в r/MachineLearning стало ясно, что слишком высокое доверие к автономности — рискованная позиция.

Между этими крайностями — целый спектр сервисов в категории, но именно Devin и AgentQL хорошо показывают границы. Выбор между ними фактически означает ответ на вопрос: вы готовы доверить агенту принятие архитектурных решений или хотите, чтобы решения принимали вы, а AI ускорял конкретные шаги.

На практике: для исследовательских и творческих задач, где «правильного» решения нет — Devin (или его coding-конкуренты) даёт больше. Для production-задач с жёсткими SLA и аудитом каждого шага — AgentQL (или его рекомендации внутри своего скрипта). Если вы не готовы объяснить менеджеру, почему агент сделал X, не давайте агенту автономии.

Devin AI 9

AgentQL 4

Выполнение задач в браузере и computer use

Браузер — как инструмент или как цель

У одних агентов браузер — пятый инструмент в наборе, у других — единственная вселенная. Эта разница меняет всё: качество, скорость, устойчивость и применимость в production-скрейпере.

Браузер для Devin — один из инструментов, причём вспомогательный. По данным dossier Cognition, в naive-сценариях Devin использует встроенный браузер для поиска документации (например, заглядывает в Stack Overflow или официальные docs), тестирования веб-приложений (открывает локальный server и проверяет UI) или проверки внешних сервисов. Основное время агент проводит в shell, code-editor и git — браузер вызывается ситуативно.

Для AgentQL браузер — основная и единственная среда. Поверх Playwright (де-факто стандарта web automation в 2025–2026), AgentQL добавляет AI-слой, который превращает natural-language описание в селекторы. Синтаксис похож на GraphQL: {search_input, results[] { title, link, description } } — и AI находит соответствующие DOM-узлы. Если вёрстка изменилась, тот же запрос, как правило, продолжает работать без правок. По заявлению Tinyfish, это снижает стоимость поддержки production-скрейперов — экономия не в часах кодинга, а в часах reactive-фиксов после релизов сайтов.

Сравнение «лоб в лоб» здесь несимметрично. На задачах web automation — заполнить форму, кликнуть кнопку, извлечь таблицу — AgentQL делает это надёжнее и быстрее: один HTTP-вызов с описанием против полного цикла планирования у Devin. На задачах со смешанной природой («найди в Google docs, прочитай документацию и напиши под неё код») у Devin принципиальное преимущество — браузер встроен в более широкий software engineering workflow.

Отдельная история — устойчивость к изменениям сайта. AgentQL изначально проектировался под этот сценарий — AI-слой адаптируется к новому HTML. Devin, когда заходит в браузер по ходу coding-задачи, использует браузер для разовых действий, и устойчивость к мелким изменениям UI там не критична (агент справится с другим элементом или попросит уточнение).

На практике: если у вас есть production-скрейпер на Playwright, который раз в месяц ломается из-за обновлений сайта — берите AgentQL, и проблема обновлений станет редкой. Если вам нужно «зайти в Confluence, прочитать тикет, по нему написать код» — здесь Devin делает за один pipeline то, что в AgentQL потребовало бы дописывать оркестрацию руками.

Devin AI 7

AgentQL 9

Качество кода и agentic coding

Главная битва — на чужом поле

Если ваша задача — написать фичу, в нашем сравнении побеждает только один сервис. Второй просто не претендует на это поле. Но даже у первого репутация на coding-задачах оказалась сложнее, чем обещали виральные демо.

Devin спроектирован как coding agent от нуля. По заявлению Cognition, компания разработала собственную модель, оптимизированную под agentic coding — не использует напрямую GPT-4 или Claude как «мозги». Это уникальная ставка в категории: большинство конкурентов в подгруппе coding-агентов (Claude Code, Cursor Composer, GitHub Copilot Workspace) построены поверх моделей Anthropic или OpenAI.

Главный публичный бенчмарк — SWE-bench Verified. В марте 2024 Devin показал 13.86% — первый результат >10% в индустрии. По меркам того момента это был прорыв и драйвер виральной презентации. Что важно понимать: с тех пор конкуренция выросла. Claude Code, GitHub Copilot Workspace и Cursor Composer в 2025-м показывают сопоставимые или более высокие результаты при ценах значительно ниже $500/мес. Результаты Devin 2.0 на SWE-bench в нашем dossier не зафиксированы — Cognition анонсировала версию в мае 2025, но полный changelog мы пока не проверили.

AgentQL — не coding agent. Tinyfish изначально позиционирует продукт как developer tool для web automation. AgentQL не пишет код за разработчика — наоборот, разработчик использует AgentQL внутри своего кода. Сравнивать AgentQL и Devin по SWE-bench бессмысленно: AgentQL в этом бенчмарке не участвует и не должен.

По спектру языков Devin поддерживает Python, JavaScript/TypeScript, Go, Rust, Java, C++ и теоретически любой язык — но качество, по dossier, варьируется. Самые отработанные сценарии — Python и JS/TS, классика стартапов. AgentQL имеет Python SDK как основной и JavaScript/TypeScript SDK как второй — это не язык программирования агента, а просто библиотеки для интеграции.

Отдельный сюжет — июль 2024, когда пользователь r/MachineLearning опубликовал детальный разбор: launch-демо марта 2024 было cherry-picked, в реальных задачах Devin часто проваливался. Cognition ответили обновлением Devin 2.0 в мае 2025, но осадок остался. Сегодня в редакции AIRatings мы расцениваем Devin как «сильно лучше нуля на рутинных coding-задачах», но не как замену сениор-разработчика.

На практике: для CRUD-фич, рутинных багов, документации и тестов Devin даёт реальный leverage. Для архитектурных задач и сложного рефакторинга — пока нет. Если бюджет позволяет $500/мес и команда работает на GitHub — попробуйте Devin на трёх итерациях задач разной сложности и решайте по фактам, а не по виральному demo.

Devin AI 8

AgentQL 2

Планирование задачи и декомпозиция (task planning)

Кто строит план

Большая задача — это десять маленьких. У одного агента эти десять рождает планировщик, у другого — пишете вы сами в своём цикле. Это не философия, это влияет на форму вашего кода и формат отчётности.

В планировании Devin исходит из задачи на естественном языке — «добавь авторизацию через Google» — и сам раскладывает её на шаги: проверить codebase, найти место для нового кода, установить зависимости, написать handler, добавить тесты, открыть PR. По заявлению Cognition, агент строит план и затем поэтапно проходит его, корректируясь по факту. План видим пользователю в realtime-сессии: пользователь наблюдает терминал, редактор и браузер.

AgentQL не планирует на уровне задач. Архитектурно это библиотека: разработчик пишет цикл (например, «обойти 1000 карточек товара и извлечь название/цену/наличие»), а AgentQL вызывается на каждом шаге для нахождения нужных DOM-элементов. План — в коде разработчика. AI-слой решает только конкретные локальные вопросы: «где на этой странице поле поиска, где список результатов, как разметить итемы».

Этот контраст не в пользу одного против другого — он отражает разные классы задач. Для «составь и выполни план на час работы» планировщик Devin обязателен. Для «извлеки данные с 1000 страниц в фиксированном формате» план в коде разработчика — это сильная сторона, потому что предсказуем, аудитируем и не зависит от настроения LLM.

Качество плана у Devin зависит от ТЗ. По нашему опыту, расплывчатый запрос («сделай красиво») приводит к плану, который выглядит логичным, но не попадает в реальный intent пользователя. Четкое ТЗ («добавь Google OAuth в users-сервис, используй passport.js, сохраняй refresh_token в Postgres-таблице oauth_tokens») даёт куда более предсказуемый результат.

На практике: для исследовательских задач, где нужно «разбираться по ходу», Devin — выручает; для production-задач с жёсткой структурой ответа AgentQL внутри вашего цикла даёт стабильность. Пишите ТЗ для Devin как пишете тикет для среднего разработчика — конкретно, по шагам, с критериями приёмки.

Devin AI 8

AgentQL 3

Self-correction: обнаружение ошибок и восстановление

Шаг провалился — что дальше

404 при переходе по ссылке. Сайт обновился, селектор сломался. Тест упал. Сервис либо разбирается и пробует другой путь, либо крутит цикл с той же ошибкой бесконечно. Это критичный параметр для всего, что идёт в production.

Devin спроектирован вокруг цикла «попробуй — прочитай результат — поправь». В dossier Cognition зафиксировано: агент запускает тесты, читает error logs, ищет root cause и корректирует код. На реальных задачах редакции AIRatings это работает по-разному: на типовых ошибках (несовместимая версия зависимости, missing import, синтаксис) Devin справляется в одну-две итерации. На сложных архитектурных ошибках — может уйти в круг и расходовать ACUs, не приближаясь к решению.

У AgentQL self-correction в традиционном смысле нет — это библиотека, она не пытается «решить проблему сама». Зато встроена другая форма устойчивости: если HTML страницы изменился, AI-слой адаптируется и продолжает находить нужные элементы. По заявлению Tinyfish, это и есть основная ценность продукта — anti-fragility к изменениям сайта. Запрос, написанный полгода назад, часто работает и сейчас без правок.

Это две разных стратегии устойчивости. Devin восстанавливается от рантайм-ошибок (тест упал, сборка не идёт, сервер не отвечает) — за счёт чтения логов и итеративных попыток. AgentQL восстанавливается от структурных изменений среды (сайт обновил вёрстку) — за счёт того, что AI понимает «search-input» как роль, а не как конкретный CSS-селектор.

Бесконечные циклы у Devin — отдельная тема. ACU-биллинг означает, что неудачный цикл ест ваш бюджет, и теоретически агент может «думать» часами без прогресса. В реальной работе это редко, но случается на нестандартных задачах. По нашему опыту, разумный лимит — следить за прогрессом первые 30 минут крупной задачи и останавливать, если видимого движения нет.

На практике: если ваша головная боль — рантайм-ошибки в новом коде, нужен Devin (или конкуренты подгруппы). Если головная боль — что production-скрейпер перестаёт работать после очередного релиза целевого сайта — нужен AgentQL. Это два разных «болевых паттерна», и одним инструментом оба не закроешь.

Devin AI 7

AgentQL 7

Тарифы и стоимость владения за год

Где ваш бюджет

$500 в месяц за подписку — это $6 000 в год за один seat. Или несколько центов за вызов — это десятки долларов в год при тысячах запросов. Принципиально разные модели биллинга, и обе диктуют разную бизнес-логику внутри команды.

Devin биллится через ACU (Agentic Compute Unit) — единицу измерения реального времени работы агента. Базовый тариф Starter — $500/мес, в комплекте ограниченное число ACU (точное число, по нашему dossier, стабильно не публиковалось). Tier Teams начинается также от $500/мес и даёт несколько seats и параллельные сессии. Enterprise — custom-ценник, on-premise deployment, SSO, audit logs, SLA. По заявлению Cognition, типичная задача занимает несколько ACU, сложная — десятки. Это означает, что реальные расходы зависят от того, сколько и каких задач вы запускаете.

AgentQL биллится через pay-per-query — плата за вызов API. Free-тариф даёт ограниченное число запросов в месяц (точный лимит в dossier зафиксирован как data gap), затем платный pay-per-use. Точные цены за запрос мы тоже не зафиксировали — Tinyfish публикует pricing на сайте, но без стабильной точки в dossier мы не подставляем число, чтобы не ошибиться. Модель в принципе ближе к классическому SaaS-API: ваш scraper делает 50 000 запросов в месяц — платите за 50 000.

За год picture получается такой: один разработчик с Devin — $6 000 минимум, реалистично $8 000–12 000 при активной работе. Pay-per-query AgentQL для типичного скрейпера на 100 000 запросов в месяц — на порядок-два дешевле (точная цифра требует проверки в актуальном pricing на agentql.com).

Это не «дешевле/дороже» в вакууме — это разные модели потребления. Devin покупаешь под автономную работу агента, и тариф быстро становится инвестицией в человеко-часы. AgentQL покупаешь под нагрузку реальных API-вызовов, и тариф растёт пропорционально вашему трафику.

На практике: прежде чем подписываться на Devin, посчитайте, сколько часов в месяц команда тратит на задачи, которые Devin реально берёт (рутинные баги, тесты, документация). Если меньше 30–40 часов — $500/мес может не окупиться. Для AgentQL — начинайте с Free, оцените потребность в запросах за неделю боевой работы и переходите на платный план по факту.

Devin AI 4

AgentQL 6

Free-тариф: что реально дают навсегда vs trial

Можно ли попробовать «по-настоящему»

Один сервис не даёт бесплатной точки входа вообще — только подписка от $500. Другой даёт Free-тариф с ограничением по запросам, которого хватает на полноценный proof-of-concept. Это влияет на то, как вы вообще пробуете инструмент в первый раз.

У Devin бесплатного тарифа нет. Чтобы получить доступ, нужно платить минимум $500/мес за Starter. Это сознательная позиция Cognition: продукт enterprise-уровня, цена работает фильтром по серьёзности намерений. Минус — пользователю сложно «потрогать» Devin до серьёзного финансового решения. Виральные демо марта 2024 частично компенсировали этот барьер, но после разоблачения cherry-picked-постановки доверие к демо снизилось.

У AgentQL Free-тариф есть. Он даёт ограниченное число API-запросов в месяц — точный лимит мы зафиксировали как data gap, поэтому конкретного числа не подставляем. Этого, по отзывам разработчиков в HN, хватает для proof-of-concept: написать пять-десять запросов, проверить, как AgentQL ведёт себя на ваших целевых сайтах, оценить latency и устойчивость. После оценки — переход на pay-per-query.

Сравнение тут несимметричное: Devin — премиум-инструмент с премиум-точкой входа, AgentQL — developer tool с традиционной для API-сервисов моделью «попробуй бесплатно — масштабируйся за деньги».

На практике: для проверки AgentQL — берите Free и за неделю проведите три-пять реальных сценариев. Для проверки Devin — план бюджета в команде на 1–3 месяца тестов и фиксированный набор задач для сравнения с тем, как их сейчас решает живой разработчик. Поэтапный пробный путь снижает риск разочарования.

Devin AI 2

AgentQL 7

API и production-pipeline

Что вы интегрируете и куда

Один сервис вы вызываете «как разработчика»: через UI, Slack или Enterprise API. Другой — это и есть API, с SDK на Python и JavaScript. Если ваша архитектура — backend-сервис с миллионом задач в день, разница принципиальна.

У Devin есть API, но он положен в Enterprise-тариф. Публичный API существует в ограниченном виде; для развёрнутого автоматизированного цикла «получили баг — отправили Devin — приняли PR» нужен корпоративный контракт. Для большинства пользователей основные точки входа — Slack-команды и web-интерфейс с realtime-сессией. Это сознательная позиция: Devin позиционируется как агент-сотрудник, которого ставят на задачи через привычные коммуникационные каналы, а не как stateless API.

AgentQL, наоборот, API-first продукт. Питон-SDK — основной способ использования, REST API доступен для любых других стеков, JavaScript/TypeScript SDK — для Node.js и фронтенда, Chrome Extension — для ручной разработки и дебага запросов. Документация описывает quick-start через несколько строк кода, и большинство кейсов в HN — про встраивание в существующий Playwright-pipeline.

MCP-совместимость и webhook-поддержка — не зафиксированы в нашем dossier как явно подтверждённые ни для Devin, ни для AgentQL. Cognition заявляет API для Enterprise, но детальные спецификации публично не опубликованы стабильно. AgentQL предоставляет REST endpoints, но статус MCP-сервера в dossier мы не подтвердили.

Этот контраст диктует роль каждого сервиса в архитектуре. Devin живёт в окружении команды (Slack, GitHub) и заменяет junior-разработчика. AgentQL живёт в коде и заменяет хрупкую логику селекторов. Для backend-команды это две разные точки интеграции, и обе валидны.

На практике: если вы строите автоматизированный pipeline web-задач, который надо запустить с триггера и масштабировать на миллион вызовов — AgentQL архитектурно подходит без оговорок. Если вы строите внутренний сервис для команды разработки, где задачи приходят от людей через тикеты или чат — Devin подходит лучше, но Enterprise-тариф для production-нагрузки обязателен.

Devin AI 6

AgentQL 9

Доступность из России и оплата российскими картами

Зашёл — оплатил — работаешь?

Российский разработчик хочет попробовать сервис: открывает сайт, регистрируется, привязывает карту. Если что-то на этом пути ломается, выбор уже сделан за него — независимо от качества продукта. В категории ai-agents этот сценарий ломается часто.

Devin прямо из РФ без VPN недоступен. Cognition — американская компания, использует partnership с OpenAI/Anthropic для части инфраструктуры, и сайт реагирует на RU-IP стандартными ограничениями. Оплата российскими картами не поддерживается. Обходные пути — VPN плюс зарубежная карта (Wise, Revolut, EU-выпущенные) или корпоративный контракт через EU/US юрлицо. Для одиночного российского разработчика это означает дополнительные 30–60 минут на настройку и постоянное использование VPN при работе. По нашему dossier, точный статус геоблокировки на 2026-05 зафиксирован как data gap — статус продолжает меняться.

AgentQL формально мягче. API-сервис без явных RU-блокировок: дёргать endpoint можно с любого IP. Документация — на английском, личный кабинет тоже. Реальная проблема — оплата: pay-per-query требует привязки карты, и российские карты не принимаются. Решение то же — зарубежная карта или корпоративная подписка через зарубежное юрлицо.

Качество русского в обоих сервисах — отдельная история. Devin понимает русский в ТЗ, в коде может ставить русские комментарии, но интерфейс полностью на английском, и официально работа с русскими ТЗ не тестировалась. AgentQL работает с русскоязычными сайтами через описание элементов на английском (например, {login_button, password_input} на сайте госуслуг) — это работает, потому что AI-слой опирается на роль элемента, а не на текстовое содержимое. Русскоязычный синтаксис самих запросов официально не тестировался.

Если выбирать между двумя для российского разработчика без VPN и зарубежной карты — оба сервиса требуют workaround. Но workaround для AgentQL дешевле: можно протестировать через корпоративный аккаунт коллеги или EU-юрлицо за минуты, а в случае Devin — это $500/мес-обязательство, которое тоже идёт через зарубежные структуры.

На практике: для российской команды, у которой есть EU-юрлицо или партнёр в США, оба сервиса в принципе доступны. Для индивидуального разработчика в РФ — оба требуют постоянного workflow с VPN и зарубежной картой. Не ставьте этот фактор выше остальных — он одинаково давит на оба сервиса, и выбор по нему не сделать.

Devin AI 3

AgentQL 5

Скорость генерации

Время от запроса до результата

Один сервис отвечает за миллисекунды на каждый вызов и масштабируется на миллион запросов. Другой думает над задачей часы — но эту задачу не решит человек за два дня. Сравнивать «скорость» в лоб бессмысленно — она про разные единицы работы.

Devin живёт в шкале «десятки минут — часы». По dossier Cognition, типичная задача (небольшой баг-фикс) занимает 10–30 минут реального времени работы агента. Крупная задача (новая фича в существующей кодовой базе) — 1–4 часа. Это сопоставимо со скоростью среднего разработчика на тех же задачах — а порой быстрее за счёт распараллеленных сессий. Параллельность зависит от тарифа: на Teams можно запускать несколько задач одновременно, и каждая идёт своим темпом.

AgentQL живёт в шкале «миллисекунды — секунды». Каждый вызов page.query_elements(...) добавляет overhead к Playwright — по dossier Tinyfish, несколько сотен миллисекунд на запрос за счёт AI-обработки. В production-скрейпере это означает, что 10 000 страниц парсятся за десятки минут с распараллеливанием, или часы при последовательном цикле. По заявлению команды, при изменениях сайтов AgentQL оказывается значительно быстрее ручного поддержания CSS-селекторов — экономия не в самих вызовах, а в том, что скрипт не ломается.

Для практики: единиц работы измеряем через сценарий, а не через секундомер. Если у вас задача «извлечь все сделки с reuters.com за неделю» — её делает AgentQL за минуты, и Devin тут не нужен. Если задача «добавь в репозиторий health-check endpoint с тестами» — её делает Devin за полчаса, и AgentQL тут не помощник.

На практике: не ставьте «скорость» как первый критерий выбора. Сначала отвечайте на вопрос «единица работы — это что?». Если единица — целое инженерное действие (фича, баг, документация) — Devin адекватен по скорости. Если единица — атомарный извлечённый кусок данных или клик на странице — нужен AgentQL.

Devin AI 6

AgentQL 8

Sandbox и изоляция: насколько безопасно запускать агента

Что произойдёт, если агент ошибётся

Удалит важный файл. Откатит миграцию. Постит коммит в main. Когда агент имеет доступ к шеллу и git, sandbox — не косметическая фича, а защита от катастрофы. Это вопрос архитектурный.

Devin запускается в собственном изолированном контейнере на стороне Cognition. По dossier, код выполняется в sandbox-окружении, не на сервере клиента — это снимает значительную часть рисков «агент удалил production-файлы», потому что у агента физически нет к ним доступа. Файлы он трогает только в clone-копии вашего репозитория внутри своего контейнера, а итог попадает обратно в виде pull request, который вы можете прочитать и отклонить.

Это сильная сторона Devin как enterprise-инструмента. On-premise option для Enterprise даёт возможность развернуть всю эту инфраструктуру на собственной инфре клиента — релевантно для компаний с регуляторными требованиями к данным. SSO, audit logs и SLA — стандартные enterprise-фичи.

У AgentQL sandbox в классическом смысле нет — это библиотека, исполняющаяся в окружении самого разработчика. Если ваш скрипт вызывает page.click(...) на ваш production-админ-сайт, AgentQL найдёт правильную кнопку и кликнет её. Ответственность за то, чтобы скрипт не нажимал «Удалить аккаунт» лежит на разработчике. HTML-страниц отправляется на серверы AgentQL для AI-обработки — это другой пласт безопасности, не sandbox, но privacy-вопрос (см. подтему о compliance).

Эта разница вытекает из дизайна. Devin — автономный агент, и sandbox обязателен, иначе цена ошибки катастрофическая. AgentQL — инструмент в руках разработчика, и его «sandbox» это и есть та самая Playwright-сессия, которую вы сами настроили (например, запускаете в Docker, используете тестовое окружение для прогонов и т.д.).

Для команды с requirements типа «никаких внешних серверов», Devin Enterprise on-premise — единственный реалистичный вариант. AgentQL же отправляет HTML на свои серверы для AI-обработки, и без on-premise это блокер для compliance-чувствительных задач.

На практике: для безопасности при использовании Devin — настройте код-ревью PR от агента как обязательный шаг, не давайте Devin доступ к репозиториям с секретами. Для AgentQL — изолируйте Playwright в Docker, используйте отдельные сервисные аккаунты, никогда не вызывайте deconstructive-методы (.click() на «Удалить») без явного allowlist.

Devin AI 9

AgentQL 5

Безопасность данных и compliance (SOC2, GDPR, no-training-on-data)

Куда уходят ваши данные

Каждый запрос — это либо код вашего репозитория, либо HTML с целевого сайта. Куда он попадает, как хранится, обучают ли на нём модели — отвечать всё равно вам, не сервису. Для enterprise это первый параметр выбора.

Devin для Enterprise заявляет SOC 2 Type 2, on-premise deployment, SSO, audit logs и SLA — стандартный набор корпоративных гарантий. Точный сертификационный статус (текущая дата аудита, объём scope) мы зафиксировали как data gap, потому что Cognition публикует политику для NDA-разговоров с sales, а не как открытый сертификат на сайте. По заявлению компании, для Starter-уровня действуют стандартные условия, отличающиеся от Enterprise.

AgentQL отправляет HTML-страниц на свои серверы для AI-обработки — это естественная часть архитектуры (AI-слой работает на стороне сервиса). Полную privacy policy мы зафиксировали как data gap в dossier, поэтому конкретные пункты (хранится ли HTML, обучают ли на нём, есть ли SOC 2) подставлять не будем. По §17 нашего скилла это означает оценку 5/10 с пометкой «компания не публикует полные данные» — это позиция редакции, а не претензия к продукту.

Сравнение здесь жесткое не в чью-то пользу. Cognition демонстрирует enterprise-ready позицию для крупных контрактов, но детали наружу не раскрывает. Tinyfish ещё не на той стадии корпоративной зрелости, когда compliance становится приоритетом маркетинга. Оба сервиса требуют отдельной коммуникации с sales/legal перед production-использованием в регулируемой среде.

На практике: если у вас регуляторные требования (банк, страховая, госсектор, медицина) — общайтесь с sales обоих сервисов и требуйте письменные гарантии в контракте, не доверяйте маркетинговым описаниям. Для команды без регуляторного давления — sandbox-контейнер Devin и Docker-изоляция Playwright у AgentQL дают разумный baseline.

Devin AI 7

AgentQL 5

Финансирование, стабильность компаний и долгосрочная перспектива

Останется ли сервис на следующий год

Подписываетесь на сервис, встраиваете его в pipeline, через год компания пропадает. В категории ai-agents 2024–2025 это не теоретический риск — миграция занимает недели и сжигает доверие команды. Финансы под капотом — реальный фактор.

Cognition AI (за Devin) — одна из самых громко профинансированных компаний категории. Серия A на $21M в январе 2024 под лидерством Founders Fund, а уже в апреле 2024 — Серия B на $175M при оценке $2B, опять Founders Fund. Это редкое сочетание скорости и масштаба раундов, говорящее о высоком доверии инвесторов. Для пользователя это означает, что Cognition имеет ресурсы на годы вперёд и риск закрытия в обозримой перспективе минимален.

Tinyfish Inc. (за AgentQL) находится на ранней стадии — Seed-раунд $2M (по Crunchbase). Это типичный размер первого внешнего раунда для developer-tools-стартапа, и для нишевого продукта он адекватен — но классифицируется как «ранний этап с риском». Маленькая компания может масштабироваться в Series A или быть купленной более крупным игроком. Может и закрыться или пивотнуть — это нормальная статистика раннего стартапа.

На практике это влияет на выбор: для долгосрочной production-инфраструктуры с горизонтом 3+ лет Devin как часть Cognition выглядит безопаснее. AgentQL стоит использовать сейчас под конкретные задачи, но иметь план миграции на Playwright без AI-слоя — на случай, если Tinyfish уйдёт. Технически такой план реалистичен: AgentQL — обёртка над Playwright, и переход обратно на CSS-селекторы возможен (хоть и трудозатратен).

На практике: если ваш проект — production-критика на 3+ года, Devin выглядит безопаснее как поставщик. Но это не значит «не пробуйте AgentQL» — просто фиксируйте, как мигрировать обратно на чистый Playwright, и обновляйте план каждый квартал.

Devin AI 9

AgentQL 4

Production-кейсы и реальные использования

Что реально работает в проде

Демо-видео в Twitter — один уровень доказательства. Реальные команды, которые платят и используют сервис каждый день — совсем другой. У одного из наших участников путь от первого к второму был тернистым, у другого — тише и без хайпа.

Devin в марте 2024 пережил самый яркий запуск года в категории. Виральное демо: агент проходит engineering interview и правит баги в реальных репозиториях. Хайп на X, Hacker News, Forbes, TechCrunch — мгновенный «первый AI-разработчик». В июле 2024 r/MachineLearning опубликовал детальный разбор о cherry-picked-постановке: большинство реальных задач Devin проваливал или делал неправильно. Это вызвало широкое обсуждение «vibe AI» в категории. К 2025-му картина выровнялась: Devin реально полезен на CRUD-операциях, рефакторинге и тестах, но переоценён для сложных архитектурных задач. По dossier Cognition, в production его используют технологические компании (точные имена клиентов не раскрываются).

AgentQL прошёл путь иначе — без хайпа, через developer community. Позитивные отзывы от разработчиков, работающих с web scraping, появились в комментариях на HN и в блогах по Playwright. Отмечают оригинальность query-language подхода против free-form промпта. Широкой известности вне сообщества web automation у AgentQL нет — это нишевый инструмент. Точные имена клиентов Tinyfish также не раскрывает.

На практике: перед оплатой обоих сервисов прочитайте свежие обсуждения — для Devin сабреддит r/MachineLearning и r/AItools, для AgentQL — комментарии в обсуждениях Playwright и web-scraping-сообществах. Не делайте выбор только по виральным демо — после прецедента июля 2024 на них в категории смотрят с большой осторожностью.

Devin AI 6

AgentQL 6

Сценарии победы первого сервиса (use-cases)

Когда нужен именно Devin

Не «coding agent в целом», а конкретные ситуации, в которых ставка на Devin вернётся реальным leverage. Их меньше, чем обещают демо, но они есть — и в этих сценариях AgentQL не помощник в принципе.

Сценарий 1: масштабирование бэклога рутинных тикетов. У команды накопилось 50 тикетов «обновить зависимость X», «починить flaky test Y», «добавить null-check в Z». Живой разработчик потратит на это неделю, а нужен на архитектурных задачах. Devin берёт пять-десять таких тикетов параллельно, открывает PR-ы, разработчик их ревьюит и мержит. Realtime-сессия даёт прозрачность процесса. AgentQL в этом сценарии бесполезен — это не его задача.

Сценарий 2: end-to-end фича по чёткому ТЗ. «Добавь Google OAuth в users-сервис, используй passport.js, refresh_token в Postgres-таблице oauth_tokens». Devin планирует, ставит зависимости, пишет handler, добавляет тесты, открывает PR. На нашем тесте средней сложности — заняло около часа, против двух-трёх часов у среднего разработчика с переключением контекста.

Сценарий 3: исследование новой библиотеки. Команда хочет попробовать новый фреймворк. Девин в браузере читает официальные docs, в shell ставит пакет, в редакторе пишет POC, в браузере проверяет, что работает. Один pipeline вместо четырёх контекстов разработчика.

Сценарий 4: документация и тесты для legacy-кода. Старый модуль без тестов, без docstrings, у которого автор давно ушёл. Devin читает код, пишет docstrings, пишет unit-тесты, открывает PR. На скучных, но обязательных задачах агент особенно хорош, потому что они не требуют архитектурного suждения.

Сценарий 5: stand-up-доступная команда на Slack. Распределённая команда уже общается в Slack. Devin интегрирован — ставишь задачу одной командой, как обычному коллеге. Не нужно учить команду новому UI, не нужно отдельных каналов коммуникации.

На практике: если в вашей неделе типичного разработчика 30–40% времени съедают именно такие задачи — Devin может вернуть существенную часть этого времени. Если основная работа — архитектурная разработка или сложный рефакторинг — экономия будет скромнее.

Devin AI 9

AgentQL 3

Сценарии победы второго сервиса (use-cases)

Когда нужен именно AgentQL

Не «AI для web», а конкретные ситуации, в которых query language Tinyfish даёт точный leverage. И в этих сценариях даже самый продвинутый coding agent — не подходящий инструмент.

Сценарий 1: production-скрейпер, который ломается от обновлений сайтов. У вас 50 скрейперов на Playwright с CSS-селекторами. Каждый раз, когда целевые сайты обновляют вёрстку, селекторы ломаются, и кто-то из команды тратит часы на их починку. AgentQL заменяет хрупкие CSS-селекторы на natural-language описания структуры — запросы, по заявлению Tinyfish, продолжают работать через обновления.

Сценарий 2: data extraction из 1 000+ страниц в фиксированном формате. «Извлечь название, цену и наличие со страниц карточек товара». Query language даёт структурированный ответ в Python-объекте — без regexp-парсинга текста, без проб-и-ошибок с XPath. Цикл из 100 строк кода обходит миллион страниц.

Сценарий 3: web automation без CSS-знаний. Бэкенд-разработчик умеет писать Playwright, но не любит возиться с CSS-селекторами на чужих сайтах. AgentQL даёт описательный синтаксис: «найди поле логина, найди кнопку входа, найди уведомление об ошибке» — без углубления в DOM целевого сайта.

Сценарий 4: подготовка demo и proof-of-concept за день. Free-тариф позволяет за вечер написать прототип web-автоматизации и показать заказчику, как это будет работать в production. Devin в этом сценарии — оверкилл, потому что задача узкая.

Сценарий 5: разработка внутри Chrome Extension и REST-вызовов из любого стека. Команда на Ruby или Go, которая не хочет вводить Python в стек — REST API AgentQL вызывается с любого языка. Chrome Extension помогает дебажить запросы в реальном браузере перед тем, как класть их в production-код.

На практике: если ваша команда ведёт production scraping или automation как сервис для бизнеса — попробуйте AgentQL на одном проблемном скрейпере и измерьте, как падает количество фиксов после обновлений сайтов. Если стек только начинается — закладывайте AgentQL с первого дня, чтобы избежать миграции потом.

Devin AI 3

AgentQL 9

Портреты пользователей с адресными рекомендациями

Кому какой подходит

Меньше абстракций — больше конкретных людей. Если узнаёте себя в одном из портретов ниже, рекомендация прилагается. Если не узнаёте — ни один из двух сервисов вам сейчас не нужен.

Портрет 1: Lead-разработчик в продуктовом стартапе из 6 человек. Команда страдает от бэклога рутинных задач, бюджет терпимый, GitHub + Slack уже стоят. Ответ — Devin Starter за $500/мес. Пробует месяц на 20 типовых тикетов, считает экономию часов команды, продлевает или нет.

Портрет 2: Solo-разработчик из РФ без EU-юрлица. Хочет автоматизировать рутину, но платить $500/мес в долларах без зарубежной карты не может. Devin не подходит структурно. Возможно, AgentQL Free для конкретных задач — если есть VPN и зарубежная карта хотя бы по знакомым.

Портрет 3: Data engineer, который строит pipelines на Python и парсит десятки сайтов. CSS-селекторы ломаются регулярно, на их починку уходит до 20% рабочей недели. Ответ — AgentQL. Начинает с Free-тарифа на одном проблемном скрейпере, считает падение фикс-инцидентов за месяц, переходит на платный тариф по факту.

Портрет 4: CTO средней компании с регуляторными требованиями (банк, страховая, госсектор). Не имеет права отправлять данные на внешний сервис. Devin Enterprise on-premise — потенциально подходит после переговоров с Cognition. AgentQL без on-prem deployment — пока нет.

Портрет 5: разработчик, который сейчас не использует Playwright. AgentQL нужен только тем, кто уже на Playwright или готов на него мигрировать. Если у вас Selenium или Puppeteer — AgentQL не подходит без миграции стека.

Портрет 6: техно-журналист или ресерчер. Хочет автоматизировать сбор материалов с веба, не разработчик. Ни Devin (для него overkill), ни AgentQL (нужны Python и Playwright) не подходят — лучше No-code-инструменты из той же категории (см. общий обзор ai-agents).

На практике: не ставьте оба сервиса параллельно сразу. Возьмите Free-тариф AgentQL на неделю, а Devin — на один месяц после первой итерации. Поэтапный пробный путь снижает риск разочарования и помогает сравнить с реальным baseline вашей команды.

Devin AI 7

AgentQL 7

Итоговая таблица оценок

Подтема	DA Devin AI	AG AgentQL
1.Карта подгрупп: что эти N сервисов реально делают	8	9
2.Автономность и уровень контроля пользователя	9	4
3.Выполнение задач в браузере и computer use	7	9
4.Качество кода и agentic coding	8	2
5.Планирование задачи и декомпозиция (task planning)	8	3
6.Self-correction: обнаружение ошибок и восстановление	7	7
7.Тарифы и стоимость владения за год	4	6
8.Free-тариф: что реально дают навсегда vs trial	2	7
9.API и production-pipeline	6	9
10.Доступность из России и оплата российскими картами	3	5
11.Скорость генерации	6	8
12.Sandbox и изоляция: насколько безопасно запускать агента	9	5
13.Безопасность данных и compliance (SOC2, GDPR, no-training-on-data)	7	5
14.Финансирование, стабильность компаний и долгосрочная перспектива	9	4
15.Production-кейсы и реальные использования	6	6
16.Сценарии победы первого сервиса (use-cases)	9	3
17.Сценарии победы второго сервиса (use-cases)	3	9
18.Портреты пользователей с адресными рекомендациями	7	7
Итого (средняя)	6,6	6,0

Методика: каждая подтема оценивалась по шкале 1–10. Итоговая средняя — арифметическое всех подтем.

Финальный вердикт

Короткие итоги по каждому сервису — чтобы не перечитывать весь обзор.

Devin AI

6,3 / 10

Берите Devin, если у команды есть бюджет $500+/мес, на GitHub лежит реальный бэклог рутинных тикетов, и команда готова инвестировать первый месяц в калибровку workflow. Не подходит solo-разработчику из РФ без EU-юрлица и не подходит для production-веб-автоматизации — это не его задача.

Попробовать Devin AI

AgentQL

5,9 / 10

Берите AgentQL, если уже пишете на Playwright и устали чинить CSS-селекторы после обновлений сайтов. Free-тариф позволяет проверить на ваших целевых сайтах за неделю. Не подходит, если нужен полноценный autonomous agent или вы не работаете с Playwright.

Попробовать AgentQL