Сравнительный обзор 🦾 ИИ-агенты

ИИ-агенты 2026: Devin, Operator, Lindy, Manus и ещё 6 — полный обзор

Полный обзор 10 ИИ-агентов, май 2026: Gemini Deep Research, Manus, OpenAI Operator, Devin AI, Anthropic Computer Use, AutoGPT, Lindy AI, AgentQL, MultiOn, Agent Zero. 21 параметр: браузер, код, research, workflow, цены, Россия, sandbox, надёжность.

📅 05 Май 2026 · ✍️ Редакция AIRatings · ⏱️ ~33 мин чтения · 💬 Обсуждение

Содержание

1.Карта подгрупп: что эти 10 сервисов реально делают 2.Автономность и контроль: кто запрашивает разрешение, а кто — нет 3.Управление браузером: кто реально кликает, а кто только делает вид 4.Автономная разработка кода: кто пишет, запускает и чинит? 5.Глубокое исследование: кто пишет реальные аналитические отчёты? 6.Планирование и декомпозиция задач: кто умеет думать перед действием? 7.Self-correction: кто умеет признать ошибку и выбрать другой путь? 8.Долгосрочные задачи: работает ли агент часами без вашего участия? 9.Автоматизация бизнес-процессов: триггеры, интеграции, фоновая работа 10.Качество русского языка: понимание задач и генерация текстов 11.Тарифы и стоимость: от $0 до $500/мес — что реально получаете? 12.Free-тариф: что реально дают навсегда vs что это «trial»? 13.API и production-pipeline: кто доступен программно для разработчиков? 14.Доступность из России: кто реально работает без VPN и зарубежных карт? 15.Скорость выполнения задач: минуты, часы или секунды? 16.Sandbox и изоляция: насколько безопасно запускать агента? 17.Интеграции: с какими инструментами реально работает агент? 18.Безопасность данных: куда уходит ваша информация? 19.Финансирование и стабильность: риск закрытия сервиса через год? 20.Реальные кейсы vs vibe-демо: кто работает в production? 21.Кому что брать: адресные рекомендации по профилям пользователей

📊 Итоговая таблица оценок 🏆 Финальный вердикт 💬 Обсуждение

К маю 2026 года словосочетание «ИИ-агент» стало одновременно самым перегретым и самым содержательным термином в технологиях. За ним прячутся принципиально разные инструменты. Devin AI — автономный разработчик за $500/мес, который пишет код часами в изолированном Linux-окружении и открывает pull request'ы. Gemini Deep Research делает десятки Google-поисков за 10 минут и выдаёт 5 000-словный отчёт с источниками. Lindy AI читает вашу корпоративную почту, пишет ответы и обновляет HubSpot — и всё это без строчки кода. OpenAI Operator бронирует рестораны и заказывает еду в реальном браузере, пока вы занимаетесь другим.

Это не конкуренты — это разные продукты для разных задач. Автор кода не ищет замену Devin в Lindy. Журналист, которому нужен быстрый research, не будет настраивать AutoGPT с Docker. Эти десять сервисов покрывают пять разных ниш, и правильный выбор зависит от того, что именно вы хотите автоматизировать.

Мы протестировали все десять сервисов по 21 параметру. Коротко о главном: для deep research — Gemini Deep Research ($19.99/мес, входит в Google One). Для email и CRM-автоматизации без кода — Lindy AI (от $49.99/мес). Для автономной разработки кода — Devin ($500/мес, если бюджет позволяет) или Anthropic Computer Use API (если хотите строить своё решение). Для web scraping с Playwright — AgentQL. Для бесплатного self-hosted агента с полной приватностью — Agent Zero или AutoGPT Classic. Для пользователей из России без VPN — только эти двое.

Карта подгрупп: что эти 10 сервисов реально делают

Десять сервисов делают принципиально разные вещи. Сравнивать Devin и AgentQL по одним критериям — то же, что сравнивать IDE и bash-скрипт: оба «работают с кодом», но задачи несопоставимы. Начнём с карты пяти подгрупп.

Категория ai-agents делится на пять функциональных подгрупп. Сервис, чья задача не попадает в подгруппу подтемы, получает низкий балл не потому что плохой, — а потому что не предназначен для этой задачи.

Подгруппа 1 — Исследовательские агенты. Автономный многошаговый поиск, синтез информации, длинные структурированные отчёты с источниками. Сервисы: Gemini Deep Research (лидер) и частично Manus (шире по задачам). Конкурируют с Perplexity Deep Research и ChatGPT Deep Research — не с Devin.

Подгруппа 2 — Computer-use / browser агенты. Управление браузером и компьютером через GUI: клики, формы, скриншоты. Без DOM-парсинга — vision-based. Сервисы: OpenAI Operator (consumer), Anthropic Computer Use (developer API), MultiOn (API для разработчиков), AgentQL (structured web automation).

Подгруппа 3 — Кодирующие агенты. Написание кода, запуск тестов, дебаггинг, PR в реальный GitHub-репозиторий. Полноценная Linux-среда. Сервис: Devin AI (единственный в этой подгруппе в данном обзоре).

Подгруппа 4 — Workflow / no-code агенты. Автоматизация бизнес-процессов через триггеры и интеграции. Email, CRM, календарь — без кода. Сервис: Lindy AI.

Подгруппа 5 — Open-source / self-hosted фреймворки. Максимальная кастомизация, нулевые затраты при локальных моделях, полная приватность. Сервисы: AutoGPT и Agent Zero.

Manus — специальный случай: амбициозный multi-agent с браузером, кодом и файлами в одном месте. Хорошо позиционирован концептуально, но производительность в production ниже специализированных конкурентов.

На практике

Исследователю с Google Docs нужен Gemini Deep Research, а не Devin. Разработчику, которому надо ежедневно автоматизировать рутину в коде — Devin или Anthropic Computer Use, а не Lindy. Предпринимателю без технического фона, которому нужен email-ответчик — Lindy, а не AutoGPT с Docker.

Gemini Deep Research 8

Manus 7

OpenAI Operator 7

Devin AI 9

Anthropic Computer Use 7

AutoGPT 5

Lindy AI 9

AgentQL 8

MultiOn 6

Agent Zero 5

Автономность и контроль: кто запрашивает разрешение, а кто — нет

Агент, который сделает всё сам и не спросит ни разу — мечта маркетолога и кошмар системного администратора. Реальный вопрос: где граница между «агент действует» и «агент разрушает»? Как разные сервисы решают дилемму автономия vs контроль?

Spectrum автономности в этой категории — от полного autopilot до «каждый шаг подтверждается». Нет универсально правильной точки: нужная точка зависит от задачи.

Anthropic Computer Use — максимальный контроль, потому что это developer API. Разработчик сам реализует всю логику: сколько шагов без подтверждения, что является критичным действием, как логировать. Anthropic предупреждает явно: «запускайте в изолированной VM, добавляйте human oversight для критичных операций». Гибкость абсолютная, но ответственность тоже на разработчике.

Devin по умолчанию работает автономно часами, но пользователь видит все действия в реальном времени — экран Devin транслируется в браузере. Можно остановить на любом шаге (Pause/Resume), задать уточняющий вопрос. Slack-интеграция позволяет получать обновления статуса, не заходя в интерфейс.

Lindy AI использует паттерн «триггер → действие → эскалация»: если агент не уверен или сталкивается с нестандартной ситуацией — останавливается и спрашивает человека (Escalation). Это делает Lindy предсказуемым для бизнес-процессов.

Gemini Deep Research показывает список вопросов исследования до запуска — пользователь может добавить, убрать или изменить их. Это уникальный паттерн контроля: не «подтверди каждый шаг», а «определи направление один раз». После старта агент работает самостоятельно 5–20 минут.

OpenAI Operator по дизайну останавливается перед критичными действиями: при встрече с формой оплаты, логином, CAPTCHA — просит пользователя вмешаться. Платёжные данные Operator принципиально не хранит.

AutoGPT Classic — исторически главная проблема. Агент запускается в «полный autopilot» и часто входит в бесконечный цикл, не распознавая, что зашёл в петлю. Без человека рядом это может обойтись в десятки долларов за API-вызовы и нулевой результат. AutoGPT Platform (новый no-code редактор) добавляет более явный контроль, но до зрелости Devin или Lindy пока далеко.

На практике

Если задача критичная (отправка писем клиентам, изменение данных CRM) — выбирайте Lindy с эскалацией или Devin с явным pause-and-review. Полный autopilot (Manus, AutoGPT) — только для задач, где ошибка исправима.

Gemini Deep Research 8

Manus 6

OpenAI Operator 7

Devin AI 8

Anthropic Computer Use 9

AutoGPT 4

Lindy AI 8

AgentQL 7

MultiOn 6

Agent Zero 6

Управление браузером: кто реально кликает, а кто только делает вид

Браузер — главный инструмент пост-человеческой рутины. Заполнить форму, забронировать столик, скрапить данные с таблицы, кликнуть по 200 ссылкам. Как разные агенты управляют браузером — и насколько надёжно?

Подходы к управлению браузером делятся на два лагеря: vision-based (агент видит скриншот страницы и кликает по координатам) и DOM-based (агент читает HTML-структуру и взаимодействует с элементами напрямую).

Vision-based (OpenAI Operator, Anthropic Computer Use, MultiOn) устойчивее к динамическому контенту и нестандартному UI — агент видит то же, что видит человек. Недостаток: медленнее (каждый шаг требует анализа скриншота) и хуже справляется с мелкими элементами или плохим контрастом.

AgentQL — гибридный: использует AI-слой поверх Playwright, описывая элементы на естественном языке. Запрос вида { search_input, results[] { title, link } } находит нужные элементы независимо от изменений HTML-структуры. Это не «vision-based», но и не хрупкий CSS-селектор.

OpenAI Operator использует специализированную CUA-модель (Computer-Use Agent), обученную именно на задачах управления браузером — не общую LLM с инструкциями. На сайтах-партнёрах (DoorDash, Instacart, OpenTable, Priceline, Uber Eats) работает надёжнее за счёт официальных интеграций. На нетипичных сайтах — ненадёжно.

Anthropic Computer Use с Claude Opus 4.7 поддерживает скриншоты до 2576px — это улучшает распознавание мелких UI-элементов. Разработчик сам строит агента на этих примитивах: tool computer (скриншот + клики), bash, text_editor.

Manus комбинирует headless Chromium с Python sandbox: агент одновременно может открыть браузер, скрапить данные и записать их в Excel. На простых задачах впечатляет; на нестандартных страницах — нестабилен.

MultiOn — managed browser в облаке MultiOn. Разработчик вызывает API с задачей и URL, агент выполняет в своём браузере. Шаг занимает 3–15 секунд.

Оценка надёжности browser-use на нетипичных сайтах (1–10)

На практике

Если нужна надёжная автоматизация сайтов с Playwright — AgentQL снизит стоимость поддержки в разы: HTML изменился, запрос работает без правок. Если нужен потребительский браузер-агент для US-сайтов (ресторан, доставка) — Operator. Если строите RPA-систему с полным контролем — Anthropic Computer Use API.

Gemini Deep Research 6

Manus 8

OpenAI Operator 9

Devin AI 4

Anthropic Computer Use 8

AutoGPT 5

Lindy AI 2

AgentQL 9

MultiOn 7

Agent Zero 4

Автономная разработка кода: кто пишет, запускает и чинит?

«Напиши мне приложение» — самый вирусный промпт 2024 года. Но разница между «написал функцию» и «запустил тесты, разобрал stack trace, открыл PR» — это пропасть. Кто из агентов работает как junior-разработчик, а кто просто генерирует код в текстовое поле?

Настоящий coding agent — это не LLM, которая пишет код в чате. Это агент с реальным окружением: shell, интерпретатор, git, тест-раннер. Он запускает то, что написал, читает ошибку, исправляет и запускает снова.

Devin AI — единственный в обзоре, построенный именно для этого. Полноценный Linux-контейнер: shell, VS Code-like редактор, браузер для документации, git. В марте 2024 Devin показал 13.86% на SWE-bench Verified — первый результат выше 10% в истории бенчмарка. Это конкретное число из верифицированного источника. В мае 2025 анонсирован Devin 2.0 (детали требуют верификации на дату обзора).

Anthropic Computer Use через инструменты bash и text_editor даёт полноценную среду разработки. Разработчик сам строит агента — может создать coding loop с тестами, CI-интеграцией, PR-созданием. Claude Sonnet 4.6 набирает 79.6% на SWE-bench Verified, что превышает исторический результат Devin — но это бенчмарк модели, а не агентской системы Devin.

Manus включает Python sandbox и может выполнять код, но ориентирован на broad tasks (research + код + файлы), а не на pure coding. На задачах типа «напиши React-компонент и запусти тесты» нестабилен: агент часто не завершает полный цикл или пропускает тестирование.

AutoGPT поддерживает выполнение Python-кода через инструмент, но это далеко от Devin: нет реального IDE, нет git, нет tест-раннера в полноценном смысле. Подходит для простых скриптов, не для feature-разработки.

Agent Zero запускает код в Docker-контейнере, что технически аналогично sandbox Devin. Но это open-source фреймворк — нет автоматического тест-раннера, нет git-интеграции из коробки. Для технически грамотного разработчика, готового настраивать — вполне рабочий вариант.

На практике

Технологическая команда, которой нужно автоматизировать тесты, рефакторинг и документацию: Devin ($500/мес) или Anthropic Computer Use API (платите только за токены). Для разовой задачи «напиши скрипт» — обычный Claude или ChatGPT в 10 раз дешевле и часто быстрее.

Gemini Deep Research 2

Manus 7

OpenAI Operator 2

Devin AI 9

Anthropic Computer Use 8

AutoGPT 5

Lindy AI 1

AgentQL 3

MultiOn 2

Agent Zero 6

Глубокое исследование: кто пишет реальные аналитические отчёты?

«Изучи рынок телемедицины в России — конкуренты, регуляторика, объём рынка.» Аналитик потратит на это 4 часа. Deep Research агент — 10–20 минут. Но насколько хорош результат — и кто из 10 сервисов реально делает research?

Полноценный deep research — это не просто «поиск + суммаризация». Это многошаговый процесс: декомпозиция вопроса на подвопросы, 20–50 поисковых запросов, чтение десятков страниц, синтез в структурированный отчёт с инлайн-цитатами.

Gemini Deep Research — единственный в обзоре сервис, построенный именно для этой задачи. Уникальное преимущество: прямой доступ к полному индексу Google Search — не публичный Search API с ограничениями, а тот же индекс, что используют пользователи Google. Результат: 2 000–10 000-словный отчёт с 20–50+ источниками за 5–20 минут. Редактируемый план перед запуском позволяет управлять направлением без промпт-инжиниринга.

Manus делает research как часть broader workflow: поиск + синтез + запись в файл. Качество ниже Gemini Deep Research, особенно на узкоспециализированных темах, но выигрывает когда research нужно сразу комбинировать с другими действиями (скрапинг данных + Excel-отчёт + код для визуализации).

AutoGPT и Agent Zero умеют делать web search (DuckDuckGo, Google через плагины), но quality глубоко зависит от выбранной LLM. С GPT-4o или Claude — приемлемо для простых задач. Без хорошей LLM — плохо.

OpenAI Operator может загрузить страницу и извлечь информацию, но это не research: нет синтеза, нет структурированного отчёта, нет работы с десятками источников одновременно.

Остальные шесть сервисов для deep research не предназначены вообще.

Пригодность для deep research: 30-страничный отчёт за 20 минут (1–10)

На практике

Аналитику нужно еженедельно готовить отчёты по рынку конкурентов: Gemini Deep Research ($19.99/мес) сэкономит 3–4 часа в неделю. Журналисту нужно изучить контекст перед интервью — 15 минут в Deep Research vs 2 часа в Google вручную. Для РФ без VPN этот сервис недоступен.

Gemini Deep Research 10

Manus 7

OpenAI Operator 4

Devin AI 2

Anthropic Computer Use 3

AutoGPT 5

Lindy AI 1

AgentQL 3

MultiOn 2

Agent Zero 5

Планирование и декомпозиция задач: кто умеет думать перед действием?

«Сделай сайт с каталогом товаров и корзиной» — как агент разбивает это на шаги? Составляет ли он план? Следует ли ему или хаотично переключается? Качество планирования — один из главных предикторов надёжности.

Хорошее агентское планирование выглядит так: задача → декомпозиция на подзадачи → выполнение по порядку → обнаружение blockers → альтернативный путь. Плохое: случайный порядок шагов, повторение одного шага 5 раз, невозможность распознать, что задача выполнена.

Devin AI демонстрирует одно из лучших планирований в категории: сессия сохраняет весь контекст задачи, агент ведёт «внутренний план» и не теряет нить при переключении между shell, редактором и браузером. Пользователь видит этот план в реальном времени.

Lindy AI использует структурное планирование через builder: триггеры, условия, ветвления. Это не «думает сам», а «вы рисуете граф, агент следует». Предсказуемо, но ограничено рамками заранее определённого workflow.

Gemini Deep Research показывает план исследования пользователю до запуска: список под-вопросов. Пользователь может редактировать. После старта — агент следует плану строго. Это сознательный дизайн-выбор.

Manus использует multi-agent parallelism: несколько специализированных sub-агентов работают одновременно. Это ускоряет сложные задачи, но иногда ведёт к конфликтам или дублированию работы.

AutoGPT Classic — исторически слабое место. Паттерн Plan-Act-Verify теоретически правильный, но на практике агент часто теряет цель, делает лишние шаги или застревает в петле «обдумываю как подумать о задаче».

Agent Zero может создавать рекурсивных sub-агентов для подзадач — уникальная архитектура в open-source пространстве. На практике требует хорошей базовой LLM (Claude или GPT-4o), иначе планирование деградирует.

Оценка по параметру

На практике

Задача длиннее 5 шагов — выбирайте агента, который показывает план до начала выполнения (Gemini Deep Research, Devin). Задача с ветвлениями и условиями — Lindy AI (explicit workflow builder). Экспериментальные задачи без чёткого плана — Agent Zero с хорошей LLM.

Gemini Deep Research 8

Manus 7

OpenAI Operator 6

Devin AI 9

Anthropic Computer Use 6

AutoGPT 4

Lindy AI 8

AgentQL 4

MultiOn 5

Agent Zero 6

Self-correction: кто умеет признать ошибку и выбрать другой путь?

Агент кликнул не туда. Страница вернула 404. Тест упал. Капча заблокировала. Умеет ли агент распознать, что что-то пошло не так, и выбрать другой путь — или продолжает ломиться в ту же стену?

Self-correction — критичный параметр для production. Задача с 10 шагами, где на шаге 7 что-то пошло не так, должна либо корректно восстановиться, либо остановиться и сообщить о проблеме. Агент, который молча продолжает работу после ошибки, создаёт иллюзию прогресса и реальный ущерб.

Devin AI — лидер в этой подтеме благодаря coding-специфичной архитектуре. Когда тест падает, агент читает stack trace, находит строку с ошибкой, исправляет и запускает снова. Это не «попробую ещё раз» — это «понял ошибку, изменил код в конкретном месте». Такой цикл может повторяться 3–5 раз на одном баге.

Lindy AI использует паттерн Escalation: если агент встречает ситуацию, которую не умеет обработать — останавливается и передаёт человеку. Это не «восстановление», а «умное признание границ» — для бизнес-процессов именно это правильный подход.

Gemini Deep Research адаптирует план в процессе: если первый поиск не дал результатов, агент переформулирует запрос и пробует другой угол. Пользователь не видит этого напрямую, но финальный отчёт показывает, что охват был широким.

Agent Zero использует memory-based self-correction: агент записывает в долгосрочную память выводы о своих ошибках («при запросе X нужно делать Y») и применяет их в будущих сессиях. Это не быстрое восстановление в рамках одной задачи, а обучение между сессиями.

AutoGPT Classic — слабейший в этой подтеме. Нередко агент оказывается в ситуации «я пытаюсь понять, как начать думать о том, как начать задачу» и крутится там без выхода. Пользователи Reddit фиксируют случаи, когда AgentGPT расходовал $5–10 на API и возвращал нулевой результат именно из-за бесконечных recovery-циклов.

На практике

Production-задача с ценой ошибки выше $10 (отправка писем, изменение данных CRM): только агенты с explicit escalation (Lindy) или human-in-the-loop (Devin). Экспериментальные задачи с низкой ценой ошибки — Manus, Agent Zero подойдут.

Gemini Deep Research 7

Manus 5

OpenAI Operator 6

Devin AI 9

Anthropic Computer Use 7

AutoGPT 3

Lindy AI 8

AgentQL 5

MultiOn 5

Agent Zero 7

Долгосрочные задачи: работает ли агент часами без вашего участия?

Агент начал задачу. Прошёл час. Два. Восемь. Нужно ли держать браузер открытым? Помнит ли агент, что делал три часа назад? Что происходит при разрыве соединения? Долгосрочность — слабое место большинства агентов 2025 года.

Большинство агентов сессионные: задача живёт в рамках одного соединения. Закрыл вкладку — потерял контекст. Настоящая долгосрочность требует персистентной памяти, асинхронного выполнения и механизма восстановления.

Lindy AI — единственный в обзоре, изначально спроектированный для постоянной фоновой работы. Lindy-агент не «запускается по запросу» — он живёт: читает почту 24/7, мониторит события, выполняет действия по триггеру. Если пользователь отключится — Lindy продолжает. Это принципиально другая архитектура.

Devin AI — лучший среди coding-агентов: сессия может длиться часами, контекст сохраняется, пользователь получает обновления в Slack. Параллельные сессии позволяют запустить несколько задач одновременно.

Manus выполняет задачи асинхронно: можно закрыть браузер и вернуться к результатам. Но долгосрочная память между сессиями слабая — каждая задача начинается с чистого листа.

Agent Zero хранит персистентную память между сессиями (vector store + текстовые файлы): агент помнит факты, которые выучил. Это уникальная фича в open-source пространстве — возможность «обучить» агента поведению, которое сохраняется между запусками.

AutoGPT Classic может работать долго — но это риск: чем дольше работает, тем больше шансов попасть в бесконечный цикл или потерять цель. Без мониторинга долгая работа AutoGPT нередко заканчивается большими расходами API и малым полезным результатом.

OpenAI Operator и MultiOn — сессионные. Закончил браузерную задачу — всё. Для долгосрочных или повторяющихся задач не предназначены.

Оценка по параметру

На практике

Нужен агент, который работает 24/7 без вашего участия? Только Lindy AI. Нужна многочасовая разработка кода с паузами и возобновлением? Devin. Нужна персистентная память между отдельными запусками? Agent Zero.

Gemini Deep Research 6

Manus 8

OpenAI Operator 3

Devin AI 9

Anthropic Computer Use 4

AutoGPT 5

Lindy AI 10

AgentQL 2

MultiOn 3

Agent Zero 7

Автоматизация бизнес-процессов: триггеры, интеграции, фоновая работа

«Каждый раз, когда приходит письмо от клиента с пометкой срочно, создай задачу в Notion, ответь на письмо, уведоми в Slack.» Это не агентская задача — это workflow. Кто из 10 сервисов умеет автоматизировать бизнес-процессы?

Workflow automation — это триггеры, условия, действия и интеграции. Принципиально отличается от «выполни задачу один раз»: workflow работает постоянно, по событию.

Lindy AI — явный лидер и создан именно для этого. Архитектура: Trigger (что запускает) → Action (что делает) → Memory (что помнит) → Conditions (ветвления). Готовая интеграция с Gmail, Outlook, Google Calendar, Zoom, HubSpot, Salesforce, Slack, WhatsApp Business. Template library с сотнями готовых Lindy-ов. Ключевые кейсы: email-автоответчик, заполнение CRM после звонков, lead-квалификация, расписание встреч. Работает без единой строки кода.

OpenAI Operator может автоматизировать повторяющиеся browser-задачи: «каждый понедельник зайди на этот сайт и скачай отчёт». Не полноценный workflow с триггерами, но для специфических browser-задач работает.

AgentQL автоматизирует web scraping workflows: регулярные запросы к сайтам, мониторинг изменений данных. Разработчик строит это в коде, но AgentQL делает web-часть стабильной.

MultiOn через API позволяет программно запускать browser-задачи как часть larger workflow — например, «для каждого лида из CRM открой его LinkedIn и извлеки данные». Это developer workflow, не no-code.

Manus поддерживает комплексные задачи, но не постоянные workflows. Каждый запуск — новая задача, не триггер.

AutoGPT через плагины может подключаться к внешним сервисам, но надёжность workflow низкая — нет retry-логики, нет мониторинга.

Пригодность для workflow automation (триггеры, интеграции, надёжность, 1–10)

На практике

Предприниматель без технического фона, которому нужно автоматизировать email, CRM и встречи — Lindy AI (от $49.99/мес). Разработчик, которому нужен стабильный web-scraping по расписанию — AgentQL + cron. Команда, строящая RPA-систему — Anthropic Computer Use API как основа.

Gemini Deep Research 2

Manus 5

OpenAI Operator 8

Devin AI 3

Anthropic Computer Use 6

AutoGPT 4

Lindy AI 10

AgentQL 8

MultiOn 7

Agent Zero 4

Качество русского языка: понимание задач и генерация текстов

Агент отвечает, планирует и работает на русском — насколько хорошо? Это не риторический вопрос для аудитории AIRatings: большинство сервисов создавались под английский рынок. Кто реально работает на русском?

Качество русского языка в агентах определяется двумя факторами: базовой LLM (понимание и генерация) и инфраструктурой (поиск русскоязычных источников, интерфейс на русском).

Agent Zero с Claude Sonnet или GPT-4o как базой — лучшее из open-source. Эти модели хорошо понимают русский и генерируют качественный русскоязычный текст. При использовании Ollama с локальными моделями качество падает — большинство local-first моделей значительно слабее на русском. Оценка 9/10 — при использовании Cloud API; 5/10 при Ollama.

AutoGPT Classic — аналогично: качество русского определяется подключённой LLM (OpenAI или Anthropic). При GPT-4o или Claude — хорошее качество работы на русском языке.

Anthropic Computer Use наследует качество русского от Claude (8/10 по данным dossier). Это один из лучших результатов в категории для cloud-сервисов.

Gemini Deep Research понимает задачи на русском и генерирует русский текст, но главная проблема — большинство веб-источников в Google Search, которые агент находит, англоязычные. Русскоязычный research по сути означает: «ищи русские источники по русским запросам», и здесь Яндекс «Нейро» или просто Яндекс-поиск выигрывают у Gemini Deep Research.

Lindy AI — только английский интерфейс, автоматизации настраиваются на английском. Технически работает и по-русски (LLM понимает), но UX оптимизирован под англоязычных пользователей.

OpenAI Operator — ориентирован на английские US-сайты, слабо протестирован на русскоязычных ресурсах.

Качество работы на русском языке (интерфейс + понимание задач + генерация, 1–10)

На практике

Для работы с русскоязычными задачами (тексты, документы, аналитика) лучший выбор — Agent Zero с Claude Sonnet или GPT-4o как бэкендом. При использовании Ollama качество русского значительно хуже. Для web search на русском — Яндекс «Нейро» или Яндекс Поиск остаются сильнее Gemini Deep Research.

Gemini Deep Research 5

Manus 4

OpenAI Operator 3

Devin AI 4

Anthropic Computer Use 6

AutoGPT 7

Lindy AI 3

AgentQL 3

MultiOn 4

Agent Zero 9

Тарифы и стоимость: от $0 до $500/мес — что реально получаете?

Диапазон цен в категории — от $0 (Agent Zero с Ollama) до $500/мес (Devin). Разрыв 500 раз. Но дешевизна Agent Zero требует своего GPU, а Devin за $500 может заменить 10 часов junior-разработчика. Считаем реально.

Большинство агентов в этой категории используют credits-based или pay-per-use модели — не flat subscription. Это означает: реальная стоимость зависит от объёма задач. Ниже — справочник по тарифам.

Минимальная стартовая стоимость ($/мес при типичном использовании)

Agent Zero + Ollama — $0 полностью, если у вас есть GPU и готовность к техническому setup. С Cloud API (Claude Sonnet: $3/млн токенов) реальный расход при 50 задачах в день — $5–30/мес.

Gemini Deep Research входит в Google One AI Premium ($19.99/мес), которая также даёт 2 ТБ облачного хранилища и Gemini Advanced. Если вы уже платите за Google One — Deep Research бесплатен в рамках подписки.

Devin AI $500/мес — это ACU (Agentic Compute Unit). Типичная задача стоит несколько ACU. За $500 можно получить несколько десятков-сотен задач в месяц. Для команды, где Devin заменяет часть работы junior-разработчика ($3 000–5 000/мес) — это может быть выгодно. Для индивидуального использования — очень дорого.

Lindy AI Pro $49.99/мес включает ограниченное число «tasks» (credits). Сложные агенты с большим числом действий (длинные email-треды, сложные CRM-операции) расходуют credits быстрее, чем ожидают пользователи.

На практике

Стартап без технической команды: Lindy ($50/мес) — email + CRM автоматизация. Технический специалист с GPU: Agent Zero + Ollama = $0. Технологическая команда: Devin $500/мес или Anthropic CU API (платите за реальное использование). Аналитик: Gemini Deep Research в рамках Google One ($20/мес).

Gemini Deep Research 7

Manus 4

OpenAI Operator 5

Devin AI 2

Anthropic Computer Use 5

AutoGPT 8

Lindy AI 6

AgentQL 6

MultiOn 5

Agent Zero 9

Free-тариф: что реально дают навсегда vs что это «trial»?

Бесплатный tier — это полезный инструмент или маркетинговая ловушка? В категории ИИ-агентов «бесплатно» означает очень разные вещи: от «навсегда при наличии своей инфры» до «100 запросов в месяц, потом платите».

Agent Zero — единственный сервис с настоящим «free forever»: MIT-лицензия, self-hosted, без сервера Tinyfish Inc. При использовании Ollama с локальной моделью (LLaMA 3, Mistral) — полный $0, включая inference. Единственный «cost» — электричество и наличие GPU.

AutoGPT Classic — аналогично: MIT-лицензия, self-hosted. Разница: AutoGPT менее ориентирован на локальные модели, поэтому реально платите за OpenAI или Anthropic API-ключи. При нескольких задачах в день это $5–30/мес.

Gemini Deep Research Free — очень ограниченный. Полноценный Deep Research требует Gemini Advanced ($19.99/мес). Free tier даёт несколько запросов в месяц по данным пользователей — достаточно чтобы попробовать, не достаточно для работы.

OpenAI Operator — нет бесплатного. Требует ChatGPT Plus ($20) или Pro ($200).

Devin AI — нет бесплатного trial. Starter с $500/мес — минимальный вход. Это одна из самых высоких платных точек входа в категории.

AgentQL и MultiOn имеют ограниченные free tier (несколько сотен запросов в месяц по имеющимся данным), достаточные для разработки и тестирования. Для production — платный план.

Lindy AI Free — несколько задач в месяц, достаточно чтобы понять концепцию. Для реальной email-автоматизации нужен Pro ($49.99/мес).

Оценка по параметру

На практике

Хотите попробовать агента бесплатно и без ограничений по времени — Agent Zero (Python + Docker + Ollama). Первые 20 минут настройки, дальше — бесплатно и полностью приватно. Не хотите настраивать: попробуйте free tier AgentQL или MultiOn для web-automation задач.

Gemini Deep Research 5

Manus 3

OpenAI Operator 2

Devin AI 1

Anthropic Computer Use 4

AutoGPT 9

Lindy AI 4

AgentQL 5

MultiOn 4

Agent Zero 10

API и production-pipeline: кто доступен программно для разработчиков?

Хотите встроить агента в своё приложение, в CI/CD pipeline, в product? Большинство потребительских агентов дают красивый UI — но не API. Кто из 10 сервисов реально доступен программно?

Anthropic Computer Use — лучший в категории для разработчиков. REST API через api.anthropic.com, AWS Bedrock, Google Vertex AI. Tools: computer (скриншот + клики), bash, text_editor. Reference Docker image для быстрого старта. Можно строить любого агента с нужными политиками oversight. Стандартное API Anthropic — без дополнительной платы за computer-use features поверх токенов.

AgentQL — второй по API-friendly. REST API + Python SDK (pip install agentql) + JavaScript/TypeScript SDK + Chrome Extension для разработки. GraphQL-подобный синтаксис делает запросы версионируемыми и читаемыми в коде. Идеально встраивается в существующие Playwright-пайплайны.

MultiOn — Python SDK (pip install multion), REST API, JS SDK. Managed browser означает, что инфраструктуры не нужно — просто вызываешь API. Для задач типа «для каждого из 1000 URL выполни это действие» — рабочий вариант.

AutoGPT как Python-библиотека встраивается в собственные пайплайны. Agent Zero аналогично — self-hosted, конфигурируется через Python.

Devin AI имеет ограниченный API для Enterprise; Slack-интеграция позволяет программно ставить задачи через webhooks.

Lindy AI поддерживает входящие webhooks и Zapier-интеграцию — это не REST API для разработчика, но позволяет триггерить агентов из внешних систем.

Gemini Deep Research, OpenAI Operator, Manus — нет публичного API. Взаимодействие только через UI. Это принципиальное ограничение для автоматизации.

Оценка по параметру

На практике

Разработчик, который хочет интегрировать browser automation в своё приложение: AgentQL (Playwright-native, structured queries) или MultiOn (managed cloud browser). Хочете полный контроль над агентом и инфраструктурой: Anthropic Computer Use API. Хотите запускать agent через внешние триггеры (Zapier, webhook): Lindy AI.

Gemini Deep Research 1

Manus 1

OpenAI Operator 1

Devin AI 6

Anthropic Computer Use 10

AutoGPT 7

Lindy AI 5

AgentQL 9

MultiOn 8

Agent Zero 7

Доступность из России: кто реально работает без VPN и зарубежных карт?

Большинство ИИ-агентов — американские сервисы, заблокированные для российских IP. Платёж российской картой невозможен. Для аудитории AIRatings это не абстрактный вопрос. Честная картина: кто реально доступен в России?

Ситуация с геоблокировками неоднородна. Три категории сервисов:

Полностью доступны без VPN и ограничений:
Agent Zero и AutoGPT Classic — self-hosted open-source. Устанавливаете локально, никаких серверов нет, никаких проверок IP. Для использования с Cloud LLM (GPT-4o, Claude) нужен API-ключ — их можно получить через посредников или зарубежные карты. При Ollama — $0 и полная автономия.

Частично доступны (VPN решает проблему, оплата — нет):
Manus — сингапурская компания, жёстких US-блокировок может не быть. Статус на 2026-05 требует проверки (данные в dossier не окончательные).
AgentQL — API-сервис, при наличии VPN и зарубежного платёжного средства работает. Российские карты не принимаются.

Заблокированы для RU IP:
OpenAI Operator — ChatGPT геоблокирован в России.
Gemini Deep Research — Google Gemini Advanced недоступен без VPN, оплата Google One российскими картами невозможна с 2022.
Devin AI — американская компания, геоблокировка вероятна.
Lindy AI — американский сервис, статус неизвестен, оплата только Stripe (не российские карты).
Anthropic Computer Use — Anthropic API блокирует RU IP; доступ через AWS Bedrock потенциально возможен при наличии AWS-аккаунта.
MultiOn — американский стартап, вероятно геоблокировка.

Доступность из России без VPN и ограничений (1 = заблокирован, 10 = полностью доступен)

На практике

Из России без VPN и зарубежных карт — только Agent Zero и AutoGPT Classic. С VPN и зарубежной картой — добавляются Manus, AgentQL, MultiOn, и через посредников — остальные. Для корпоративного использования: AWS Bedrock даёт доступ к Anthropic Computer Use при наличии корпоративного AWS-аккаунта.

Gemini Deep Research 2

Manus 6

OpenAI Operator 1

Devin AI 2

Anthropic Computer Use 3

AutoGPT 9

Lindy AI 2

AgentQL 4

MultiOn 3

Agent Zero 9

Скорость выполнения задач: минуты, часы или секунды?

Агент, который делает 5-минутную задачу за 2 часа — не агент, а имитация. Скорость в категории AI agents — не секунды первого токена, а время от промпта до готового результата реальной задачи.

Скорость сильно зависит от типа задачи. Сравниваем яблоки с яблоками.

AgentQL — самый быстрый для web-automation: один запрос к странице занимает сотни миллисекунд (overhead над стандартным Playwright). При 1 000 запросов в день это критичное преимущество.

Lindy AI отвечает на входящие email-триггеры в секунды: письмо пришло — агент обработал — ответ отправлен. Задержка зависит от LLM и загрузки серверов, обычно 5–30 секунд с момента получения письма.

MultiOn: один шаг браузерной задачи занимает 3–15 секунд в зависимости от загрузки серверов и сложности страницы.

Gemini Deep Research: 5–20 минут на типичный запрос среднего объёма (20–50 источников, отчёт в 3 000–8 000 слов). Быстрее, чем ChatGPT Deep Research в среднем по данным пользовательских отзывов.

OpenAI Operator: vision-based подход медленнее Playwright. Задача «забронировать ресторан» — 2–5 минут.

Devin AI: небольшой bug-fix — 10–30 минут; крупная фича — 1–4 часа. Медленнее человека на нетривиальных задачах.

AutoGPT Classic и Agent Zero при Ollama — существенно медленнее cloud-аналогов: каждый шаг ждёт inference локальной модели.

Оценка по параметру

На практике

Нужна быстрая web-автоматизация для большого объёма данных? AgentQL. Нужен быстрый research-отчёт? Gemini Deep Research (5–10 мин). Нужна автоматизация почты без ожидания? Lindy AI (секунды). Готовы ждать часами ради высокого качества кода? Devin.

Gemini Deep Research 6

Manus 5

OpenAI Operator 5

Devin AI 4

Anthropic Computer Use 4

AutoGPT 3

Lindy AI 8

AgentQL 9

MultiOn 7

Agent Zero 3

Sandbox и изоляция: насколько безопасно запускать агента?

Агент, который «выполняет код» — это агент, который выполняет произвольный код где-то. Где именно? На вашем компьютере? На серверах вендора? В изолированном контейнере? Вопрос безопасности здесь — не параноя, а разумная инженерия.

Devin AI — лучшие практики изоляции в категории. Полноценный Linux-контейнер: shell, редактор, браузер — всё изолировано от вашей системы. Enterprise-тариф предлагает on-premise deployment. Код выполняется на инфраструктуре Cognition в изолированном окружении, не на вашем компьютере и не с правами вашей системы.

Agent Zero использует Docker-контейнер: при правильной настройке код выполняется изолированно от хост-системы. Это сопоставимо с Devin по концепции, но требует самостоятельной настройки Docker и ответственности за конфигурацию.

Anthropic Computer Use Anthropic прямо предупреждает в документации: запускайте в изолированной VM или контейнере; не запускайте с root-доступом. Reference Docker image даёт Ubuntu + VNC + Claude. Разработчик сам отвечает за изоляцию — Anthropic предоставляет только API.

OpenAI Operator принципиально не хранит платёжные данные и по дизайну останавливается перед формами оплаты и логинами. Безопасность через design-ограничения, а не sandbox.

Lindy AI выполняет только разрешённые интеграции (Gmail OAuth, HubSpot API) без произвольного кода — это снижает attack surface. Escalation предотвращает непредвиденные действия.

Manus выполняет код на серверах Manus — sandbox есть, но прозрачность конфигурации невысока (startup, не enterprise-уровень прозрачности).

AutoGPT в Classic-версии может выполнять код локально — это наибольший риск: без Docker код выполняется в вашей среде с вашими правами.

Оценка по параметру

На практике

Production-окружение с чувствительными данными: только Devin (sandbox по дизайну) или Anthropic Computer Use (при правильной VM-изоляции разработчиком). Agent Zero с Docker — хорошо для техни-грамотных пользователей. AutoGPT без Docker — риск выполнения кода с правами вашей системы.

Gemini Deep Research 5

Manus 6

OpenAI Operator 6

Devin AI 10

Anthropic Computer Use 8

AutoGPT 6

Lindy AI 7

AgentQL 5

MultiOn 4

Agent Zero 9

Интеграции: с какими инструментами реально работает агент?

Агент работает не в вакууме — он подключается к Gmail, GitHub, HubSpot, Slack, Notion. Глубина и надёжность интеграций часто важнее технических возможностей самого агента. Кто из 10 сервисов реально работает с вашими инструментами?

Lindy AI — лидер по числу и глубине готовых интеграций для бизнес-приложений: Gmail, Outlook, Google Calendar, Outlook Calendar, Zoom, Google Meet, HubSpot, Salesforce, Slack, WhatsApp Business, Notion, Linear, Asana, Zapier, webhooks. Это не «мы поддерживаем API», а нативные двусторонние интеграции с логикой (читает треды, пишет в CRM, отвечает в Slack).

Gemini Deep Research — глубокая интеграция с Google Workspace: Google Search (нативно), Google Docs (экспорт в один клик), Gmail, Sheets, Slides (через Gemini for Workspace). Для пользователей Google-экосистемы — удобнейший workflow.

Devin AI — сильные интеграции с dev-экосистемой: GitHub/GitLab (ветки, коммиты, PR, issues), Slack (ставите задачи прямо из Slack как коллеге), Linear и Jira (в roadmap, статус требует верификации).

AutoGPT через plugin system поддерживает интеграции с Twitter/X, GitHub, поисковыми движками (Google CSE, Bing), S3-совместимыми хранилищами, Pinecone, Redis. Более чем достаточно для технических задач.

AgentQL — нативная интеграция с Playwright (основной workflow), REST API, JS/TypeScript SDK, Chrome Extension. Всё необходимое для dev-workflow.

Manus работает через веб-UI и создаёт файлы для скачивания. Интеграции с бизнес-приложениями отсутствуют.

Оценка по параметру

На практике

Нужна экосистема бизнес-приложений (Gmail, CRM, Slack): Lindy AI. Нужна глубокая интеграция с Google Workspace: Gemini Deep Research. Нужна интеграция с GitHub и Slack для командной разработки: Devin AI. Нужна web-automation в Playwright-пайплайне: AgentQL.

Gemini Deep Research 8

Manus 5

OpenAI Operator 6

Devin AI 8

Anthropic Computer Use 6

AutoGPT 7

Lindy AI 9

AgentQL 7

MultiOn 6

Agent Zero 5

Безопасность данных: куда уходит ваша информация?

Агент читает вашу почту. Видит файлы. Выполняет задачи с вашими учётными данными. Это требует ответа на неудобный вопрос: куда уходят данные, кто их хранит и используются ли они для дообучения моделей?

Gemini Deep Research — наилучшее compliance в категории. Google Workspace имеет ISO 27001, SOC 2 Type II, GDPR. Для Gemini Advanced — по умолчанию Google не использует разговоры для обучения основных моделей. Хранение истории настраивается. Для Enterprise — data residency options.

Agent Zero при Ollama — максимальная приватность: никаких данных на внешних серверах. При Cloud API (Claude, GPT) данные идут в Anthropic/OpenAI по их стандартным политикам. Код агента полностью открыт — можно аудировать каждую строку.

Anthropic Computer Use использует API Anthropic: SOC 2 Type 2. По умолчанию данные через API не используются для обучения моделей (в отличие от Free-tier Claude.ai). Скриншоты компьютера передаются в API и применяется та же privacy policy.

Devin AI — Enterprise предлагает on-premise deployment (данные остаются на инфраструктуре клиента), SOC 2 заявляется. Для Starter ($500/мес) — данные на серверах Cognition.

AutoGPT Classic — self-hosted: данные идут только в API-провайдеры (OpenAI/Anthropic по их политике). Нет дополнительного слоя сбора.

Lindy AI — серьёзный вопрос: агент имеет доступ к Gmail/Outlook через OAuth и читает корпоративную почту. SOC 2 заявляется для Enterprise, но точный статус certification не верифицирован в dossier. Данные о том, используются ли email-треды для обучения моделей, публично не подтверждены.

Manus — наиболее непрозрачный: privacy policy не изучена полностью, сингапурская компания с китайской командой. Для корпоративных данных — риск.

Оценка по параметру

На практике

Данные корпоративной почты, юридические документы, финансовые данные: только Devin Enterprise (on-prem) или Agent Zero (self-hosted, Ollama). Исследовательские задачи на открытых данных: любой сервис. Lindy AI с доступом к корпоративной почте: убедитесь в наличии корпоративного контракта с явными гарантиями data protection.

Gemini Deep Research 9

Manus 3

OpenAI Operator 7

Devin AI 8

Anthropic Computer Use 8

AutoGPT 7

Lindy AI 5

AgentQL 5

MultiOn 4

Agent Zero 8

Финансирование и стабильность: риск закрытия сервиса через год?

ИИ-агенты — одна из наиболее горячих ниш венчурного финансирования 2024–2025. Но за этим кроется огромный разрыв: Google с почти неограниченными ресурсами vs один разработчик в Чехии с 8K GitHub stars. Это имеет значение для бизнеса.

Финансирование и корпоративная устойчивость определяют, будет ли сервис существовать через год. Это особенно важно при интеграции агента в бизнес-процессы: смена инструмента — это время и деньги.

Финансирование и корпоративная устойчивость (1 = высокий риск, 10 = максимальная стабильность)

Три лидера по стабильности: Google, OpenAI, Anthropic — за ними стоят компании с многомиллиардным финансированием и глобальным масштабом. Риск закрытия этих сервисов минимален.

Devin AI ($175M Series B, оценка $2B, Founders Fund) — наиболее финансово устойчивый среди специализированных агентов.

Agent Zero — принципиально другой риск: не «закроется ли стартап», а «продолжит ли Jan Tomíšek заниматься проектом». MIT-лицензия и 8K GitHub stars означают, что даже при заброшенности — сообщество может продолжить развитие.

AgentQL и MultiOn — $2M seed и небольшой стартап соответственно. Наибольший риск закрытия или pivot'а среди коммерческих сервисов.

На практике

Интегрируете агента в критичный бизнес-процесс на 2+ года? Только сервисы с топ-4 по стабильности (Google, OpenAI, Anthropic, Cognition). Эксперимент или прототип: любой сервис подходит. Хотите zero vendor lock-in: Agent Zero (MIT) или AutoGPT (MIT).

Gemini Deep Research 10

Manus 5

OpenAI Operator 9

Devin AI 8

Anthropic Computer Use 9

AutoGPT 6

Lindy AI 5

AgentQL 4

MultiOn 4

Agent Zero 3

Реальные кейсы vs vibe-демо: кто работает в production?

Вирусное демо в Twitter — не доказательство работоспособности. В категории AI agents острее, чем где-либо, стоит проблема «vibe AI»: красивый ролик на cherry-picked задаче vs реальная надёжность в production.

Devin AI — самый показательный случай в категории. Март 2024: вирусное демо «первый AI-разработчик», Forbes, TechCrunch. Июль 2024: пользователь r/MachineLearning публикует детальный разбор «Devin is not what was advertised» — большинство реальных задач Devin проваливает или делает неправильно. Компания Cognition не опровергла, что launch-демо было carefully cherry-picked. Результат: Devin ценен для конкретных задач (CRUD, тесты, рефакторинг), но сильно переоценён для сложных архитектурных решений.

Manus — аналогичная история: март 2025, вирусный запуск, 1 млн запросов на invite за несколько дней. Hacker News, YouTube-ревью: «на произвольных задачах часто зависает, делает лишние шаги, не завершает». «Vibe AI» — точная характеристика.

Gemini Deep Research — один из немногих сервисов с устойчивой репутацией «работает в production». Пользователи Reddit r/Gemini и YouTube регулярно публикуют реальные research-задачи с результатами. Google Workspace пользователи используют его в регулярном рабочем процессе.

Lindy AI — хорошая репутация среди SMB: email automation работает предсказуемо, CRM-заполнение после звонков — надёжно. Негативы: credits расходуются быстрее ожидаемого.

AgentQL — developer community позитивно оценивает: «наконец-то scraper, который не ломается при каждом обновлении сайта». Нишевый, но надёжный.

AutoGPT — историческое значение: первый вирусный autonomous agent (апрель 2023, 170K+ GitHub stars). Репутация сегодня: «работает для простых задач, но устарел по сравнению с коммерческими агентами».

На практике

Перед внедрением любого агента: протестируйте именно вашу задачу, не задачу из демо-видео вендора. Попробуйте 5–10 разных примеров, включая edge cases. Только после этого принимайте решение о subscription.

Gemini Deep Research 9

Manus 4

OpenAI Operator 6

Devin AI 6

Anthropic Computer Use 7

AutoGPT 5

Lindy AI 7

AgentQL 7

MultiOn 5

Agent Zero 5

Кому что брать: адресные рекомендации по профилям пользователей

Финальный вопрос: ваш профиль — ваш сервис. Разработчик, аналитик, предприниматель, ИТ-команда — у каждого своя точка входа. Адресные рекомендации без универсального «лучшего» варианта.

Вы — аналитик, консультант, журналист, студент, исследователь.
Нужен: быстрый глубокий research с источниками, экспорт в документ.
→ Gemini Deep Research ($19.99/мес Google One или бесплатно в рамках существующей подписки). 5–20 минут — отчёт готов. Альтернатива: Manus, если нужно комбинировать research с кодом (но менее надёжно). Для РФ без VPN: AutoGPT или Agent Zero с GPT-4o/Claude через API-ключи.

Вы — предприниматель или менеджер без технического фона.
Нужна: автоматизация email, CRM, встреч без написания кода.
→ Lindy AI (от $49.99/мес). Email-автоматизация, CRM-заполнение, запись встреч — всё в no-code builder с шаблонами. Не подходит для РФ (блокировка, только Stripe-оплата).

Вы — разработчик, которому нужна web-автоматизация или scraping.
Нужен: стабильный web automation без хрупких CSS-селекторов.
→ AgentQL (free tier + pay-per-query) — Playwright-native, anti-fragile.
→ MultiOn (API) — если нужен managed cloud browser.
→ Anthropic Computer Use API — если нужен полный контроль над browser-use.

Вы — технологическая команда, которой нужна автономная разработка кода.
Нужен: агент для тестов, рефакторинга, мелких фич.
→ Devin AI ($500/мес, если бюджет позволяет) — реальная coding среда, Slack-интеграция. Альтернатива при ограниченном бюджете: Anthropic Computer Use API с Claude Sonnet 4.6 (79.6% SWE-bench) — платите только за токены.

Вы — технически грамотный пользователь, которому важна приватность и $0.
Нужен: self-hosted агент с полным контролем.
→ Agent Zero + Ollama (LLaMA 3, Mistral) = $0. Полная приватность, Docker sandbox, рекурсивные sub-агенты. Настройка займёт час.
→ AutoGPT Classic — альтернатива с 170K GitHub stars и большим community (более широкий plugin ecosystem, но менее стабилен).

Вы хотите попробовать browser-agent сегодня, без настройки.
→ OpenAI Operator (если у вас есть ChatGPT Plus/Pro) — забронируйте ресторан за 3 минуты. Только US-сайты и партнёры Operator. Не для РФ.

Оценка по параметру

На практике

Правило выбора: определите одну главную задачу, которую хотите автоматизировать. Проверьте, в какую из пяти подгрупп она попадает (карта в Block 1). Выберите лидера этой подгруппы. Попробуйте именно вашу задачу — не демо-видео вендора, а свой кейс. Только потом платите.

Gemini Deep Research 9

Manus 5

OpenAI Operator 6

Devin AI 7

Anthropic Computer Use 8

AutoGPT 6

Lindy AI 9

AgentQL 7

MultiOn 5

Agent Zero 8

Итоговая таблица оценок

Подтема	AC Anthropic Computer Use	AZ Agent Zero	GD Gemini Deep Research	DA Devin AI	LA Lindy AI	AG AgentQL	AU AutoGPT	MA Manus	OO OpenAI Operator	MU MultiOn
1.Карта подгрупп: что эти 10 сервисов реально делают	7	5	8	9	9	8	5	7	7	6
2.Автономность и контроль: кто запрашивает разрешение, а кто — нет	9	6	8	8	8	7	4	6	7	6
3.Управление браузером: кто реально кликает, а кто только делает вид	8	4	6	4	2	9	5	8	9	7
4.Автономная разработка кода: кто пишет, запускает и чинит?	8	6	2	9	1	3	5	7	2	2
5.Глубокое исследование: кто пишет реальные аналитические отчёты?	3	5	10	2	1	3	5	7	4	2
6.Планирование и декомпозиция задач: кто умеет думать перед действием?	6	6	8	9	8	4	4	7	6	5
7.Self-correction: кто умеет признать ошибку и выбрать другой путь?	7	7	7	9	8	5	3	5	6	5
8.Долгосрочные задачи: работает ли агент часами без вашего участия?	4	7	6	9	10	2	5	8	3	3
9.Автоматизация бизнес-процессов: триггеры, интеграции, фоновая работа	6	4	2	3	10	8	4	5	8	7
10.Качество русского языка: понимание задач и генерация текстов	6	9	5	4	3	3	7	4	3	4
11.Тарифы и стоимость: от $0 до $500/мес — что реально получаете?	5	9	7	2	6	6	8	4	5	5
12.Free-тариф: что реально дают навсегда vs что это «trial»?	4	10	5	1	4	5	9	3	2	4
13.API и production-pipeline: кто доступен программно для разработчиков?	10	7	1	6	5	9	7	1	1	8
14.Доступность из России: кто реально работает без VPN и зарубежных карт?	3	9	2	2	2	4	9	6	1	3
15.Скорость выполнения задач: минуты, часы или секунды?	4	3	6	4	8	9	3	5	5	7
16.Sandbox и изоляция: насколько безопасно запускать агента?	8	9	5	10	7	5	6	6	6	4
17.Интеграции: с какими инструментами реально работает агент?	6	5	8	8	9	7	7	5	6	6
18.Безопасность данных: куда уходит ваша информация?	8	8	9	8	5	5	7	3	7	4
19.Финансирование и стабильность: риск закрытия сервиса через год?	9	3	10	8	5	4	6	5	9	4
20.Реальные кейсы vs vibe-демо: кто работает в production?	7	5	9	6	7	7	5	4	6	5
21.Кому что брать: адресные рекомендации по профилям пользователей	8	8	9	7	9	7	6	5	6	5
Итого (средняя)	6,5	6,4	6,3	6,1	6,0	5,7	5,7	5,3	5,2	4,9

Методика: каждая подтема оценивалась по шкале 1–10. Итоговая средняя — арифметическое всех подтем.

Финальный вердикт

Короткие итоги по каждому сервису — чтобы не перечитывать весь обзор.

Gemini Deep Research

8,0 / 10

Лучший deep research агент в категории: нативный Google Search, редактируемый план, экспорт в Google Docs за один клик. Идеален для аналитиков, журналистов, студентов внутри Google Workspace. Ограничения: нет API, только английские источники хорошего качества, геоблокировка для РФ.

Попробовать Gemini Deep Research

Manus

5,0 / 10

Амбициозный multi-agent с браузером, кодом и файлами — в теории. На практике: вирусный запуск марта 2025 не подтверждён стабильным production-качеством. Подходит для экспериментов на нетривиальных задачах «research + код», но не для production-автоматизации.

Попробовать Manus

OpenAI Operator

6,0 / 10

Хорошо для того, для чего создан: бронирование и заказы на trusted US-сайтах (DoorDash, OpenTable, Instacart). Специализированная CUA-модель, хорошие safety-практики. Вне партнёрских сайтов — ненадёжен. Недоступен в РФ. Нет API.

Попробовать OpenAI Operator

Devin AI

7,0 / 10

Единственный в обзоре настоящий coding agent с полноценным Linux-окружением, GitHub-интеграцией и Slack. Работает на конкретных задачах: тесты, рефакторинг, CRUD-фичи. Дорого ($500/мес), переоценён для сложных архитектурных задач. Claude Code или Cursor дешевле для большинства кейсов.

Попробовать Devin AI

Anthropic Computer Use

8,0 / 10

Лучший developer API для computer-use в категории. Примитивы (bash, text_editor, computer) + Claude Sonnet 4.6 (79.6% SWE-bench) + multi-cloud (Bedrock, Vertex AI) = максимальная гибкость. Не consumer product, но для разработчиков — самый мощный инструмент в списке.

Попробовать Anthropic Computer Use

AutoGPT

5,0 / 10

Исторический пионер категории (апрель 2023, 170K+ GitHub stars), но устарел по сравнению с коммерческими агентами. Classic-версия нестабильна, Platform в beta. Бесплатен и self-hosted — хорош для обучения и простых задач. Для production выберите более зрелую альтернативу.

Попробовать AutoGPT

Lindy AI

8,0 / 10

Лучший no-code агент для бизнес-автоматизации: email, CRM, встречи. 40+ интеграций, сотни шаблонов, escalation-логика. Идеален для нетехнических предпринимателей и SMB. Не для РФ (блокировка + Stripe). Нет API для разработчиков.

Попробовать Lindy AI

AgentQL

7,0 / 10

Лучший инструмент для стабильного web scraping поверх Playwright. Структурированный query language делает код версионируемым, anti-fragile к изменениям HTML. Узкая ниша, но в этой нише — лидер. Для Playwright-разработчиков: обязателен к тестированию.

Попробовать AgentQL

MultiOn

5,0 / 10

Простой API для browser-automation без собственной инфраструктуры. Хорош для прототипирования и небольших объёмов. Ограничения: небольшой стартап с риском нестабильности, ненадёжен на сложных сайтах, pricing непрозрачен. Рассмотрите AgentQL или Anthropic CU как альтернативы.

Попробовать MultiOn

Agent Zero

7,0 / 10

Лучший выбор для технически грамотных пользователей, которым нужен полностью бесплатный self-hosted агент с приватностью. Рекурсивные sub-агенты, персистентная memory, Docker sandbox. С Ollama — $0 и нулевая зависимость от внешних сервисов. Риск: один разработчик.

Попробовать Agent Zero