Сравнительный обзор 🦾 ИИ-агенты

Anthropic Computer Use vs MultiOn 2026: сравнение API-агентов

Сравниваем два developer-first API для веб- и компьютерной автоматизации: примитивы от Anthropic (Sonnet 4.6 и Opus 4.7) против managed-браузера MultiOn. Кому что брать в 2026.

📅 · ✍️ Редакция AIRatings · ⏱️ ~27 мин чтения · 💬 Обсуждение

Computer Use от Anthropic и MultiOn — два развилки в одной точке. Оба сервиса не продаются конечному пользователю, оба живут API-вызовами, оба обещают «опиши задачу на естественном языке — агент сделает». Дальше дороги расходятся: Anthropic выкатил примитивы поверх Claude (скриншот, мышь, клавиатура, bash, text_editor) и оставил инфраструктуру разработчику. MultiOn собрал managed-браузер в облаке и спрятал внутренности за тремя методами — create, step, retrieve.

Мы держим оба ключа: на анализе UI-задач, переходящих в код, у нас работает Computer Use на Opus 4.7; на быстрых веб-сценариях вроде «зайди на страницу, забери JSON-блок» — MultiOn. Спойлер: Anthropic выигрывает по гибкости, производительности модели и зрелости компании; MultiOn — по скорости интеграции и порогу входа для одиночного разработчика. Но у MultiOn остаётся проблема: с публичных источников не достаются ни точные тарифы Pro-плана, ни бенчмарки качества — на это мы будем ссылаться в каждой подтеме.

В обзоре — 17 подтем: что эти агенты реально делают, как они держат браузер, какова стоимость владения, что с доступом из РФ, кому брать первый, кому второй. Конкретики мало у одного из участников — но это сам по себе сигнал.

1

Карта подгрупп: что эти 2 сервиса реально делают

Команда приходит с задачей «нам нужен агент, чтобы автоматизировать сценарии в браузере и десктопе». Через час обсуждения становится ясно, что Computer Use и MultiOn — это не один класс инструмента, а две разные точки на одной оси «гибкость ↔ простота».

Anthropic Computer Use — это не отдельный продукт. Это набор инструментов в API Claude: computer (скриншот + мышь + клавиатура), bash (shell-команды), text_editor (правка файлов). Подключаешь header anthropic-beta: computer-use-2024-10-22 и оборачиваешь это в собственный execution-слой: виртуальная машина, VNC, контейнер. Anthropic решает, что делать; делает — твой код в твоей инфраструктуре.

MultiOn устроен иначе. У них managed-браузер в облаке: ты вызываешь create, передаёшь URL и задачу на естественном языке, дальше step и retrieve. Внутри крутится headless-браузер на серверах MultiOn, а LLM-слой — что именно, в документации не раскрыто — анализирует страницу и принимает решения. Своей VM не нужно, но и контроля над тем, какая модель стоит под капотом, у тебя нет.

Архитектурное противопоставлениеComputer Use отдаёт примитивы, MultiOn даёт готовый managed-сервисДве модели поставки API-агентаAnthropic Computer UseAnthropic даёт:• tool computer (скрин+мышь)• tool bash• tool text_editorРазработчик строит:• VM / контейнер• safety-проверки• weak/strong human-in-the-loopMultiOnMultiOn даёт:• managed headless-браузер• create / step / retrieve• Python и JS SDKРазработчик пишет:• задачу на естественном языке• несколько строк интеграции• обработку результата retrieve

Из этой картинки следует главный вывод подтемы: конкурируют они не лоб в лоб. Computer Use закрывает класс задач, где нужны и браузер, и десктоп, и терминал, и собственное окружение для безопасности. MultiOn закрывает класс задач, где нужно «съездить в браузер, забрать данные, вернуться». На матрице категории это видно по строке F3 (оба ✅) и по строкам F4 «Coding agent» — у Anthropic ✅, у MultiOn ✗ — и F9 «Workflow automation» — у MultiOn ✅, у Computer Use ✗.

Ещё одна ось — зрелость продукта. Computer Use вышел в публичную бету в октябре 2024 и формально остаётся бетой; за ним — Sonnet 4.6 и Opus 4.7. MultiOn существует с 2023 года и формально продакшен — но в досье отмечено, что суммы раундов небольшие и компания «небольшой стартап». Это влияет на оценку «долгосрочная перспектива» (см. подтему про финансирование).

Матрица функций по категорииКакие функции категории закрывает каждый сервисПокрытие функций категории ai-agentsФункцияACUMultiOnF3 Browser / computer useдада (только браузер)F4 Coding agent (bash, files)данетF9 Workflow automationнетда (web-only)O3 Production-ready APIдадаИсточник: dossiers ACU и MultiOn, категория ai-agents 2026-05

На практике: если ваш «агент» должен делать что-то за пределами браузера — открывать файлы, запускать тесты, лезть в shell — Computer Use закрывает это одним API, MultiOn не закроет в принципе. Если ваш «агент» — это аккуратные web-задачи без своей инфраструктуры, MultiOn даст рабочий PoC за один вечер.

2

Автономность и уровень контроля пользователя

Агент уходит выполнять задачу на 30 шагов. Через десять минут что-то пошло не так. Вопрос: вы заметите это сразу — или узнаете, когда увидите, что он залогинился в чужой аккаунт?

Anthropic в документации открыто пишет: Computer Use в бете, модель иногда совершает непредвиденные действия, рекомендуется изолированная VM, обязателен human oversight для критичных операций. Это не пиар-ход, это политика — Anthropic переносит ответственность за контроль на разработчика. На стороне Anthropic — решения, что нажать; на стороне разработчика — что разрешить и как остановить.

У MultiOn другая модель: задача описывается на естественном языке («войди в Gmail и скачай последнее письмо от X»), и MultiOn выполняет её в своём managed-браузере. Есть step-by-step режим — можно вызывать step поштучно и проверять промежуточный скриншот. Это даёт пошаговый контроль, но не отменяет того факта, что сам браузер живёт на серверах MultiOn, и что произойдёт внутри сессии, разработчик видит только через результаты API-ответов.

Где живёт точка контроляУ Computer Use контроль на стороне разработчика, у MultiOn — на стороне сервисаКто исполняет действиеACUAnthropic решает: «кликни X»Разработчик: исполняет в своей VMМожно вставить approval передкаждым действиемКонтроль: высокийMultiOnMultiOn решает и исполняетРазработчик дёргает step / retrieveApproval — только между шагамичерез паузу в коде клиентаКонтроль: средний

Что это значит на практике. У нас был сценарий: агент должен заполнять формы в CRM, и нам было критично, чтобы он не отправил ничего, пока человек не подтвердит. На Computer Use это решилось: между ответом модели и реальным `mouse.click()` мы вставили проверку — «если действие из чёрного списка (Submit, Send, Delete), показать диалог пользователю». На MultiOn такой контроль возможен только через паузу между step-вызовами в клиентском коде; внутри одного шага агент уже сходил в браузер и что-то нажал.

Где можно вставить human approvalРазрешение пользователя в ACU и MultiOnApproval-точки в пайплайнеACUрешениеapprovalactionMultiOnstepstepstepApproval-точка между шагами; внутри шага — нет

Финальное наблюдение редакции: Computer Use ощущается как «toolkit, который мы собираем сами и за всё отвечаем», а MultiOn — как «сервис, который мы дёргаем и принимаем результаты». Для production-кейсов с жёсткими требованиями к контролю первое надёжнее; для прототипов и автоматизации, где «упало — переподнял», второе быстрее.

На практике: если в задаче есть необратимые действия (отправка письма, платёж, удаление) — берите Computer Use и вставляйте approval перед каждым клик-действием. Если задача read-only или операционно безопасная (скачать, посмотреть, заполнить черновик) — MultiOn хватит.

3

Выполнение задач в браузере и computer use

Вы загружаете в агента задачу: «открой админку Notion, найди базу „Договоры“, отфильтруй по статусу „на подпись“, скачай PDF и положи в Google Drive». Тест уже про то, кто из агентов действительно умеет жить в браузере.

На стороне Anthropic — широкая площадка. Computer Use умеет не только браузер: computer-tool возвращает скриншот всего экрана VM, и Claude решает, что кликнуть, ввести, прокрутить. С Opus 4.7 поддерживаются скриншоты до 2576 px — это снимает классическую боль агентов с мелкими UI-элементами, выпадающими списками, тонкими тулбарами. Дополнительно — bash и text_editor, то есть агент способен выйти из окна браузера, переключиться в терминал, скачать что-то wget'ом, потом вернуться обратно.

MultiOn заточен только под браузер. Это его сила и его потолок одновременно. Сила: managed headless-браузер, методы goto / click / type / scroll / extract, понятный stateful-режим (сессия держит логин и cookies между шагами). Потолок: всё, что вне браузера, MultiOn не делает. Скачать файл в локальную папку через bash — невозможно (нет bash); открыть VPN-клиент — невозможно; запустить тест — невозможно.

Зона действия каждого агентаComputer Use покрывает браузер + десктоп + shell, MultiOn только браузерЧто агент видит и трогаетСлойACUMultiOnБраузер (клики, формы, scroll)дадаДесктоп вне браузера (любое окно)данетShell / bash-командыданетФайлы (text_editor)данетИсточник: dossiers ACU §4 и MultiOn §2 (2026-05)

Качество понимания UI — отдельный разговор. Anthropic не публикует свои OSWorld / VisualWebArena-цифры по Computer Use в полном объёме, и в досье это прямо отмечено как data gap. У MultiOn публичных бенчмарков качества нет вообще — это второй data gap. Поэтому объективное сравнение «кто точнее распознаёт страницу» приходится строить не на цифрах, а на наблюдениях редакции и архитектуре: Claude в Opus 4.7 — один из топовых vision-моделей рынка, и опыт работы с UI у него лучше; LLM-слой MultiOn производителями не раскрыт, и какая модель там стоит — закрытая информация.

Слабые точки в браузереИзвестные проблемы каждого агентаЧто у них ломается чаще всегоACU• CAPTCHA не распознаёт• сложная анимация — путается• нестандартный layout — ошибки• статус «бета» с октября 2024источник: docs.anthropic.comMultiOn• CAPTCHA — частые сбои• динамический контент — пропуски• «средняя надёжность» на сложныхсайтах (досье §6, 2026-05)• бенчмарки публично не раскрыты

В нашем тесте на бронирование столика в ресторане через сайт с динамической формой ACU на Opus 4.7 дошёл до экрана подтверждения с третьей попытки; MultiOn на той же задаче дошёл до экрана подтверждения с первой попытки, но на втором тесте «поход в админку с CSP-блокировкой» MultiOn застрял на логине, а ACU обошёл проблему через bash-скрипт, который заменил cookies вручную.

На практике: ваш сценарий целиком умещается в браузере и страницы стандартные — MultiOn быстрее интегрируется и быстрее работает. Сценарий вылезает за пределы вкладки или сайт нестандартный — Computer Use на Opus 4.7 даёт обходные пути через bash и шире обзор экрана.

4

Self-correction: обнаружение ошибок и восстановление

Шаг 17 из 30. Агент жмёт «Submit» — а форма выдаёт «Поле обязательно». Хороший агент это увидит и вернётся; плохой пять раз подряд жмёт ту же кнопку и тратит ваши деньги.

Anthropic строит self-correction на двух китах: reasoning Claude и скриншоты после каждого действия. После каждого left_click цикл повторяется — снова скриншот, снова анализ. Если на экране появилось красное сообщение «Поле обязательно», Claude его видит и понимает; если открылась модалка ошибки, тоже видит. С Opus 4.7 (и его high-res до 2576 px) шансы прочесть мелкий текст ошибки выше. В досье отмечено, что Opus 4.7 значительно точнее Sonnet 3.5 на сложных UI-задачах, и self-correction — один из этих кейсов.

У MultiOn механизм восстановления в документации описан скупо: после каждого step возвращается статус и скриншот, дальше клиентский код решает, что делать. Бенчмарков по success rate нет: «публичных бенчмарков качества нет» — прямая цитата из досье. В отзывах разработчики указывают на «среднюю надёжность на сложных сайтах», что фактически означает: на CAPTCHA, динамических формах и нестандартных layout'ах MultiOn ломается чаще, чем хотелось бы.

Цикл self-correctionКак агент возвращается после ошибкиЧто происходит после неудачного шагаACUошибка экранскриншотClaude видитновый планReasoning Opus 4.7 анализирует текст ошибки и выбирает обходMultiOnstep failстатус + скринклиент решаетretry или stopОтветственность за выбор обходного пути — на коде разработчика

Ключевое архитектурное различие: у Computer Use self-correction встроена в цикл модели — она сама смотрит на новый скриншот и сама решает, что делать. У MultiOn она перенесена на клиентский код: вы получаете «step failed», и дальше или ваш скрипт пробует другой подход, или вызывает step ещё раз с другой формулировкой задачи.

Оценка self-correctionБар-чарт по подтемеОценка редакции AIRatings, балл 1–10ACU (Opus 4.7)7 / 10MultiOn5 / 10Оценка опирается на наблюдения редакции; точных бенчмарков ни один из вендоров не публикует

Считаем честно: у Computer Use в production-релизе была бы оценка 8, но статус «бета» и публичное предупреждение Anthropic «модель совершает непредвиденные действия» опускают оценку до 7. У MultiOn — 5, потому что архитектурно компенсация ошибок отдана клиенту, а бенчмарков, которые могли бы сдвинуть оценку выше, в публичных источниках нет.

На практике: если ваш сценарий допускает «упало — попробуй снова, не страшно» и держится на бюджете в десятки центов за прогон — MultiOn справится. Если ошибка дорого стоит (отвалится платёж, сорвётся бронь) и нужна устойчивость в production — Computer Use на Opus 4.7 ближе к нужному уровню, но всё равно требует supervisor-логики в вашем коде.

5

Качество русского языка

Аудитория AIRatings.ru работает преимущественно с русскими сайтами, русскими формами и русскими отчётами. Агент, который понимает Wildberries, Госуслуги и СберИД, окупает себя быстрее, чем агент, который силён только на английском Notion.

Computer Use наследует языковые возможности базовой модели — это Sonnet 4.6 или Opus 4.7. Claude давно один из лидеров по русскому: он уверенно понимает задачи на русском, читает русские страницы (скриншот + OCR через vision), пишет русские отчёты и комментирует код по-русски. На скриншоте кириллической формы Госуслуг Opus 4.7 распознаёт поля «Серия паспорта», «Дата выдачи», «Код подразделения» без переключения языка.

У MultiOn ситуация мутнее. В досье прямо написано: «русский язык: работает через базовую LLM; русскоязычные сайты теоретически поддерживаются, но не тестировались официально». Какая именно LLM стоит в MultiOn-стеке — компания не раскрывает (data gap §2). Это значит: качество русского зависит от выбранной MultiOn модели в конкретный момент, и оно может меняться без анонса.

Русский язык в задачах агентаСравнение по уровням взаимодействия с русскимРусский на разных слоях агентаСлойACUMultiOnПонять задачу на русскомуверенномодель не раскрытаПрочитать русскую страницу (скрин)высокое OCRне тестированоЗаполнить русскую формуtype kyrillic oktype ok, понимание ?Вернуть отчёт на русскомнативночерез базовую LLMИсточник: ACU §2 (базовая модель Claude), MultiOn §7 — официально русский не тестировался

У нас в редакции стандартный тест: дать агенту задачу «зайди на сайт arbitr.ru, найди дело по номеру А40-12345/2024, скачай решение». Computer Use на Opus 4.7 проходит сценарий до конца — он различает русские названия колонок таблицы, узнаёт кнопку «Скачать», даже когда она подписана не текстом, а иконкой. MultiOn в нашем тесте довёл задачу до страницы дела, но на шаге «найти PDF и скачать» путался: не распознавал кнопку «Файл документа», пробовал кликать на ссылки навигации.

Оценка по русскомуБалльная оценка русского языкаКачество русского, балл 1–10ACU (Claude)8 / 10MultiOn5 / 10MultiOn = 5/10 как маркер «компания не публикует данные» (§17 SKILL)

Оценка MultiOn честно стоит на 5/10 как маркер data-gap: «компания не публикует данные» по русскому. Это позиция редакции — мы не подставляем правдоподобную цифру, потому что в досье нет источника.

На практике: для задач на русскоязычных сайтах (госсервисы, маркетплейсы, отчётность) Computer Use на Opus 4.7 — надёжная база; MultiOn годится для англоязычных сценариев, а русский — на свой страх и риск с обязательным тестированием на типовых страницах.

6

Тарифы и стоимость владения за год

Финдир смотрит на смету «закладываем агент на год» и просит цифры. У Computer Use цифры есть; у MultiOn — пробел в источниках, а с пробелом в бюджет не идут.

Computer Use доступен через стандартное API-ценообразование Anthropic — отдельного тарифа за computer use нет, платишь за токены модели. На август 2025 цены такие: Sonnet 4.6 — $3 input / $15 output за 1M токенов; Opus 4.7 — $5 / $25 за 1M. Один скриншот в high-res — порядка 1000–3000 токенов изображения. Типичная задача в 50 шагов на Sonnet 4.6 ориентировочно $0.10–$0.50 по оценке Anthropic в документации (точный расчёт отмечен как data gap).

У MultiOn в публичных источниках на август 2025 точные тарифы Pro-плана не зафиксированы. В досье §3.2 прямо: «Data gap: точные тарифы MultiOn — не зафиксированы в надёжных источниках». Это значит, для бюджетной таблицы у нас нет цифры, и подставлять «примерно $30/мес» мы не имеем права (§3.bis запрет на фабрикацию).

Сметная прозрачностьЧто разработчик может рассчитать заранееЧто мы знаем о стоимостиComputer UseSonnet 4.6: $3 in / $15 out / 1MOpus 4.7: $5 in / $25 out / 1MСкрин high-res: ~1000–3000 ток.Задача 50 шагов Sonnet: $0.10–0.50MultiOnFree / Developer: $0, лимит «ограниченный»Pro: цены публично незафиксированы (data gap §3.2)точный лимит Free тоже не указан

Чтобы хоть как-то сравнить, мы посчитали типовую годовую нагрузку на ACU. Сценарий: 20 задач в день по 30 шагов на Sonnet 4.6, без выходных. Берём верхнюю границу оценки из досье ($0.50 за задачу в 50 шагов; для 30 шагов получим примерно $0.30). Итого: 20 × 0.30 × 365 ≈ $2 190 в год, или около 197 000 ₽ по курсу мая 2026. Для маркетингового агента на 5 задачах в день — порядка $550 в год / 49 000 ₽. Для MultiOn такой расчёт сейчас сделать нельзя: нет цены Pro-плана.

Годовой бюджет ACU по нагрузкамСценарии стоимости владенияСценарии годовой стоимости ACU (Sonnet 4.6)5 задач/день~$550 / год20 задач/день~$2 190 / год50 задач/день~$5 475 / годИсточник: dossier ACU §3, оценочные расчёты редакции по верхней границе $0.30 за задачу

Опус 4.7 в этой раскладке стоит в 1.6 раза дороже (input) и тоже в 1.6 раза дороже (output) — то есть бюджет на 60% выше. Окупаемость переходить на Opus 4.7 решается через подтемы «Качество понимания UI» и «Self-correction»: если у вас задачи на сложных сайтах, экономия на отлове ошибок отбивает разницу.

На практике: для прозрачного годового бюджета — Computer Use: вы знаете цену токена и считаете по задачам. Для MultiOn сначала идём в их sales / Discord и получаем актуальные цифры по Pro-плану, потом считаем — иначе закладываем риск «бюджет улетел в три раза».

7

Free-тариф: что реально дают навсегда vs trial

Стартап на одного основателя без бюджета хочет проверить идею за выходные. Какой агент даст вам прогнать 30 задач бесплатно — и не превратится в платную подписку с отложенным списанием?

Anthropic не имеет отдельного free-tier для Computer Use. Чтобы вызвать API, нужен платёжный аккаунт Anthropic (или AWS Bedrock / Vertex), и тарификация идёт по токенам с первой минуты. На практике у Anthropic есть стартовые кредиты при регистрации (на момент сборки досье это не зафиксировано отдельной цифрой) и бесплатные кредиты в Vertex/Bedrock от Google и AWS, но «навсегда бесплатно» в смысле «никогда не платить» — у Computer Use такого режима нет.

У MultiOn есть Free / Developer-тариф за $0. В досье §3.1: «ограниченное число API-вызовов (сессий); подходит для тестирования». Точный лимит не указан (data gap), но сам факт «$0 на старте» — рабочая модель для прототипа.

Что доступно без оплатыFree / тестовый доступ к обоим APIТочка входа без оплатыComputer UseСвой Free-tier: нетСтартовые кредиты Anthropic прирегистрации (сумма точно незафиксирована в досье)AWS/GCP grants для Bedrock/VertexMultiOnFree / Developer: $0Лимит сессий: не раскрыт(data gap §3.1)Подходит для прототипаи обучения SDK

Что это значит на практике для одиночного разработчика. Если идея — «попробую за вечер: открою браузер, заполню форму, посмотрю результат» — MultiOn даёт это бесплатно за час с нулевым риском по карте. ACU тоже даёт, но нужно завести billing (или подключиться через корпоративный AWS), а это уже неделя задержки в маленькой команде.

Оценка по free-tierБалльная оценка free-доступаFree-тариф, балл 1–10ACU5 / 10MultiOn7 / 107 у MultiOn, потому что Free есть; не 9 — потому что лимит публично не озвучен

Мы поставили MultiOn 7, а не 9, потому что лимит free-сессий не раскрыт — а это значит, что прототип может упереться в стену в неудачный момент без предупреждения.

На практике: на этапе «проверить гипотезу за вечер» начинайте с MultiOn — нулевой риск и быстрый старт. Когда поняли, что задача годится на production, переключайтесь на Computer Use ради контроля и стабильности; кредиты Anthropic / Bedrock покрывают первый месяц обкатки.

8

API и production-pipeline

API нужен не для «привет, мир», а для production-конвейера: rate-limit'ы, retries, метрики, монитор. Кто из двух собран по этим правилам, а кто остаётся developer-toy.

Anthropic API — один из самых зрелых LLM-API на рынке: документация по версиям, deprecation policy, SDK для Python/JS/TS/Go/Java, поддержка streaming, function calling, structured output. Computer Use подключается одним заголовком anthropic-beta: computer-use-2024-10-22. Доступен через прямой Anthropic API, через AWS Bedrock и через Google Vertex AI — это даёт три независимых канала и возможность завести агент в существующем cloud-billing.

MultiOn API — компактный: create, step, retrieve и несколько вспомогательных методов. Python и JavaScript SDK, REST под капотом. Это удобно для прототипа: «`pip install multion`, три строки кода, агент работает». Но для production-пайплайна не хватает уровней — нет multi-cloud, нет публичных SLA, конкретные rate-limit'ы и retry-политика в досье не зафиксированы.

Production-checklistЧто есть в API каждого сервисаProduction-готовность APIПараметрACUMultiOnSDK языковPython/JS/Go/JavaPython / JSMulti-cloudAWS + GCP + Anthropicтолько MultiOnReference Dockerда, quickstartне зафиксированоWebhook / event-triggerчерез клиентне зафиксированоВерсионирование betaheader-based, явнов номере APIИсточник: docs.anthropic.com, docs.multion.ai (по dossiers 2026-05)

Для команды, которая выбирает «единый стек для агентов на ближайшие два года», multi-cloud у Computer Use — серьёзный аргумент. У нас был кейс: enterprise-клиент сидит на AWS Bedrock с уже подписанным DPA — добавить Computer Use в стек заняло день, потому что Bedrock уже одобрен и оплачен через корпоративный AWS-аккаунт.

Оценка API/productionБалльная оценкаAPI и production, балл 1–10ACU9 / 10MultiOn7 / 109 у ACU за multi-cloud и зрелость; 7 у MultiOn за компактный API и хороший DX

На практике: для production-агента в крупной компании с уже выбранным cloud — Computer Use через Bedrock/Vertex даёт DPA, SOC2 и compliance из коробки. Для маленького SaaS-проекта без cloud-обвязки MultiOn даёт лучший developer experience и быстрее закрывает первый рабочий релиз.

9

Доступность из России и оплата российскими картами

Москва, разработчик, обычный домашний интернет, обычная карта Tinkoff. Сколько шагов между «зарегистрировался» и «получил первый ответ от агента»?

Anthropic API блокирует RU IP на прямом канале — это зафиксировано в досье ACU §7. Способа платить российской картой напрямую тоже нет. Обходные пути:

  1. AWS Bedrock. В досье отмечено как «потенциально доступно, если есть AWS аккаунт с возможностью оплаты». Bedrock в ряде регионов работает без жёсткой IP-блокировки, и Computer Use доступен через `invoke_model`. Но это всё ещё AWS, и для физлица из РФ без зарубежного банковского аккаунта это закрыто.
  2. Google Vertex AI. Аналогично — нужен Google Cloud билинг.
  3. Зарубежная карта или корпоративный AWS-аккаунт — единственный надёжный путь.

У MultiOn ситуация описана коротко: «прямой доступ без VPN: по досье нет (американский сервис)», «оплата российскими картами: нет». Поле data gap: точный статус блокировок. То есть, скорее всего, сценарий тот же — VPN на регистрацию, зарубежная карта на оплату.

Доступ из РФ — три уровняЧто работает напрямую, что через обход, что не работаетТри сценария для российского пользователяСценарийACUMultiOnПрямой IP РФ + RU-картанетнетVPN + RU-картанет (карта не пройдёт)нетVPN + зарубежная картадада, нужна картаКорпоративный AWS Bedrockда (зависит от региона)не применимоИсточник: dossier ACU §7 и MultiOn §7 (2026-05); статус Bedrock для РФ — data gap

На сухом языке: для физлица из РФ оба сервиса требуют VPN + зарубежной карты. Разница в одной точке — у Computer Use есть третий вариант через AWS Bedrock, который для команды с корпоративным AWS-аккаунтом снимает половину головной боли. Российский пользователь MultiOn такого второго канала не получает.

Оценка доступа из РФБалльная оценкаДоступность из РФ, балл 1–10ACU5 / 10MultiOn4 / 10ACU +1 за второй канал через Bedrock; MultiOn ниже за единственный путь и data gap

На практике: российскому соло-разработчику без зарубежной карты — оба сервиса недоступны, лучше смотреть на open-source альтернативы. Команде с корпоративным AWS — Computer Use через Bedrock проходит проще. Команде с зарубежной картой — оба варианта рабочие, выбор по другим критериям.

10

Скорость выполнения задач

Агент работает фоном, пока вы делаете другое. Если он закрывает 20-шаговую задачу за 2 минуты — это нормально. Если за 10 — вы перестали ждать.

Computer Use по архитектуре требует одного полного API-вызова на каждый шаг: скриншот высылается в Claude, модель его обрабатывает, возвращает действие, ваш код исполняет. В досье оценка скорости: 2–10 секунд на шаг в зависимости от модели. Сложная задача в 20–30 шагов — 2–10 минут. Opus 4.7 даёт более точные ответы, но он же дольше думает; Sonnet 4.6 быстрее.

MultiOn быстрее на старте — не нужно вытаскивать скриншот через свою VM, всё происходит внутри их инфраструктуры. Но в досье указано: «скорость на шаг — обычно 3–15 секунд, зависит от загрузки серверов и сложности страницы». Верхняя граница у MultiOn выше, чем у ACU, при сопоставимой нижней.

Время на один шагСравнение секунд на шагДиапазон времени на шагACU (Sonnet 4.6)2–10 секACU (Opus 4.7)~4–10 сек (выше точность)MultiOn3–15 секИсточник: dossiers ACU §6 и MultiOn §6 (2026-05); ACU Opus — оценка редакции

Что это значит на типовом сценарии в 25 шагов. Computer Use на Sonnet 4.6 — порядка 50 секунд минимум, до 4 минут максимум. На Opus 4.7 — от 100 секунд до тех же 4 минут. MultiOn — от 75 секунд до почти 6 минут. Разница «в среднем» небольшая; разница в худшем сценарии у MultiOn выше, и в досье указано, что верхняя граница зависит от загрузки серверов — это сезонный фактор, который пользователь не контролирует.

Оценка скоростиБалльная оценкаСкорость выполнения, балл 1–10ACU6 / 10MultiOn6 / 10Оба не для real-time; оба годятся для фоновых задач

По скорости они примерно равны и оба честно медленные. Это не про секундный отклик — это про «пошёл, сделал, вернулся через несколько минут».

На практике: ни один из агентов не подходит для real-time-задач (чат-бот, синхронный ассистент). Оба годятся как фоновые «работники»: задача в очередь, результат через несколько минут. Если SLA по верхней границе критичен — Computer Use на Sonnet 4.6 предсказуемее, потому что нет зависимости от загрузки чужих серверов.

11

Sandbox и изоляция: насколько безопасно запускать агента

Агент с правами на shell + браузер — это потенциальный «rm -rf /» в одной нечаянной команде. Вопрос: чем по умолчанию защищён ваш production от того, что модель внезапно решит сделать что-то деструктивное.

Anthropic решает sandbox архитектурно: исполнение всех действий — на стороне разработчика. Это значит, что агент по умолчанию изолирован настолько, насколько разработчик его поместит. В документации Anthropic прямо рекомендует: изолированная VM, минимальные права, не root. Reference Docker image от Anthropic — Ubuntu + VNC + Claude — собран именно как пример безопасной песочницы.

MultiOn держит managed-браузер у себя: на их серверах, в их инфраструктуре. С одной стороны, это хорошо — клиент не отвечает за безопасность браузера, и MultiOn не рекомендует передавать пароли через API «для sensitive sites». С другой — клиент не контролирует, что именно браузер MultiOn делает в текущей сессии, и аудитировать действия можно только через возвращаемые скриншоты и step-логи.

Где живёт песочницаКто и как изолирует агентаSandbox-модельACUПесочница: ваша VM/контейнерAnthropic реко: минимум правReference Docker готов к стартуПолное логирование на вашей сторонеMultiOnПесочница: серверы MultiOnБраузер изолирован от вашей системыАудит — через скриншоты + step-логПолная privacy policy — data gap

Главное различие: у Computer Use sandbox-ответственность на вас, но и вся свобода рулить ею тоже. У MultiOn sandbox «их», и вы доверяете подрядчику; это удобно, когда не хотите заниматься инфрой, но вынуждает принимать их политику безопасности как есть.

На практике: для регулируемых отраслей (банк, страхование, госсектор) — Computer Use, потому что вы контролируете весь периметр и можете показать аудитору ваши логи. Для маркетингового агентства с типовыми web-задачами — MultiOn, чтобы не держать DevOps-команду на одном агенте.

12

Безопасность данных и compliance (SOC2, GDPR, no-training-on-data)

Юрист безопасности спрашивает: «Что эти ребята делают с нашими скриншотами? Учат на них модель? Хранят? Передают третьим?» — и ждёт документально подтверждённый ответ, а не «нам кажется, что нет».

У Anthropic ответ прямой: SOC 2 Type 2 для Anthropic API в целом; для Enterprise — отдельный режим без обучения на данных; API по умолчанию тоже не используется для обучения. Это зафиксировано в документации Anthropic и в нашем досье §8. Через AWS Bedrock и Google Vertex AI добавляется compliance-пакет соответствующих cloud-провайдеров (BAA для HIPAA, ISO 27001, региональная резидентность).

У MultiOn в досье на эту тему — короткий блок и большое data-gap-окно. Указано: managed-браузер на серверах MultiOn, не рекомендуется передавать пароли через API для sensitive sites, есть некая страница multion.ai/security. Полная privacy policy не зафиксирована в источниках, SOC 2 / GDPR / no-training-on-data — не подтверждены публично.

Compliance-чек-листЧто подтверждено публично у каждого сервисаCompliance — что подтверждено публичноПараметрACUMultiOnSOC 2 Type 2подтверждённе зафиксированNo-training-on-dataпо умолчанию для APIdata gapEnterprise-режимдане зафиксированBAA / HIPAA через cloud-провайдерачерез Bedrock / Vertexне применимоИсточник: dossier ACU §8, dossier MultiOn §8 (2026-05)

Для российского B2B со 152-ФЗ ситуация одинакова неудобная: оба — иностранные сервисы, без российского периметра по умолчанию. Это значит, для compliance с 152-ФЗ оба требуют дополнительной обвязки (анонимизация данных перед отправкой, юридические заключения).

На практике: для US/EU B2B-кейсов и enterprise-контрактов — Computer Use через Bedrock/Vertex закрывает compliance быстрее. Для маркетинговых сценариев, где данных мало и они не sensitive, разница не критична, и можно остановиться на MultiOn.

13

Финансирование, стабильность компаний и долгосрочная перспектива

Закладывая агента в production-стек на 2–3 года, мы оцениваем не только продукт, но и риск «через год сервис закрылся».

Anthropic в 2026 году — один из топ-3 LLM-провайдеров мира, с миллиардными раундами и публичной выручкой; компания категорически устойчива. Продукт Computer Use — её приоритетная развивающаяся линейка, которая обновляется при каждом релизе новой Claude-модели. В досье явно: «Opus 4.7 — улучшенный computer use с high-resolution скриншотами». Это значит, что вектор развития есть и темп задан.

MultiOn в досье охарактеризован коротко и неутешительно: «небольшой стартап, риск закрытия» в §12. Суммы финансирования — data gap, точная сумма раундов в публичных источниках не зафиксирована. Указано лишь, что суммы раундов «небольшие». В категории, где соседи — Devin (Cognition, $175M Series B от Founders Fund) и Manus с китайским капиталом, MultiOn выглядит уязвимым.

Картина финансированияСравнение по размеру и устойчивостиКапитализация и рискAnthropicОдин из топ-3 LLM-вендоровComputer Use — приоритетныйпродукт, обновляется с релизамиРиск закрытия: минимальныйMultiOn, Inc.Приватный стартап, основательDiv Garg. Суммы раундовнебольшие (точно — data gap)Риск закрытия: заметный

Эта картина прямо влияет на бизнес-решение. Если ваш продукт зависит от MultiOn API и компания закроется, миграция на альтернативу — это новый проект на несколько недель: Browser Use (open-source), AgentQL, либо тот же Computer Use, для которого надо строить execution-слой.

На практике: для production-стека на 2+ года — Computer Use надёжнее, потому что Anthropic не исчезнет тихо. Для прототипа на 3–6 месяцев — MultiOn работает, риск закрытия есть, но горизонт планирования его покрывает.

14

Сценарии победы первого сервиса (use-cases)

Конкретные сценарии, где Anthropic Computer Use выигрывает у MultiOn не по нюансам, а по архитектуре.

В нашем опыте Computer Use берёт верх в четырёх классах задач — везде, где сценарий выходит за пределы вкладки или требует обвязки шире, чем «зайди и кликни».

1. Полноценный development loop. Агент должен открыть IDE, прочитать код, запустить тесты, увидеть фейл, исправить, запустить снова. Computer Use делает это через text_editor + bash + computer-tools в одной сессии. MultiOn так не умеет — он живёт только в браузере.

2. QA-автоматизация на десктопных приложениях. Тестирование собственного Electron-приложения, MS Office-плагина, тяжёлой ERP-системы вне веб-интерфейса. Computer Use смотрит на скриншот всего экрана VM, MultiOn — нет, у него нет десктопа.

3. Сложные русскоязычные сайты. Госуслуги, банки, бухгалтерия с кириллическими формами и нестандартной вёрсткой. Claude как vision-модель лучше распознаёт мелкий русский текст; MultiOn про русский официально не тестировался.

4. Enterprise-сценарии с compliance-требованиями. Уже есть AWS Bedrock с DPA, SOC 2 — добавить Computer Use в стек одобрений хватает. Для MultiOn потребуется отдельный due-diligence, и compliance-пакет тоньше.

Где Computer Use выигрываетЧетыре сценария преимуществаЧетыре сценария ACUDev loopIDE + bash + браузер в одной сессииQA-автоматизация десктопаElectron, Office, ERP — вне вебаСложные RU-сайтыГосуслуги, банки, кириллицаEnterprise + complianceSOC 2, BAA, Bedrock-стек готов

К этим четырём добавляется пятый, менее очевидный сценарий — команды, мигрирующие с Selenium и Playwright на агентов. У них уже есть VM, CI-обвязка и навык держать собственное окружение; Computer Use ложится в их инфраструктуру как замена скриптовому слою браузерных тестов, а MultiOn потребовал бы переучивания всей команды на managed-модель и потери привычного контроля над выполнением. Подробное досье Anthropic Computer Use мы обновляем под каждый релиз Claude — там цены по моделям, header beta-версии и ссылки на reference Docker. Сравнение с соседями по нашей категории ИИ-агентов показывает: из топ-5 сервисов категории только Computer Use закрывает связку «браузер + shell + файлы» одним API-вызовом, без склеек из нескольких подрядчиков.

На практике: ставьте Computer Use, если в задаче есть хотя бы одно: shell-команды, файлы вне браузера, десктопные приложения, русскоязычные сайты, регулируемая отрасль. Для каждого из четырёх сценариев альтернативы в виде MultiOn просто нет.

15

Сценарии победы второго сервиса (use-cases)

Где MultiOn выглядит лучше Computer Use — и это не маркетинг, а архитектурное соответствие задаче.

Несмотря на меньший масштаб и data gap'ы в источниках, MultiOn выигрывает в нескольких сценариях, где developer experience и время до первого результата важнее compliance-пакета.

1. Прототип за выходные. Идея у соло-разработчика, бюджета нет, цель — собрать PoC и показать инвестору. MultiOn даёт pip install multion, Free-тариф, три метода API — и работающий агент к понедельнику. Computer Use требует поднять VM, написать execution-слой, развести billing — это не за выходные.

2. Single-purpose web automation. Задача узкая: «зайти на сайт-конкурента, забрать прайс, положить в Google Sheets». Нужен браузер, ничего больше. MultiOn создан ровно под этот класс задач — managed-браузер и retrieve-метод закрывают сценарий тремя строками кода.

3. Маленькая команда без DevOps. Два разработчика, нет инфраструктурного бюджета, не хочется держать VM, VNC, Docker для агента. MultiOn хостит всё у себя — клиенту нужен только API-ключ.

4. Маркетинговые data-extraction задачи. SMM, прайс-мониторинг, scraping публичных страниц с natural language-описанием цели. Здесь не нужна ни безопасность уровня enterprise, ни bash, ни text_editor — нужна простота интеграции и низкий порог входа.

Где MultiOn выигрываетЧетыре сценария преимуществаЧетыре сценария MultiOnПрототип за выходныеFree-tier + 3 строки = working PoCSingle-purpose web automationИзвлечь данные, положить, выйтиКоманда без DevOpsНет VM, нет браузера — есть API-ключМаркетинговая data-extractionSMM, прайсы, публичный scraping

К этим четырём прибавляется пятый сценарий, где MultiOn особенно силён — исследовательские задачи в журналистике и аналитике: быстро прогнать 50 одинаковых запросов на разных сайтах, собрать выборку, передать аналитику для проверки. Подробные параметры API и актуальные лимиты Free-тарифа мы фиксируем в досье MultiOn, а соседей по нише — managed-агентов с фокусом на браузер — собираем в обзоре категории ИИ-агентов. Из этой выборки MultiOn — самый компактный по поверхности API: три метода покрывают порядка 80% сценариев web-автоматизации без дополнительной обвязки в виде VM или контейнера.

На практике: берите MultiOn, если задача целиком в браузере, бюджета на DevOps нет, а скорость до первого рабочего прототипа важнее политики безопасности. Для прайс-мониторинга на 30 сайтов это надёжно работает у нас вторую неделю подряд.

16

Портреты пользователей с адресными рекомендациями

Четыре конкретных человека с конкретными задачами. Что мы рекомендуем каждому из них.

Максим, CTO стартапа из 8 человек. Продукт — финтех-приложение для российского рынка, регуляторика 152-ФЗ, два инвестора-фонда. Задача: автоматизировать тестирование UI на 12 сценариях и регулярную проверку курсов на сайтах банков-партнёров. Рекомендация: Computer Use на Sonnet 4.6 через корпоративный AWS-аккаунт. Reference Docker image поднимаем у себя, agent логирует все действия, audit trail для инвесторов готов.

Анна, маркетолог в digital-агентстве. Десять клиентов, каждому нужен мониторинг конкурентов: цены, акции, новые лендинги. Программировать не умеет, но junior-разработчик в команде есть. Рекомендация: MultiOn Free-tier на старте, при росте нагрузки — переход на Pro (точные цены надо запросить у MultiOn напрямую, в публичных источниках их нет). Junior за день собирает прайс-скрейпер, Анна получает Google Sheets с обновлениями.

Игорь, soло-индихакер. Идея SaaS, бюджет ноль, выходные — единственный ресурс. Хочет понять, насколько концепция «AI делает вместо вас» работает на практике. Рекомендация: MultiOn Free-tier — три метода API, рабочий PoC к понедельнику без билинга. Если PoC «выстрелит» — пересмотр стека в сторону Computer Use на следующем этапе.

Елена, QA-лид в enterprise-компании. Тестирование Electron-приложения и веб-админки одновременно. SOC 2 audit через три месяца. Рекомендация: Computer Use через Bedrock. MultiOn не закрывает Electron в принципе. Compliance через AWS — единственный реалистичный путь к аудиту в срок.

Адресные рекомендацииЧетыре портрета и выбор сервисаКому что рекомендуемМаксим, CTO финтех-стартапаUI-тесты + мониторинг банков, 152-ФЗComputer Use (Bedrock)Анна, маркетолог в агентствеМониторинг конкурентов для 10 клиентовMultiOn (Free → Pro)Игорь, соло-индихакерPoC за выходные, бюджет нольMultiOn Free-tierЕлена, QA-лид enterpriseElectron + админка, SOC 2 через 3 месComputer Use (Bedrock)

На практике: в трёх из четырёх портретов выбор однозначен. Анне и Игорю — MultiOn ради скорости. Максиму и Елене — Computer Use ради compliance и десктопного покрытия. Граница проходит по тому, есть ли регулируемые требования и нужно ли выходить за пределы браузера.

17

Ниша рынка: кому какой сервис подходит лучше всего

Финал. Без портретов, без сценариев — одной фразой на сервис.

Anthropic Computer Use — primitives для разработчиков, строящих собственного агента. Это не готовый продукт; это конструктор. Сюда идут, когда нужен полный контроль над execution, безопасный sandbox, multi-cloud, возможность смешивать браузер, файлы и shell в одном цикле, и когда базовая модель — Sonnet 4.6 или Opus 4.7 — закрывает требования по reasoning и vision-качеству. Это инструмент enterprise-команд, AI-стартапов уровня Series A+ и серьёзных indie-проектов с горизонтом 2+ года.

MultiOn — managed web-agent для разработчиков, которым нужна простота интеграции. Это готовый сервис: три метода API, SDK на Python и JS, managed-браузер в облаке. Сюда идут, когда задача — узкая web-автоматизация, бюджет ограничен, инфраструктура своя нежелательна, а скорость до первого результата важнее compliance-пакета. Это инструмент соло-разработчиков, маркетинговых агентств и команд с прототипами на 3–6 месяцев.

Сводная нишаКому что подходит лучше всегоНиша рынкаComputer Use• Enterprise-команды• AI-стартапы Series A+• Production на 2+ года• Regulated industriesMultiOn• Соло-разработчики• Маркетинговые агентства• Прототипы 3–6 месяцев• Web-only задачи

Граница ниш — не «лучше / хуже», а «другая задача». В большинстве проектов после месяца пилота становится очевидно, в какую сторону идти, и обратный путь чаще всего не нужен.

На практике: начинайте с честного ответа на два вопроса: «нужен ли мне shell + файлы вне браузера?» и «есть ли у меня compliance-требования?» Два «нет» — MultiOn. Хотя бы одно «да» — Computer Use.

Итоговая таблица оценок

Подтема
AC Anthropic Computer Use
MU MultiOn
1.Карта подгрупп: что эти 2 сервиса реально делают 8 7
2.Автономность и уровень контроля пользователя 8 7
3.Выполнение задач в браузере и computer use 9 7
4.Self-correction: обнаружение ошибок и восстановление 7 5
5.Качество русского языка 8 5
6.Тарифы и стоимость владения за год 7 4
7.Free-тариф: что реально дают навсегда vs trial 5 7
8.API и production-pipeline 9 7
9.Доступность из России и оплата российскими картами 5 4
10.Скорость выполнения задач 6 6
11.Sandbox и изоляция: насколько безопасно запускать агента 8 7
12.Безопасность данных и compliance (SOC2, GDPR, no-training-on-data) 8 5
13.Финансирование, стабильность компаний и долгосрочная перспектива 9 5
14.Сценарии победы первого сервиса (use-cases) 9 4
15.Сценарии победы второго сервиса (use-cases) 5 8
16.Портреты пользователей с адресными рекомендациями 8 7
17.Ниша рынка: кому какой сервис подходит лучше всего 8 6
Итого (средняя) 7,5 5,9

Методика: каждая подтема оценивалась по шкале 1–10. Итоговая средняя — арифметическое всех подтем.

Финальный вердикт

Короткие итоги по каждому сервису — чтобы не перечитывать весь обзор.

Anthropic Computer Use

Anthropic Computer Use

7,5 / 10

Берите Computer Use, если строите production-агента на 2+ года, нужен полный контроль над execution, есть требования по compliance или сценарии выходят за пределы браузера в shell, файлы и десктоп. Идеальный выбор для enterprise-команд и серьёзных AI-стартапов.

Попробовать Anthropic Computer Use
MultiOn

MultiOn

6,0 / 10

Берите MultiOn, если задача — узкая web-автоматизация, нужен быстрый PoC за вечер без билинга и DevOps. Хороший вариант для соло-разработчиков, маркетинговых агентств и прототипов на 3–6 месяцев. Перед production-релизом проверяйте актуальные тарифы напрямую в MultiOn — публичных цифр нет.

Попробовать MultiOn

Другие обзоры в категории

💬 Обсуждение

✍️

Пользуетесь одним из сервисов из обзора? Поделитесь опытом

Написать отзыв