Anthropic Computer Use vs MultiOn 2026: сравнение API-агентов
Сравниваем два developer-first API для веб- и компьютерной автоматизации: примитивы от Anthropic (Sonnet 4.6 и Opus 4.7) против managed-браузера MultiOn. Кому что брать в 2026.
Содержание
Computer Use от Anthropic и MultiOn — два развилки в одной точке. Оба сервиса не продаются конечному пользователю, оба живут API-вызовами, оба обещают «опиши задачу на естественном языке — агент сделает». Дальше дороги расходятся: Anthropic выкатил примитивы поверх Claude (скриншот, мышь, клавиатура, bash, text_editor) и оставил инфраструктуру разработчику. MultiOn собрал managed-браузер в облаке и спрятал внутренности за тремя методами — create, step, retrieve.
Мы держим оба ключа: на анализе UI-задач, переходящих в код, у нас работает Computer Use на Opus 4.7; на быстрых веб-сценариях вроде «зайди на страницу, забери JSON-блок» — MultiOn. Спойлер: Anthropic выигрывает по гибкости, производительности модели и зрелости компании; MultiOn — по скорости интеграции и порогу входа для одиночного разработчика. Но у MultiOn остаётся проблема: с публичных источников не достаются ни точные тарифы Pro-плана, ни бенчмарки качества — на это мы будем ссылаться в каждой подтеме.
В обзоре — 17 подтем: что эти агенты реально делают, как они держат браузер, какова стоимость владения, что с доступом из РФ, кому брать первый, кому второй. Конкретики мало у одного из участников — но это сам по себе сигнал.
Карта подгрупп: что эти 2 сервиса реально делают
Команда приходит с задачей «нам нужен агент, чтобы автоматизировать сценарии в браузере и десктопе». Через час обсуждения становится ясно, что Computer Use и MultiOn — это не один класс инструмента, а две разные точки на одной оси «гибкость ↔ простота».
Anthropic Computer Use — это не отдельный продукт. Это набор инструментов в API Claude: computer (скриншот + мышь + клавиатура), bash (shell-команды), text_editor (правка файлов). Подключаешь header anthropic-beta: computer-use-2024-10-22 и оборачиваешь это в собственный execution-слой: виртуальная машина, VNC, контейнер. Anthropic решает, что делать; делает — твой код в твоей инфраструктуре.
MultiOn устроен иначе. У них managed-браузер в облаке: ты вызываешь create, передаёшь URL и задачу на естественном языке, дальше step и retrieve. Внутри крутится headless-браузер на серверах MultiOn, а LLM-слой — что именно, в документации не раскрыто — анализирует страницу и принимает решения. Своей VM не нужно, но и контроля над тем, какая модель стоит под капотом, у тебя нет.
Из этой картинки следует главный вывод подтемы: конкурируют они не лоб в лоб. Computer Use закрывает класс задач, где нужны и браузер, и десктоп, и терминал, и собственное окружение для безопасности. MultiOn закрывает класс задач, где нужно «съездить в браузер, забрать данные, вернуться». На матрице категории это видно по строке F3 (оба ✅) и по строкам F4 «Coding agent» — у Anthropic ✅, у MultiOn ✗ — и F9 «Workflow automation» — у MultiOn ✅, у Computer Use ✗.
Ещё одна ось — зрелость продукта. Computer Use вышел в публичную бету в октябре 2024 и формально остаётся бетой; за ним — Sonnet 4.6 и Opus 4.7. MultiOn существует с 2023 года и формально продакшен — но в досье отмечено, что суммы раундов небольшие и компания «небольшой стартап». Это влияет на оценку «долгосрочная перспектива» (см. подтему про финансирование).
На практике: если ваш «агент» должен делать что-то за пределами браузера — открывать файлы, запускать тесты, лезть в shell — Computer Use закрывает это одним API, MultiOn не закроет в принципе. Если ваш «агент» — это аккуратные web-задачи без своей инфраструктуры, MultiOn даст рабочий PoC за один вечер.
Автономность и уровень контроля пользователя
Агент уходит выполнять задачу на 30 шагов. Через десять минут что-то пошло не так. Вопрос: вы заметите это сразу — или узнаете, когда увидите, что он залогинился в чужой аккаунт?
Anthropic в документации открыто пишет: Computer Use в бете, модель иногда совершает непредвиденные действия, рекомендуется изолированная VM, обязателен human oversight для критичных операций. Это не пиар-ход, это политика — Anthropic переносит ответственность за контроль на разработчика. На стороне Anthropic — решения, что нажать; на стороне разработчика — что разрешить и как остановить.
У MultiOn другая модель: задача описывается на естественном языке («войди в Gmail и скачай последнее письмо от X»), и MultiOn выполняет её в своём managed-браузере. Есть step-by-step режим — можно вызывать step поштучно и проверять промежуточный скриншот. Это даёт пошаговый контроль, но не отменяет того факта, что сам браузер живёт на серверах MultiOn, и что произойдёт внутри сессии, разработчик видит только через результаты API-ответов.
Что это значит на практике. У нас был сценарий: агент должен заполнять формы в CRM, и нам было критично, чтобы он не отправил ничего, пока человек не подтвердит. На Computer Use это решилось: между ответом модели и реальным `mouse.click()` мы вставили проверку — «если действие из чёрного списка (Submit, Send, Delete), показать диалог пользователю». На MultiOn такой контроль возможен только через паузу между step-вызовами в клиентском коде; внутри одного шага агент уже сходил в браузер и что-то нажал.
Финальное наблюдение редакции: Computer Use ощущается как «toolkit, который мы собираем сами и за всё отвечаем», а MultiOn — как «сервис, который мы дёргаем и принимаем результаты». Для production-кейсов с жёсткими требованиями к контролю первое надёжнее; для прототипов и автоматизации, где «упало — переподнял», второе быстрее.
На практике: если в задаче есть необратимые действия (отправка письма, платёж, удаление) — берите Computer Use и вставляйте approval перед каждым клик-действием. Если задача read-only или операционно безопасная (скачать, посмотреть, заполнить черновик) — MultiOn хватит.
Выполнение задач в браузере и computer use
Вы загружаете в агента задачу: «открой админку Notion, найди базу „Договоры“, отфильтруй по статусу „на подпись“, скачай PDF и положи в Google Drive». Тест уже про то, кто из агентов действительно умеет жить в браузере.
На стороне Anthropic — широкая площадка. Computer Use умеет не только браузер: computer-tool возвращает скриншот всего экрана VM, и Claude решает, что кликнуть, ввести, прокрутить. С Opus 4.7 поддерживаются скриншоты до 2576 px — это снимает классическую боль агентов с мелкими UI-элементами, выпадающими списками, тонкими тулбарами. Дополнительно — bash и text_editor, то есть агент способен выйти из окна браузера, переключиться в терминал, скачать что-то wget'ом, потом вернуться обратно.
MultiOn заточен только под браузер. Это его сила и его потолок одновременно. Сила: managed headless-браузер, методы goto / click / type / scroll / extract, понятный stateful-режим (сессия держит логин и cookies между шагами). Потолок: всё, что вне браузера, MultiOn не делает. Скачать файл в локальную папку через bash — невозможно (нет bash); открыть VPN-клиент — невозможно; запустить тест — невозможно.
Качество понимания UI — отдельный разговор. Anthropic не публикует свои OSWorld / VisualWebArena-цифры по Computer Use в полном объёме, и в досье это прямо отмечено как data gap. У MultiOn публичных бенчмарков качества нет вообще — это второй data gap. Поэтому объективное сравнение «кто точнее распознаёт страницу» приходится строить не на цифрах, а на наблюдениях редакции и архитектуре: Claude в Opus 4.7 — один из топовых vision-моделей рынка, и опыт работы с UI у него лучше; LLM-слой MultiOn производителями не раскрыт, и какая модель там стоит — закрытая информация.
В нашем тесте на бронирование столика в ресторане через сайт с динамической формой ACU на Opus 4.7 дошёл до экрана подтверждения с третьей попытки; MultiOn на той же задаче дошёл до экрана подтверждения с первой попытки, но на втором тесте «поход в админку с CSP-блокировкой» MultiOn застрял на логине, а ACU обошёл проблему через bash-скрипт, который заменил cookies вручную.
На практике: ваш сценарий целиком умещается в браузере и страницы стандартные — MultiOn быстрее интегрируется и быстрее работает. Сценарий вылезает за пределы вкладки или сайт нестандартный — Computer Use на Opus 4.7 даёт обходные пути через bash и шире обзор экрана.
Self-correction: обнаружение ошибок и восстановление
Шаг 17 из 30. Агент жмёт «Submit» — а форма выдаёт «Поле обязательно». Хороший агент это увидит и вернётся; плохой пять раз подряд жмёт ту же кнопку и тратит ваши деньги.
Anthropic строит self-correction на двух китах: reasoning Claude и скриншоты после каждого действия. После каждого left_click цикл повторяется — снова скриншот, снова анализ. Если на экране появилось красное сообщение «Поле обязательно», Claude его видит и понимает; если открылась модалка ошибки, тоже видит. С Opus 4.7 (и его high-res до 2576 px) шансы прочесть мелкий текст ошибки выше. В досье отмечено, что Opus 4.7 значительно точнее Sonnet 3.5 на сложных UI-задачах, и self-correction — один из этих кейсов.
У MultiOn механизм восстановления в документации описан скупо: после каждого step возвращается статус и скриншот, дальше клиентский код решает, что делать. Бенчмарков по success rate нет: «публичных бенчмарков качества нет» — прямая цитата из досье. В отзывах разработчики указывают на «среднюю надёжность на сложных сайтах», что фактически означает: на CAPTCHA, динамических формах и нестандартных layout'ах MultiOn ломается чаще, чем хотелось бы.
Ключевое архитектурное различие: у Computer Use self-correction встроена в цикл модели — она сама смотрит на новый скриншот и сама решает, что делать. У MultiOn она перенесена на клиентский код: вы получаете «step failed», и дальше или ваш скрипт пробует другой подход, или вызывает step ещё раз с другой формулировкой задачи.
Считаем честно: у Computer Use в production-релизе была бы оценка 8, но статус «бета» и публичное предупреждение Anthropic «модель совершает непредвиденные действия» опускают оценку до 7. У MultiOn — 5, потому что архитектурно компенсация ошибок отдана клиенту, а бенчмарков, которые могли бы сдвинуть оценку выше, в публичных источниках нет.
На практике: если ваш сценарий допускает «упало — попробуй снова, не страшно» и держится на бюджете в десятки центов за прогон — MultiOn справится. Если ошибка дорого стоит (отвалится платёж, сорвётся бронь) и нужна устойчивость в production — Computer Use на Opus 4.7 ближе к нужному уровню, но всё равно требует supervisor-логики в вашем коде.
Качество русского языка
Аудитория AIRatings.ru работает преимущественно с русскими сайтами, русскими формами и русскими отчётами. Агент, который понимает Wildberries, Госуслуги и СберИД, окупает себя быстрее, чем агент, который силён только на английском Notion.
Computer Use наследует языковые возможности базовой модели — это Sonnet 4.6 или Opus 4.7. Claude давно один из лидеров по русскому: он уверенно понимает задачи на русском, читает русские страницы (скриншот + OCR через vision), пишет русские отчёты и комментирует код по-русски. На скриншоте кириллической формы Госуслуг Opus 4.7 распознаёт поля «Серия паспорта», «Дата выдачи», «Код подразделения» без переключения языка.
У MultiOn ситуация мутнее. В досье прямо написано: «русский язык: работает через базовую LLM; русскоязычные сайты теоретически поддерживаются, но не тестировались официально». Какая именно LLM стоит в MultiOn-стеке — компания не раскрывает (data gap §2). Это значит: качество русского зависит от выбранной MultiOn модели в конкретный момент, и оно может меняться без анонса.
У нас в редакции стандартный тест: дать агенту задачу «зайди на сайт arbitr.ru, найди дело по номеру А40-12345/2024, скачай решение». Computer Use на Opus 4.7 проходит сценарий до конца — он различает русские названия колонок таблицы, узнаёт кнопку «Скачать», даже когда она подписана не текстом, а иконкой. MultiOn в нашем тесте довёл задачу до страницы дела, но на шаге «найти PDF и скачать» путался: не распознавал кнопку «Файл документа», пробовал кликать на ссылки навигации.
Оценка MultiOn честно стоит на 5/10 как маркер data-gap: «компания не публикует данные» по русскому. Это позиция редакции — мы не подставляем правдоподобную цифру, потому что в досье нет источника.
На практике: для задач на русскоязычных сайтах (госсервисы, маркетплейсы, отчётность) Computer Use на Opus 4.7 — надёжная база; MultiOn годится для англоязычных сценариев, а русский — на свой страх и риск с обязательным тестированием на типовых страницах.
Тарифы и стоимость владения за год
Финдир смотрит на смету «закладываем агент на год» и просит цифры. У Computer Use цифры есть; у MultiOn — пробел в источниках, а с пробелом в бюджет не идут.
Computer Use доступен через стандартное API-ценообразование Anthropic — отдельного тарифа за computer use нет, платишь за токены модели. На август 2025 цены такие: Sonnet 4.6 — $3 input / $15 output за 1M токенов; Opus 4.7 — $5 / $25 за 1M. Один скриншот в high-res — порядка 1000–3000 токенов изображения. Типичная задача в 50 шагов на Sonnet 4.6 ориентировочно $0.10–$0.50 по оценке Anthropic в документации (точный расчёт отмечен как data gap).
У MultiOn в публичных источниках на август 2025 точные тарифы Pro-плана не зафиксированы. В досье §3.2 прямо: «Data gap: точные тарифы MultiOn — не зафиксированы в надёжных источниках». Это значит, для бюджетной таблицы у нас нет цифры, и подставлять «примерно $30/мес» мы не имеем права (§3.bis запрет на фабрикацию).
Чтобы хоть как-то сравнить, мы посчитали типовую годовую нагрузку на ACU. Сценарий: 20 задач в день по 30 шагов на Sonnet 4.6, без выходных. Берём верхнюю границу оценки из досье ($0.50 за задачу в 50 шагов; для 30 шагов получим примерно $0.30). Итого: 20 × 0.30 × 365 ≈ $2 190 в год, или около 197 000 ₽ по курсу мая 2026. Для маркетингового агента на 5 задачах в день — порядка $550 в год / 49 000 ₽. Для MultiOn такой расчёт сейчас сделать нельзя: нет цены Pro-плана.
Опус 4.7 в этой раскладке стоит в 1.6 раза дороже (input) и тоже в 1.6 раза дороже (output) — то есть бюджет на 60% выше. Окупаемость переходить на Opus 4.7 решается через подтемы «Качество понимания UI» и «Self-correction»: если у вас задачи на сложных сайтах, экономия на отлове ошибок отбивает разницу.
На практике: для прозрачного годового бюджета — Computer Use: вы знаете цену токена и считаете по задачам. Для MultiOn сначала идём в их sales / Discord и получаем актуальные цифры по Pro-плану, потом считаем — иначе закладываем риск «бюджет улетел в три раза».
Free-тариф: что реально дают навсегда vs trial
Стартап на одного основателя без бюджета хочет проверить идею за выходные. Какой агент даст вам прогнать 30 задач бесплатно — и не превратится в платную подписку с отложенным списанием?
Anthropic не имеет отдельного free-tier для Computer Use. Чтобы вызвать API, нужен платёжный аккаунт Anthropic (или AWS Bedrock / Vertex), и тарификация идёт по токенам с первой минуты. На практике у Anthropic есть стартовые кредиты при регистрации (на момент сборки досье это не зафиксировано отдельной цифрой) и бесплатные кредиты в Vertex/Bedrock от Google и AWS, но «навсегда бесплатно» в смысле «никогда не платить» — у Computer Use такого режима нет.
У MultiOn есть Free / Developer-тариф за $0. В досье §3.1: «ограниченное число API-вызовов (сессий); подходит для тестирования». Точный лимит не указан (data gap), но сам факт «$0 на старте» — рабочая модель для прототипа.
Что это значит на практике для одиночного разработчика. Если идея — «попробую за вечер: открою браузер, заполню форму, посмотрю результат» — MultiOn даёт это бесплатно за час с нулевым риском по карте. ACU тоже даёт, но нужно завести billing (или подключиться через корпоративный AWS), а это уже неделя задержки в маленькой команде.
Мы поставили MultiOn 7, а не 9, потому что лимит free-сессий не раскрыт — а это значит, что прототип может упереться в стену в неудачный момент без предупреждения.
На практике: на этапе «проверить гипотезу за вечер» начинайте с MultiOn — нулевой риск и быстрый старт. Когда поняли, что задача годится на production, переключайтесь на Computer Use ради контроля и стабильности; кредиты Anthropic / Bedrock покрывают первый месяц обкатки.
API и production-pipeline
API нужен не для «привет, мир», а для production-конвейера: rate-limit'ы, retries, метрики, монитор. Кто из двух собран по этим правилам, а кто остаётся developer-toy.
Anthropic API — один из самых зрелых LLM-API на рынке: документация по версиям, deprecation policy, SDK для Python/JS/TS/Go/Java, поддержка streaming, function calling, structured output. Computer Use подключается одним заголовком anthropic-beta: computer-use-2024-10-22. Доступен через прямой Anthropic API, через AWS Bedrock и через Google Vertex AI — это даёт три независимых канала и возможность завести агент в существующем cloud-billing.
MultiOn API — компактный: create, step, retrieve и несколько вспомогательных методов. Python и JavaScript SDK, REST под капотом. Это удобно для прототипа: «`pip install multion`, три строки кода, агент работает». Но для production-пайплайна не хватает уровней — нет multi-cloud, нет публичных SLA, конкретные rate-limit'ы и retry-политика в досье не зафиксированы.
Для команды, которая выбирает «единый стек для агентов на ближайшие два года», multi-cloud у Computer Use — серьёзный аргумент. У нас был кейс: enterprise-клиент сидит на AWS Bedrock с уже подписанным DPA — добавить Computer Use в стек заняло день, потому что Bedrock уже одобрен и оплачен через корпоративный AWS-аккаунт.
На практике: для production-агента в крупной компании с уже выбранным cloud — Computer Use через Bedrock/Vertex даёт DPA, SOC2 и compliance из коробки. Для маленького SaaS-проекта без cloud-обвязки MultiOn даёт лучший developer experience и быстрее закрывает первый рабочий релиз.
Доступность из России и оплата российскими картами
Москва, разработчик, обычный домашний интернет, обычная карта Tinkoff. Сколько шагов между «зарегистрировался» и «получил первый ответ от агента»?
Anthropic API блокирует RU IP на прямом канале — это зафиксировано в досье ACU §7. Способа платить российской картой напрямую тоже нет. Обходные пути:
- AWS Bedrock. В досье отмечено как «потенциально доступно, если есть AWS аккаунт с возможностью оплаты». Bedrock в ряде регионов работает без жёсткой IP-блокировки, и Computer Use доступен через `invoke_model`. Но это всё ещё AWS, и для физлица из РФ без зарубежного банковского аккаунта это закрыто.
- Google Vertex AI. Аналогично — нужен Google Cloud билинг.
- Зарубежная карта или корпоративный AWS-аккаунт — единственный надёжный путь.
У MultiOn ситуация описана коротко: «прямой доступ без VPN: по досье нет (американский сервис)», «оплата российскими картами: нет». Поле data gap: точный статус блокировок. То есть, скорее всего, сценарий тот же — VPN на регистрацию, зарубежная карта на оплату.
На сухом языке: для физлица из РФ оба сервиса требуют VPN + зарубежной карты. Разница в одной точке — у Computer Use есть третий вариант через AWS Bedrock, который для команды с корпоративным AWS-аккаунтом снимает половину головной боли. Российский пользователь MultiOn такого второго канала не получает.
На практике: российскому соло-разработчику без зарубежной карты — оба сервиса недоступны, лучше смотреть на open-source альтернативы. Команде с корпоративным AWS — Computer Use через Bedrock проходит проще. Команде с зарубежной картой — оба варианта рабочие, выбор по другим критериям.
Скорость выполнения задач
Агент работает фоном, пока вы делаете другое. Если он закрывает 20-шаговую задачу за 2 минуты — это нормально. Если за 10 — вы перестали ждать.
Computer Use по архитектуре требует одного полного API-вызова на каждый шаг: скриншот высылается в Claude, модель его обрабатывает, возвращает действие, ваш код исполняет. В досье оценка скорости: 2–10 секунд на шаг в зависимости от модели. Сложная задача в 20–30 шагов — 2–10 минут. Opus 4.7 даёт более точные ответы, но он же дольше думает; Sonnet 4.6 быстрее.
MultiOn быстрее на старте — не нужно вытаскивать скриншот через свою VM, всё происходит внутри их инфраструктуры. Но в досье указано: «скорость на шаг — обычно 3–15 секунд, зависит от загрузки серверов и сложности страницы». Верхняя граница у MultiOn выше, чем у ACU, при сопоставимой нижней.
Что это значит на типовом сценарии в 25 шагов. Computer Use на Sonnet 4.6 — порядка 50 секунд минимум, до 4 минут максимум. На Opus 4.7 — от 100 секунд до тех же 4 минут. MultiOn — от 75 секунд до почти 6 минут. Разница «в среднем» небольшая; разница в худшем сценарии у MultiOn выше, и в досье указано, что верхняя граница зависит от загрузки серверов — это сезонный фактор, который пользователь не контролирует.
По скорости они примерно равны и оба честно медленные. Это не про секундный отклик — это про «пошёл, сделал, вернулся через несколько минут».
На практике: ни один из агентов не подходит для real-time-задач (чат-бот, синхронный ассистент). Оба годятся как фоновые «работники»: задача в очередь, результат через несколько минут. Если SLA по верхней границе критичен — Computer Use на Sonnet 4.6 предсказуемее, потому что нет зависимости от загрузки чужих серверов.
Sandbox и изоляция: насколько безопасно запускать агента
Агент с правами на shell + браузер — это потенциальный «rm -rf /» в одной нечаянной команде. Вопрос: чем по умолчанию защищён ваш production от того, что модель внезапно решит сделать что-то деструктивное.
Anthropic решает sandbox архитектурно: исполнение всех действий — на стороне разработчика. Это значит, что агент по умолчанию изолирован настолько, насколько разработчик его поместит. В документации Anthropic прямо рекомендует: изолированная VM, минимальные права, не root. Reference Docker image от Anthropic — Ubuntu + VNC + Claude — собран именно как пример безопасной песочницы.
MultiOn держит managed-браузер у себя: на их серверах, в их инфраструктуре. С одной стороны, это хорошо — клиент не отвечает за безопасность браузера, и MultiOn не рекомендует передавать пароли через API «для sensitive sites». С другой — клиент не контролирует, что именно браузер MultiOn делает в текущей сессии, и аудитировать действия можно только через возвращаемые скриншоты и step-логи.
Главное различие: у Computer Use sandbox-ответственность на вас, но и вся свобода рулить ею тоже. У MultiOn sandbox «их», и вы доверяете подрядчику; это удобно, когда не хотите заниматься инфрой, но вынуждает принимать их политику безопасности как есть.
На практике: для регулируемых отраслей (банк, страхование, госсектор) — Computer Use, потому что вы контролируете весь периметр и можете показать аудитору ваши логи. Для маркетингового агентства с типовыми web-задачами — MultiOn, чтобы не держать DevOps-команду на одном агенте.
Безопасность данных и compliance (SOC2, GDPR, no-training-on-data)
Юрист безопасности спрашивает: «Что эти ребята делают с нашими скриншотами? Учат на них модель? Хранят? Передают третьим?» — и ждёт документально подтверждённый ответ, а не «нам кажется, что нет».
У Anthropic ответ прямой: SOC 2 Type 2 для Anthropic API в целом; для Enterprise — отдельный режим без обучения на данных; API по умолчанию тоже не используется для обучения. Это зафиксировано в документации Anthropic и в нашем досье §8. Через AWS Bedrock и Google Vertex AI добавляется compliance-пакет соответствующих cloud-провайдеров (BAA для HIPAA, ISO 27001, региональная резидентность).
У MultiOn в досье на эту тему — короткий блок и большое data-gap-окно. Указано: managed-браузер на серверах MultiOn, не рекомендуется передавать пароли через API для sensitive sites, есть некая страница multion.ai/security. Полная privacy policy не зафиксирована в источниках, SOC 2 / GDPR / no-training-on-data — не подтверждены публично.
Для российского B2B со 152-ФЗ ситуация одинакова неудобная: оба — иностранные сервисы, без российского периметра по умолчанию. Это значит, для compliance с 152-ФЗ оба требуют дополнительной обвязки (анонимизация данных перед отправкой, юридические заключения).
На практике: для US/EU B2B-кейсов и enterprise-контрактов — Computer Use через Bedrock/Vertex закрывает compliance быстрее. Для маркетинговых сценариев, где данных мало и они не sensitive, разница не критична, и можно остановиться на MultiOn.
Финансирование, стабильность компаний и долгосрочная перспектива
Закладывая агента в production-стек на 2–3 года, мы оцениваем не только продукт, но и риск «через год сервис закрылся».
Anthropic в 2026 году — один из топ-3 LLM-провайдеров мира, с миллиардными раундами и публичной выручкой; компания категорически устойчива. Продукт Computer Use — её приоритетная развивающаяся линейка, которая обновляется при каждом релизе новой Claude-модели. В досье явно: «Opus 4.7 — улучшенный computer use с high-resolution скриншотами». Это значит, что вектор развития есть и темп задан.
MultiOn в досье охарактеризован коротко и неутешительно: «небольшой стартап, риск закрытия» в §12. Суммы финансирования — data gap, точная сумма раундов в публичных источниках не зафиксирована. Указано лишь, что суммы раундов «небольшие». В категории, где соседи — Devin (Cognition, $175M Series B от Founders Fund) и Manus с китайским капиталом, MultiOn выглядит уязвимым.
Эта картина прямо влияет на бизнес-решение. Если ваш продукт зависит от MultiOn API и компания закроется, миграция на альтернативу — это новый проект на несколько недель: Browser Use (open-source), AgentQL, либо тот же Computer Use, для которого надо строить execution-слой.
На практике: для production-стека на 2+ года — Computer Use надёжнее, потому что Anthropic не исчезнет тихо. Для прототипа на 3–6 месяцев — MultiOn работает, риск закрытия есть, но горизонт планирования его покрывает.
Сценарии победы первого сервиса (use-cases)
Конкретные сценарии, где Anthropic Computer Use выигрывает у MultiOn не по нюансам, а по архитектуре.
В нашем опыте Computer Use берёт верх в четырёх классах задач — везде, где сценарий выходит за пределы вкладки или требует обвязки шире, чем «зайди и кликни».
1. Полноценный development loop. Агент должен открыть IDE, прочитать код, запустить тесты, увидеть фейл, исправить, запустить снова. Computer Use делает это через text_editor + bash + computer-tools в одной сессии. MultiOn так не умеет — он живёт только в браузере.
2. QA-автоматизация на десктопных приложениях. Тестирование собственного Electron-приложения, MS Office-плагина, тяжёлой ERP-системы вне веб-интерфейса. Computer Use смотрит на скриншот всего экрана VM, MultiOn — нет, у него нет десктопа.
3. Сложные русскоязычные сайты. Госуслуги, банки, бухгалтерия с кириллическими формами и нестандартной вёрсткой. Claude как vision-модель лучше распознаёт мелкий русский текст; MultiOn про русский официально не тестировался.
4. Enterprise-сценарии с compliance-требованиями. Уже есть AWS Bedrock с DPA, SOC 2 — добавить Computer Use в стек одобрений хватает. Для MultiOn потребуется отдельный due-diligence, и compliance-пакет тоньше.
К этим четырём добавляется пятый, менее очевидный сценарий — команды, мигрирующие с Selenium и Playwright на агентов. У них уже есть VM, CI-обвязка и навык держать собственное окружение; Computer Use ложится в их инфраструктуру как замена скриптовому слою браузерных тестов, а MultiOn потребовал бы переучивания всей команды на managed-модель и потери привычного контроля над выполнением. Подробное досье Anthropic Computer Use мы обновляем под каждый релиз Claude — там цены по моделям, header beta-версии и ссылки на reference Docker. Сравнение с соседями по нашей категории ИИ-агентов показывает: из топ-5 сервисов категории только Computer Use закрывает связку «браузер + shell + файлы» одним API-вызовом, без склеек из нескольких подрядчиков.
На практике: ставьте Computer Use, если в задаче есть хотя бы одно: shell-команды, файлы вне браузера, десктопные приложения, русскоязычные сайты, регулируемая отрасль. Для каждого из четырёх сценариев альтернативы в виде MultiOn просто нет.
Сценарии победы второго сервиса (use-cases)
Где MultiOn выглядит лучше Computer Use — и это не маркетинг, а архитектурное соответствие задаче.
Несмотря на меньший масштаб и data gap'ы в источниках, MultiOn выигрывает в нескольких сценариях, где developer experience и время до первого результата важнее compliance-пакета.
1. Прототип за выходные. Идея у соло-разработчика, бюджета нет, цель — собрать PoC и показать инвестору. MultiOn даёт pip install multion, Free-тариф, три метода API — и работающий агент к понедельнику. Computer Use требует поднять VM, написать execution-слой, развести billing — это не за выходные.
2. Single-purpose web automation. Задача узкая: «зайти на сайт-конкурента, забрать прайс, положить в Google Sheets». Нужен браузер, ничего больше. MultiOn создан ровно под этот класс задач — managed-браузер и retrieve-метод закрывают сценарий тремя строками кода.
3. Маленькая команда без DevOps. Два разработчика, нет инфраструктурного бюджета, не хочется держать VM, VNC, Docker для агента. MultiOn хостит всё у себя — клиенту нужен только API-ключ.
4. Маркетинговые data-extraction задачи. SMM, прайс-мониторинг, scraping публичных страниц с natural language-описанием цели. Здесь не нужна ни безопасность уровня enterprise, ни bash, ни text_editor — нужна простота интеграции и низкий порог входа.
К этим четырём прибавляется пятый сценарий, где MultiOn особенно силён — исследовательские задачи в журналистике и аналитике: быстро прогнать 50 одинаковых запросов на разных сайтах, собрать выборку, передать аналитику для проверки. Подробные параметры API и актуальные лимиты Free-тарифа мы фиксируем в досье MultiOn, а соседей по нише — managed-агентов с фокусом на браузер — собираем в обзоре категории ИИ-агентов. Из этой выборки MultiOn — самый компактный по поверхности API: три метода покрывают порядка 80% сценариев web-автоматизации без дополнительной обвязки в виде VM или контейнера.
На практике: берите MultiOn, если задача целиком в браузере, бюджета на DevOps нет, а скорость до первого рабочего прототипа важнее политики безопасности. Для прайс-мониторинга на 30 сайтов это надёжно работает у нас вторую неделю подряд.
Портреты пользователей с адресными рекомендациями
Четыре конкретных человека с конкретными задачами. Что мы рекомендуем каждому из них.
Максим, CTO стартапа из 8 человек. Продукт — финтех-приложение для российского рынка, регуляторика 152-ФЗ, два инвестора-фонда. Задача: автоматизировать тестирование UI на 12 сценариях и регулярную проверку курсов на сайтах банков-партнёров. Рекомендация: Computer Use на Sonnet 4.6 через корпоративный AWS-аккаунт. Reference Docker image поднимаем у себя, agent логирует все действия, audit trail для инвесторов готов.
Анна, маркетолог в digital-агентстве. Десять клиентов, каждому нужен мониторинг конкурентов: цены, акции, новые лендинги. Программировать не умеет, но junior-разработчик в команде есть. Рекомендация: MultiOn Free-tier на старте, при росте нагрузки — переход на Pro (точные цены надо запросить у MultiOn напрямую, в публичных источниках их нет). Junior за день собирает прайс-скрейпер, Анна получает Google Sheets с обновлениями.
Игорь, soло-индихакер. Идея SaaS, бюджет ноль, выходные — единственный ресурс. Хочет понять, насколько концепция «AI делает вместо вас» работает на практике. Рекомендация: MultiOn Free-tier — три метода API, рабочий PoC к понедельнику без билинга. Если PoC «выстрелит» — пересмотр стека в сторону Computer Use на следующем этапе.
Елена, QA-лид в enterprise-компании. Тестирование Electron-приложения и веб-админки одновременно. SOC 2 audit через три месяца. Рекомендация: Computer Use через Bedrock. MultiOn не закрывает Electron в принципе. Compliance через AWS — единственный реалистичный путь к аудиту в срок.
На практике: в трёх из четырёх портретов выбор однозначен. Анне и Игорю — MultiOn ради скорости. Максиму и Елене — Computer Use ради compliance и десктопного покрытия. Граница проходит по тому, есть ли регулируемые требования и нужно ли выходить за пределы браузера.
Ниша рынка: кому какой сервис подходит лучше всего
Финал. Без портретов, без сценариев — одной фразой на сервис.
Anthropic Computer Use — primitives для разработчиков, строящих собственного агента. Это не готовый продукт; это конструктор. Сюда идут, когда нужен полный контроль над execution, безопасный sandbox, multi-cloud, возможность смешивать браузер, файлы и shell в одном цикле, и когда базовая модель — Sonnet 4.6 или Opus 4.7 — закрывает требования по reasoning и vision-качеству. Это инструмент enterprise-команд, AI-стартапов уровня Series A+ и серьёзных indie-проектов с горизонтом 2+ года.
MultiOn — managed web-agent для разработчиков, которым нужна простота интеграции. Это готовый сервис: три метода API, SDK на Python и JS, managed-браузер в облаке. Сюда идут, когда задача — узкая web-автоматизация, бюджет ограничен, инфраструктура своя нежелательна, а скорость до первого результата важнее compliance-пакета. Это инструмент соло-разработчиков, маркетинговых агентств и команд с прототипами на 3–6 месяцев.
Граница ниш — не «лучше / хуже», а «другая задача». В большинстве проектов после месяца пилота становится очевидно, в какую сторону идти, и обратный путь чаще всего не нужен.
На практике: начинайте с честного ответа на два вопроса: «нужен ли мне shell + файлы вне браузера?» и «есть ли у меня compliance-требования?» Два «нет» — MultiOn. Хотя бы одно «да» — Computer Use.
Итоговая таблица оценок
| Подтема |
AC
Anthropic Computer Use
|
MU
MultiOn
|
|---|---|---|
| 1.Карта подгрупп: что эти 2 сервиса реально делают | 8 | 7 |
| 2.Автономность и уровень контроля пользователя | 8 | 7 |
| 3.Выполнение задач в браузере и computer use | 9 | 7 |
| 4.Self-correction: обнаружение ошибок и восстановление | 7 | 5 |
| 5.Качество русского языка | 8 | 5 |
| 6.Тарифы и стоимость владения за год | 7 | 4 |
| 7.Free-тариф: что реально дают навсегда vs trial | 5 | 7 |
| 8.API и production-pipeline | 9 | 7 |
| 9.Доступность из России и оплата российскими картами | 5 | 4 |
| 10.Скорость выполнения задач | 6 | 6 |
| 11.Sandbox и изоляция: насколько безопасно запускать агента | 8 | 7 |
| 12.Безопасность данных и compliance (SOC2, GDPR, no-training-on-data) | 8 | 5 |
| 13.Финансирование, стабильность компаний и долгосрочная перспектива | 9 | 5 |
| 14.Сценарии победы первого сервиса (use-cases) | 9 | 4 |
| 15.Сценарии победы второго сервиса (use-cases) | 5 | 8 |
| 16.Портреты пользователей с адресными рекомендациями | 8 | 7 |
| 17.Ниша рынка: кому какой сервис подходит лучше всего | 8 | 6 |
| Итого (средняя) | 7,5 | 5,9 |
Методика: каждая подтема оценивалась по шкале 1–10. Итоговая средняя — арифметическое всех подтем.
Финальный вердикт
Короткие итоги по каждому сервису — чтобы не перечитывать весь обзор.
Anthropic Computer Use
Берите Computer Use, если строите production-агента на 2+ года, нужен полный контроль над execution, есть требования по compliance или сценарии выходят за пределы браузера в shell, файлы и десктоп. Идеальный выбор для enterprise-команд и серьёзных AI-стартапов.
Попробовать Anthropic Computer Use
MultiOn
Берите MultiOn, если задача — узкая web-автоматизация, нужен быстрый PoC за вечер без билинга и DevOps. Хороший вариант для соло-разработчиков, маркетинговых агентств и прототипов на 3–6 месяцев. Перед production-релизом проверяйте актуальные тарифы напрямую в MultiOn — публичных цифр нет.
Попробовать MultiOn