Индикатор загрузки
Загрузка...

OpenAI представила нового ИИ-агента — Operator


Глава OpenAI Сэм Альтман в начале года заявил, что 2025-й станет важным для ИИ-агентов — технологий, которые автоматизируют задачи и выполняют действия за пользователей.

Теперь OpenAI делает свой первый серьезный шаг в этом направлении.

В четверг компания объявила о запуске предварительной версии Operator — универсального ИИ-агента, который может управлять веб-браузером и самостоятельно выполнять определенные задачи. Сначала Operator будет доступен только в США для пользователей тарифного плана ChatGPT Pro за $200 в месяц. В будущем OpenAI планирует сделать его доступным и на других тарифах: Plus, Team и Enterprise.

«[Operator] вскоре станет доступен в других странах», — сообщил Сэм Альтман в прямом эфире. «Но, к сожалению, в Европе это займет немного больше времени».

Пока что предварительная версия доступна через сайт operator.chatgpt.com, но OpenAI планирует в будущем интегрировать Operator во все версии ChatGPT.

Главный экран Operator

Operator, как заявляет OpenAI, может автоматизировать такие задачи, как бронирование жилья, заказ столиков в ресторанах и покупки в интернете. В интерфейсе Operator пользователи могут выбрать нужную категорию задач, например, покупки, доставка, рестораны или путешествия — каждая из них предлагает свои варианты автоматизации.

При активации Operator в ChatGPT появляется небольшое окно со встроенным браузером, через который агент выполняет задачи. При этом он объясняет, какие действия выполняет. Пользователь может в любой момент взять управление на себя, так как Operator работает в отдельном браузере и не мешает остальной работе.

OpenAI сообщает, что Operator работает на модели Computer-Using Agent (CUA), которая сочетает возможности компьютерного зрения GPT-4o с логикой более продвинутых моделей компании. CUA обучена взаимодействовать с пользовательскими интерфейсами сайтов, то есть ей не нужны специальные API для подключения к разным сервисам.

Проще говоря, CUA может нажимать кнопки, перемещаться по меню и заполнять формы на веб-страницах, как это сделал бы человек.

OpenAI также сотрудничает с такими компаниями, как DoorDash, eBay, Instacart, Priceline, StubHub и Uber, чтобы убедиться, что Operator соблюдает их условия обслуживания.

Модель CUA обучена запрашивать подтверждение пользователя перед выполнением задач, которые могут повлиять на внешние процессы, например, перед отправкой заказа или письма. Это позволяет пользователю проверить действия модели, прежде чем они станут окончательными, — объясняет OpenAI. Компания добавляет, что модель уже доказала свою полезность в разных ситуациях и они планируют расширить её возможности на другие задачи.

Однако OpenAI предупреждает, что CUA не идеальна. Компания признает, что не ожидает стабильной работы модели во всех случаях на данном этапе.

На данный момент Operator не может стабильно справляться с более сложными или специфическими задачами, такими как создание подробных слайд-шоу, управление сложными календарями или работа с сильно кастомизированными веб-интерфейсами.

Из соображений безопасности OpenAI требует, чтобы для выполнения некоторых задач, таких как банковские транзакции, пользователи всё же следили за процессом. Например, они должны будут сами ввести данные своей кредитной карты. Компания утверждает, что Operator не собирает и не делает скриншоты личных данных.

Для особо чувствительных сайтов, например, для электронной почты, требуется активное наблюдение со стороны пользователя, чтобы он мог сразу заметить и исправить любые ошибки модели.

Это ограничивает полезность Operator, но также позволяет избежать ситуаций, когда агент может, например, ошибочно потратить ваш ипотечный платёж на ненужные вещи. Подобный подход использует и Google в своём проекте Mariner AI, который также не заполняет такие данные, как номера кредитных карт.

Ограничения

У Operator есть несколько важных ограничений, о которых стоит знать.

Есть ограничения по количеству задач — как ежедневные, так и зависимые от типа задачи. OpenAI говорит, что Operator может выполнять несколько задач одновременно, но при этом есть «динамичные ограничения». Также существует общий лимит использования, который сбрасывается каждый день.

На текущем этапе Operator не выполняет некоторые задачи по соображениям безопасности, например, не отправляет электронные письма (хотя CUA теоретически может это делать) и не удаляет события из календаря. OpenAI обещает, что в будущем эти ограничения снимут, но точных сроков нет.

Кроме того, Operator может «застревать» при столкновении с особенно сложным интерфейсом, полем для ввода пароля или проверкой CAPTCHA. В таком случае он предложит пользователю взять управление на себя.

Будущее с ИИ-агентами

OpenAI развивается в сфере ИИ-агентов довольно медленно по сравнению с конкурентами, такими как Rabbit, Google и Anthropic, и это, вероятно, связано с опасениями по поводу безопасности технологий.

Когда ИИ-система может выполнять действия в интернете, это открывает возможности для злоупотреблений, таких как фишинговые атаки, DDoS-атаки или автоматическая покупка билетов на концерты. Особенно для таких популярных сервисов, как ChatGPT, очень важно, чтобы OpenAI принимала меры для предотвращения этих угроз.

Тем не менее, OpenAI считает, что Operator достаточно безопасен для запуска, по крайней мере, в виде исследовательской версии.

«Operator использует инструменты, которые помогают ограничить воздействие вредоносных запросов, скрытых инструкций и фишинговых попыток», — говорится на сайте OpenAI. «Система мониторинга приостанавливает выполнение, если выявляется подозрительная активность, а автоматические и ручные проверки регулярно обновляют меры безопасности».

Operator — это самый амбициозный шаг OpenAI в создании ИИ-агентов. На прошлой неделе компания выпустила функцию Tasks для ChatGPT, добавив такие полезные опции, как напоминания и планирование выполнения задач на определенное время.

Tasks предложили пользователям знакомые и необходимые функции, которые делают использование ChatGPT таким же удобным, как Siri или Alexa. Однако с появлением Operator мы видим возможности, которых не было у предыдущих виртуальных ассистентов.

ИИ-агенты стали одной из самых обсуждаемых тем в ИТ, как новое поколение технологий, которые могут изменить то, как люди используют интернет и свои устройства. Вместо того чтобы просто искать информацию, агенты могут выполнять реальные действия.

Теперь, с выходом первого реального ИИ-агента от OpenAI, скоро станет ясно, насколько все это реально и перспективно.


Интервью Вконтакте Руководства Конференции YouTube Google Яндекс Арбитраж Общие темы MyTarget Новости Инструменты Кейсы TikTok Facebook Профессии Google Ads Яндекс Директ Знания Одноклассники Instagram

Получайте уникальный
контент на почту без спама!

Intuit Mailchimp

0 комментариев

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Максимальный размер загружаемого файла: 20 МБ. Вы можете загрузить: изображение, видео. Ссылки на YouTube, Facebook, Twitter и другие сервисы, вставленные в текст комментария, будут автоматически встроены. Перетащите файл сюда

Похожие материалы:

No related posts found.