Индикатор загрузки
Загрузка...

Команда Qwen от Alibaba представила ИИ-модели для управления ПК и телефонами

Eye Icon

25 VIEWS

Обновлено: 05.02.2025

Опубликовано: 05.02.2025

На этой неделе внимание технологической индустрии в основном приковано к китайской лаборатории ИИ DeepSeek, но её главный местный конкурент, Alibaba, не остаётся в тени.

В понедельник команда Qwen от Alibaba представила новое семейство ИИ-моделей Qwen2.5-VL, которые могут выполнять различные задачи по анализу текста и изображений. Эти модели умеют обрабатывать файлы, анализировать видео, считать объекты на изображениях, а также управлять ПК — подобно модели, которая лежит в основе недавно выпущенной функции Operator от OpenAI.

По данным команды Qwen, лучшая модель Qwen2.5-VL обогнала GPT-4 от OpenAI, Claude 3.5 Sonnet от Anthropic и Gemini 2.0 Flash от Google по ряду тестов, включая анализ видео, математику, анализ документов и ответ на вопросы.

Модель Qwen2.5-VL, доступная для тестирования в приложении Qwen Chat от Alibaba и для скачивания на платформе для разработчиков AI Hugging Face, может анализировать графики и диаграммы, извлекать данные из сканов счетов и форм, а также «понимать» видео продолжительностью несколько часов, утверждает команда Qwen. Она также способна распознавать персонажей из фильмов и сериалов, а также широкий ассортимент товаров, что предполагает, что модели могли быть частично обучены на защищённых авторским правом материалах.

Однако, как и другие ИИ-системы, разработанные китайскими компаниями, Qwen2.5-VL имеет ограничения на темы, о которых она может говорить — по крайней мере, в Qwen Chat. Когда я попросил крупнейшую и наиболее мощную модель Qwen2.5-VL, Qwen2.5-VL-72B, поговорить о «ошибках Си Цзиньпина», приложение выдало ошибку.

Китайский интернет-регулятор проводит оценку многих местных моделей, чтобы убедиться, что их ответы соответствуют «основным социалистическим ценностям». Поэтому многие китайские ИИ-системы отказываются отвечать на темы, которые могут вызвать недовольство у регуляторов, например, на вопросы о независимости Тайваня.

Одной из более интересных функций Qwen2.5-VL является её способность взаимодействовать с программным обеспечением — как на ПК, так и на мобильных устройствах. В видео, размещенном на платформе X Филиппом Шмидом, техническим лидером Hugging Face, показано, как Qwen2.5-VL запускает приложение Booking.com для Android и бронирует билет на рейс из Чунцина в Пекин.

На видео ниже модель Qwen2.5-VL управляет приложениями на Linux-десктопе, но, похоже, не делает ничего существенного, кроме как переключает вкладки. Возможно, это объясняется тем, что, согласно результатам тестирования Qwen, модель Qwen2.5-VL плохо справляется с OSWorld — тестом, который пытается имитировать реальную компьютерную среду.

Два меньших и менее сложных модели в серии Qwen2.5-VL — Qwen2.5-VL-3B и Qwen2.5-VL-7B — доступны по свободной лицензии. Однако флагманская модель Qwen2.5-VL-72B использует собственную лицензию Alibaba, которая требует от компаний и разработчиков с более чем 100 миллионами активных пользователей в месяц получить разрешение от Qwen/Alibaba перед коммерческим использованием модели.

Интересуетесь нейросетями? Больше полезных материалов в нашем специальном разделе!

Манимейкинг Арбитраж Руководства Инструменты Новости Кейсы Интервью Конференции Профессии УБТ Telegram Facebook Google Google Ads TikTok Instagram Вконтакте YouTube Яндекс Общие темы База знаний

Автор

TraffNews

0 Comments

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Максимальный размер загружаемого файла: 20 МБ. Вы можете загрузить: изображение, видео. Ссылки на YouTube, Facebook, Twitter и другие сервисы, вставленные в текст комментария, будут автоматически встроены. Перетащите файл сюда

Traffnews рекомендует

AdsCard
AdsCard — многофункциональный финансовый сервис, предлагающий трастовые BIN-ы для рекламы, карты для личных покупок, выплаты по реестрам и другие услуги. Прозрачные комиссии, поддержка криптовалют и удобные инструменты для управления финансами.
TRAFFNEWS20

Промокод дает 20 бесплатных карт для рекламы

Скопировано!
Cloak IT
CLOAK IT — это топовый сервис для фильтрации трафика и защиты ваших рекламных кампаний. Облачное решение, которое защищает от ботов и нежелательного трафика, не требуя специальных знаний или навыков программирования.
TRAFFNEWS

Промокод traffnews дает 40% скидку

Скопировано!
Dolphin{anty}
Полный обзор Dolphin{anty} антидетект браузера. Выясняем, как защитить аккаунты от антифрод-систем, управлять сотнями профилей, настраивать прокси и автоматизировать рабочие процессы для максимальной эффективности.
TRAFFNEWS

Промокод TRAFFNEWS дает скидку 20% на первую оплату

Скопировано!
Партнерки
Показать все
1win Partners
1win Partners — это партнерская программа от ведущей букмекерской компании и онлайн-казино 1win, где вебмастера могут зарабатывать на привлечении игроков.
подробнее
INSIDE
INSIDE — ваш надежный партнер в iGaming на которого можно положиться! Более 1000 офферов, выплаты по запросу, высокий уровень сервиса, особые условия и эксклюзивные продукты.
подробнее
Kingfin
Kingfin — прямой рекламодатель трейдинговой платформы Olymptrade. RevShare до 80%, CPA до 250$, Hybrid, индивидуальный оффер.
подробнее

Похожие материалы:

Аудиостоки в 2025 году: как музыканту заработать на своих треках

Читать

ВК Мессенджер: зачем пользоваться, когда аудитория MAХ уже превысила 18 миллионов человек. Наш честный обзор

Читать

Как зарабатывать на партнерской программе Альфабанка до 22 000 рублей за лид? Полный обзор партнерки от Альфы

Читать

Схемы заработка на Авито в 2025 году: что работает и сколько можно заработать

Читать
cashinout отзывы

Cashinout честные отзывы 2025: стоит ли пользоваться сервисом для вывода средств

Читать

Сколько стоит группа в ВК в 2025 году: актуальные цены и факторы оценки

Читать
сколько зарабатывают адалт сайты

Сколько зарабатывают адалт сайты в 2025 году: реальные цифры и факторы дохода

Читать

Яндекс Музыка 2025: как слушать новые треки бесплатно и в хорошем качестве. Актуальный гайд для меломана

Читать