Китайская технологическая компания Alibaba представила новую серию ИИ-моделей Qwen2.5-VL, которые способны анализировать текст, изображения и видео, а также управлять устройствами на ПК и смартфонах. Об этом сообщает Reuters.
В компании отметили, что модель превосходит не только GPT-4o (OpenAI), Claude 3.5 Sonnet (Anthropic) и Gemini 2.0 Flash (Google), но и китайский DeepSeek, который недавно произвел фурор, заняв первое место по загрузкам в мире и обрушив акции американских технологических компаний.
Что может Qwen2.5-VL:
- распознавание всех типов документов, включая рукописный текст, таблицы, графики, химические формулы и записи от руки;
- распознавание, поиск и подсчет объектов в различных форматах, включая абсолютные координаты и JSON;
- анализ видео продолжительностью несколько часов, выделяя ключевые события за считанные секунды;
- принятие решений и управление устройствами, что увеличивает функциональность модели в качестве цифрового помощника.
Alibaba продемонстрировала видео, на котором Qwen2.5-VL бронирует билет в приложении Booking.com на Android, а также управляет программами в Linux, хотя в данный момент ИИ справляется только с основными командами.
https://twitter.com/_philschmid/status/1883960019030524346
Как и другие китайские ИИ, Qwen2.5-VL оснащен встроенными фильтрами. При запросах на политически чувствительные темы, например, об ошибках лидера КНР Си Цзиньпина, чат-бот просто отказывается отвечать. Это связано с требованиями китайских регулирующих органов, обязывающих разработчиков придерживаться «основных социалистических ценностей».
Эксперты полагают, что запуск Qwen2.5-VL является ответом на стремительный рост DeepSeek.
В 2024 году DeepSeek-V2 спровоцировал ценовую войну в Китае, предложив услуги по рекордно низкой цене 1 юань ($0,14) за 1 млн токенов. Это заставило Alibaba, Baidu и Tencent снизить стоимость своих моделей на 97%.
Тем не менее, основатель DeepSeek Лян Вэньфэн утверждает, что ценовые войны его не интересуют: «Наша цель — достичь AGI (общего искусственного интеллекта — прим. Spot), который превзойдет человека».
Ранее Spot сообщал, что DeepSeek занял первое место среди бесплатных приложений в узбекистанском App Store.