Alibaba делает важный шаг в области искусственного интеллекта: новые модели AI могут анализировать изображения и вести сложные диалоги. Оставляя исходный код открытым, компания получает больше возможностей для инноваций, а также привлекает новых пользователей к своим продуктам.
Alibaba представила новую модель искусственного интеллекта, способную анализировать изображения и вести продвинутые диалоги. Это значительное улучшение по сравнению с предыдущими решениями компании.
В контексте глобальной гонки в сфере AI-технологий китайская компания анонсировала две модели с открытым исходным кодом: Qwen-VL и Qwen-VL-Chat. Это даст возможность исследователям и компаниям по всему миру создавать собственные приложения на основе этих моделей, экономя время и ресурсы.
Qwen-VL способен реагировать на запросы, связанные с изображениями, генерируя к ним подписи. Qwen-VL-Chat предназначен для сложного взаимодействия, включая сравнение изображений и многократные вопросно-ответные сессии. Он может генерировать истории, создавать изображения на основе предоставленных пользователем фотографий и решать задачи, изображённые на фото.
В качестве иллюстрации Alibaba привела пример с вывеской больницы: на основе её изображения ИИ может предоставить информацию о размещении отделений. Этот прорыв в области AI следует за недавно выпущенной версией ChatGPT от OpenAI, которая также способна анализировать изображения.
Обе модели Alibaba базируются на языковой модели Tongyi Qianwen. Ранее в этом месяце Alibaba представила другие AI-модели с открытым исходным кодом, стремясь привлечь всё больше пользователей.