Подписаться
Опубликовано

QVQ‑Max визуальная модель Alibaba

Автор
  • Имя
    Кибермаркетинг| AI+ опыт = деньги
    Telegram

QVQ‑Max - флагманская визуально-языковая модель от Alibaba

Не много кто знает об этой модели, а она стоит нашего внимания. Это не просто инструмент “увидел и описал”, а полноценный «визуальный аналитик», способный не только понимать изображение, но и анализировать, давать рекомендации и генерировать сложные сценарии. Модель видит не пиксели, а структуру и логику — и может выдать связный, внятный анализ.

Что умеет:

🖊Поддерживает изображения высокого разрешения (до миллиона пикселей и соотношения сторон вне стандартов) .

🖊Значительно продвинутое визуальное рассуждение: может ответить на вопросы по диаграммам, объяснить математические задачи, понять сложные сцены .

🖊Сканирование мелкого текста на изображениях: отлично справляется даже с распознаванием табличных данных и документов на фото .

Я поработала с ней и результат мне зашел, она слушает тебя и слышит. Взяла из Битрикса BI дашборд с отчетом. Текста на нём немного, но есть графики, столбики, подписи и визуальные блоки. Задавала конкретные вопросы по нему.

Вот что модель точно может:

🔎Распознать и считать все подписи и числовые значения (работает даже с мелким текстом).

🔎Понять структуру графика: что за оси, какие переменные, где рост, где падение.

🔎 Ответить на конкретный вопрос: → «Какие три показателя в этом отчёте упали по сравнению с прошлым месяцем?» → «Что можно сказать о динамике user retention по возрастным группам?»

Тестировала на официальном сайте и бесплатно.

А еще анонсирована Qwen VLo — свежая нейросеть от Alibaba, которая работает с изображениями.

Пишут, что ее можно уже протестить на официальном сайте, но я не нашла. Буду ждать, так как вводные очень интересные:

Она строит изображение не сразу, а поэтапно, как будто бы реально прорисовывает: сначала компоновка, потом свет, детали, фактура. Поэтому меньше визуального мусора и нелепых искажений.

Что еще полезного: 🖊 Меняет строго по запросу — если просишь сменить пол, потолок останется на месте 🖊 Подстраивается под стиль: хочешь 60-е, хочешь киберпанк — сделает 🖊 Умеет выделять предметы и фон — удобно, если нужно, например, быстро вырезать вазу с цветами и вставить в макет 🖊 Работает с разными языками: можно писать на русском без дополнительных плясок с английским.

Подробнее можно почитать здесь.

#этостоитпротестить

Кибермаркетинг| AI+ опыт = деньги
5099 подписчиков
732 поста
Авторский канал про маркетинг и AI. Экономим время, не теряя в качестве!Личный опыт. Полезные ИИ сервисы. Современные тенденции. Я знаю, за что стоит платить, а что можно получить бесплатно. Контакт @ana_ai_marketing

Закрепленные

Опубликовано

Субботнее для тестирования

Субботнее для тестированияС опозданием, сорри, сорри. С инетом засада была вне дома вчера. Сегодня три штуки для тех, кто живёт в браузере и...
Опубликовано

В генерации картинок вышла интересная новинка — Reve 2.0.

В генерации картинок вышла интересная новинка — Reve 2.0. Главная фишка в том, что модель работает не просто как «один промт = одна картинка», а...
Опубликовано

Нейросеть DeepSeek и браузерный агент Kimi обновили и усилили

Нейросеть DeepSeek и браузерный агент Kimi обновили и усилили 1️⃣ DeepSeek: доработанная нейросеть, которая остаётся бесплатной Китайца DeepSeek...
Опубликовано

Из интересного

Из интересного1️⃣ Edit Banana - когда картинка внезапно становится редактируемойЭто не очередной «Фотошоп, но с ИИ», а штука, которая превращает...
Опубликовано

Прикладное. ИИ-сервис для субтитров: Hearica

Прикладное. ИИ-сервис для субтитров: HearicaПосле поста про видеогенерацию хочу отдельно показать сервис, который не делает «вау-ролики», но может...
Опубликовано

Параллельно очень интересно смотреть на

Параллельно очень интересно смотреть на Gemini Omni от Google. Это уже история не только про генерацию видео, а про более живые мультимодальные...

Свежие посты

Опубликовано

Самый важный эксперимент с ИИ за последнее время прошел почти незаметно

Самый важный эксперимент с ИИ за последнее время прошел почти незаметноНедавно наткнулась на очень интересный эксперимент от Emergence AI. На фоне...
Опубликовано

Несколько полезных находок для тех, кто работает с фото, видео и ИИ

Несколько полезных находок для тех, кто работает с фото, видео и ИИ1️⃣ Один сервис наконец-то научился нормально апскейлить видео и это Magnific ....
Опубликовано

Прикольное, Иишное.

Прикольное, Иишное. Китайский автор с помощью ИИ собрал короткометражку о роботе, который пытается найти любовь на Земле, захваченной зомби.На...
Опубликовано

Beautiful.ai

Beautiful.ai - переоценённый сервис или лучший ИИ для презентаций? Проверила и вот что заметилаПро Beautiful.ai часто говорят как про один из...
Опубликовано

Субботнее для тестирования

Субботнее для тестированияС опозданием, сорри, сорри. С инетом засада была вне дома вчера. Сегодня три штуки для тех, кто живёт в браузере и...
Опубликовано

В генерации картинок вышла интересная новинка — Reve 2.0.

В генерации картинок вышла интересная новинка — Reve 2.0. Главная фишка в том, что модель работает не просто как «один промт = одна картинка», а...