Подписаться
Опубликовано

ИИ‑рынок затишье: живой ИИ без революций

Автор
  • Имя
    Кибермаркетинг| AI+ опыт = деньги
    Telegram

Кажется, что на ИИ-рынке сейчас затишье. Нет ощущения, что каждую неделю «переворачивают игру».

Но если смотреть внимательнее , что-то всё равно происходит. Собрала несколько вещей, которые показались интересными.

1️⃣ Первая от NVIDIA. Они показали живую голосовую нейронку. Не в смысле «читает текст», а именно разговаривает - без пауз, без роботских остановок, без этого вежливого, но мёртвого тона, который обычно сразу выдаёт ИИ.

С ней можно говорить одновременно, перебивать, поправлять, менять ход диалога на лету. Она делает смысловые паузы, использует междометия, иногда «угукает», подстраивается под темп и стиль речи. За один промпт можно задать роль, от учителя до банковского сотрудника или кого угодно, и она реально в это входит.

Плюс всё это опенсорс, можно встраивать куда угодно, в том числе в коммерческие проекты.

Демо версию пробуем на Hugging Face.

2️⃣ Вторая штука- визуальная. Krea после долгой паузы выкатили Realtime Edit, и вот это уже выглядит как следующий шаг.

Суть простая и одновременно немного магическая: ты берёшь фото, видео или даже 3D-модель и накладываешь генерацию прямо поверх. Всё редактируется в реальном времени. Можно двигаться и видеть, как картинка меняется вместе с вами. Задержка около 50 миллисекунд, поэтому ощущается почти как живое взаимодействие, а не «подожди, сейчас подумает».

Потыкать можно здесь.

3️⃣ И третье Alibaba. Китайцы открыли доступ к своим моделям для генерации речи. И это, пожалуй, самое мощное из всего списка.

Речь про линейку Qwen, в том числе Qwen3-TTS, которую раньше держали закрытой. Теперь её можно запускать даже локально. В связке там сразу несколько моделей: генерация речи, клонирование голосов, изменение тембра, пола, возраста, акцента, темпа. Поддержка десяти языков, включая русский. Почти полсотни голосов. Минимальная задержка, как заявлено, меньше десятой секунды.

Онлайн-демки лежат здесь.

В целом ощущение такое: громких революций нет, но под капотом ИИ становится всё более живым, быстрым и пригодным для реального использования.

#этостоитпротестить

Кибермаркетинг| AI+ опыт = деньги
5099 подписчиков
446 постов
Авторский канал про маркетинг и AI. Экономим время, не теряя в качестве!Личный опыт. Полезные ИИ сервисы. Современные тенденции. Я знаю, за что стоит платить, а что можно получить бесплатно. Контакт @ana_ai_marketing

Закрепленные

Опубликовано

3 уровня AI-навыков для маркетолога и предпринимателя

Уровни AI-навыков для маркетолога и предпринимателя: Base, Normal, Pro
Опубликовано

Что нового по видео?

AI‑инструменты для видеопродакшн: Higgsfield превращает анимацию в кино, Genie 3 генерирует виртуальные миры, Luma AI делает цифрового актёра
Опубликовано

Lucy 2.0: подмена человека в реальном времени

Lucy 2.0 AI замена лица в реальном времени: как работает, возможности и ограничения
Опубликовано

AI‑инструменты и база проваленных стартапов

AI‑инструменты для создания бизнес‑плана и открытая база проваленных стартапов для анализа
Опубликовано

ИИ боты в телеге

ИИ боты в Telegram: подборка сервисов для транскрибации генерации текста изображений и аудио

Свежие посты

Опубликовано

3 уровня AI-навыков для маркетолога и предпринимателя

Уровни AI-навыков для маркетолога и предпринимателя: Base, Normal, Pro
Опубликовано

3 инструмента, протестированные в выходные

Инструменты для тестирования в выходные: генерация комиксов, поиск CAD‑моделей, Claude в PowerPoint
Опубликовано

Прогрев холодной аудитории для сложного продукта

Как прогреть холодную аудиторию для продажи сложного продукта с помощью ИИ