- Опубликовано
ИИ‑рынок затишье: живой ИИ без революций
- Автор
- Имя
- Кибермаркетинг| AI+ опыт = деньги
- Telegram
- Кибермаркетинг| AI+ опыт = деньги5099 подписчиков446 постовАвторский канал про маркетинг и AI. Экономим время, не теряя в качестве!Личный опыт. Полезные ИИ сервисы. Современные тенденции. Я знаю, за что стоит платить, а что можно получить бесплатно. Контакт @ana_ai_marketing
Кажется, что на ИИ-рынке сейчас затишье. Нет ощущения, что каждую неделю «переворачивают игру».
Но если смотреть внимательнее , что-то всё равно происходит. Собрала несколько вещей, которые показались интересными.
1️⃣ Первая от NVIDIA.
Они показали живую голосовую нейронку. Не в смысле «читает текст», а именно разговаривает - без пауз, без роботских остановок, без этого вежливого, но мёртвого тона, который обычно сразу выдаёт ИИ.
С ней можно говорить одновременно, перебивать, поправлять, менять ход диалога на лету. Она делает смысловые паузы, использует междометия, иногда «угукает», подстраивается под темп и стиль речи. За один промпт можно задать роль, от учителя до банковского сотрудника или кого угодно, и она реально в это входит.
Плюс всё это опенсорс, можно встраивать куда угодно, в том числе в коммерческие проекты.
Демо версию пробуем на Hugging Face.
2️⃣ Вторая штука- визуальная. Krea после долгой паузы выкатили Realtime Edit, и вот это уже выглядит как следующий шаг.
Суть простая и одновременно немного магическая: ты берёшь фото, видео или даже 3D-модель и накладываешь генерацию прямо поверх. Всё редактируется в реальном времени. Можно двигаться и видеть, как картинка меняется вместе с вами. Задержка около 50 миллисекунд, поэтому ощущается почти как живое взаимодействие, а не «подожди, сейчас подумает».
Потыкать можно здесь.
3️⃣ И третье Alibaba. Китайцы открыли доступ к своим моделям для генерации речи. И это, пожалуй, самое мощное из всего списка.
Речь про линейку Qwen, в том числе Qwen3-TTS, которую раньше держали закрытой. Теперь её можно запускать даже локально. В связке там сразу несколько моделей: генерация речи, клонирование голосов, изменение тембра, пола, возраста, акцента, темпа. Поддержка десяти языков, включая русский. Почти полсотни голосов. Минимальная задержка, как заявлено, меньше десятой секунды.
Онлайн-демки лежат здесь.
В целом ощущение такое: громких революций нет, но под капотом ИИ становится всё более живым, быстрым и пригодным для реального использования.
#этостоитпротестить
Предыдущий пост
- Опубликовано
Почему знакомое побеждает в продажах B2B
Закрепленные
Из подборки #этостоитпротестить
- Опубликовано
3 уровня AI-навыков для маркетолога и предпринимателя
- Опубликовано
Что нового по видео?
- Опубликовано
Lucy 2.0: подмена человека в реальном времени
- Опубликовано
AI‑инструменты и база проваленных стартапов
- Опубликовано
ИИ боты в телеге
- Опубликовано
Режим "Jobs" в ChatGPT
Свежие посты
- Опубликовано
3 уровня AI-навыков для маркетолога и предпринимателя
- Опубликовано
Всем привет.
- Опубликовано
Субботнее для тестирования
- Опубликовано
Пропала, но заработалась: успеть до отпуска
- Опубликовано
ааа
- Опубликовано
3 инструмента, протестированные в выходные
- Опубликовано
Прогрев холодной аудитории для сложного продукта
- Опубликовано













