🌐 开源意义: DreamTalk的开源将为语音合成技术的发展提供新的动力,吸引更多开发者和研究人员参与,拓展项目功能和改进技术。
2024年将是视频之年。虽然机器人和嵌入式代理才刚刚起步,但我认为AI视频将在未来12个月内迎来突破性发展。包括输入和输出两个方面。
“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
肉眼可见的是,地震预测正在发生范式转变。
3、从严打击涉违规营利行为的自媒体”