“头号AI玩家”整理汇总了近期海内外各大AI公司、AI研究者、风险投资人、科技媒体的主要观点,他们就生成式AI的未来、AI Agent、多模态、开源和闭源模型之争、AI安全等话题给出了自己的预测。尽管每个人的看法不同,但有一点可以确定:2024年有望成为生成式AI的决定性一年。
2024年将是AI视频之年@英伟达高级科学家 Jim Fan
“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
IDC的调研显示,97%的企业认可超级入口将成为未来的主流应用形态(调研对象:100家制造、医疗、互联网、金融、零售行业年收入超过5亿的大型企业)。
这个项目的开源意味着更多的开发者和研究人员可以使用这项技术,为其添加新的功能或者进行改进。DreamTalk的开源将为语音合成技术的发展带来新的动力。