“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
2024年,无论品牌达人孵化是否会涌现新的成功案例,这始终会是一个必要的尝试方向。
此外,有道还推出了虚拟人口语私教 Hi Echo2.0和有道速读,用于帮助学生提升英语口语能力和快速理解文档内容。
论文地址:https://mobile-aloha.github.io/resources/mobile-aloha.pdf