风声|被吹爆的Sora ,为何恐怕是过誉了?

类别:资讯动态_热门资讯   时间:2024/3/21 10:00:10   点击:51   标签:世界 物理 视频 模型 蜡烛 人物 画面 语言 文本 人类 教授 现实 空间 算法 影视 作者 稿件 图像 时空 公司 代表 凭空出现 大力 像素 凤凰网 时间 背景 无法 涨幅 产生 编辑 立场 效果 原创 本质 真实世界 关系 股史 因果律 谢赛宁 险峰 丘成桐 所需 秒杀 助力 问世 纹理 集体 近于零 顾问 边界 挖坟 过程 框架 局部 高清 梦幻 重塑 量身 镜子 技术 毛发 编剧 边际 战略 虚幻 业界 方式 同款 基本 一键 体验 产业 故事 人会 代差 动画 工会 成本 连带 一致性 可能性 赛道 吹熄 初创 细节 风格 随风飘扬 变形 评论部 重力 噪音 刚性 长程 表观 情况 建构 奇迹 图灵奖 镜头

作者| 刘正Simon Kucher 战略咨询顾问无需赘述,2024开年大事件就是Sora,几乎所有人都见识了Sora带来的震撼:极为细腻,真实渲染,情节连续,可持续60秒的视频,如同这不可能存在的冬日樱花一样,模糊了真实和虚幻的边界。仿佛回到ChatGPT问世的那一天,OpenAI又一次震撼了世界。在碾过一整条赛道AI初创公司的同时,连带着助力NVIDA拿下美股史上最大涨幅(以市值计算)。看着这一片欣欣向荣的狂欢,仿佛这次真的要被西方先进生产力按在地上摩擦了。所以真的有这么可怕吗?从技术上看,Sora恐怕是过誉了经过数日的挖坟,业界逐渐了解到Sora是基于纽约大学助理教授谢赛宁和学生Bill Peebles (如今任职于OpenAI)共同发表的Diffusion Transformer(DiT)的思路来开发的。Diffusion是常见的文生图算法,通过给已标注的图片加噪点直至“扩散”成完全的白噪音状态,那么将这一操作倒过来就实现了按标注从白噪音中生成与文本…

扫描关注微信号有更多的信息,点击可缩放大小