OpenAI再次举起屠刀🥊

文智谈职场 2024-02-22 12:08:26
🔸Sora使用Transformer架构,建立在DALL·E 3和GPT模型之上,可以生成长达一分钟的有运动、多机位视频。Sora的世界模型仍有非常多的问题,比如,一块饼干被咬过之后,却没有留下咬痕。OpenAI非常实在,把这些问题都写在了官网上。 🔸AI视频生成真正的难点是在文生视频,而非图生视频、视频生视频。各中奥妙在于,文生视频,需要根据指令,从文字解码出视频的时空逻辑,同时保证在这一逻辑下,画面中所有物体的运动、变化,符合要求,符合现实世界规律。 🔸图生视频、视频生视频,皆有“照猫画虎”的意味,因此反倒要简单一些。这也是为什么,市面上的AI视频生成,始终停留在2-4s的时长范围内——一旦超过了这个时长,视频的可控性和质量都将大大下降。 🔸在视频领域,字节的嗅觉更加敏锐。2023年11月,字节跳动发布PixdelDance,通过上一个视频片段尾帧,为下一个视频片段头帧提供指导的思路,在视频时长上有所突破,但截止到发稿时间,仍然没有开放用户测试。 🔸像OpenAI这样的企业,正屹立在市场上。他们几乎重现了当年Oracle市场领导力,一步快,步步快,降维打击所有竞争者。对于所有做模式、赶风口的机会主义创始人而言,巨头若要杀死你,恐怕也只会发生在一夜之间。 🔍完整内容可全网搜索「OpenAI再次举起屠刀,以及几个推论」查看

0 阅读:1