OpenAI再次举起屠刀🥊

🔸Sora使用Transformer架构，建立在DALL·E 3和GPT模型之上，可以生成长达一分钟的有运动、多机位视频。Sora的世界模型仍有非常多的问题，比如，一块饼干被咬过之后，却没有留下咬痕。OpenAI非常实在，把这些问题都写在了官网上。 🔸AI视频生成真正的难点是在文生视频，而非图生视频、视频生视频。各中奥妙在于，文生视频，需要根据指令，从文字解码出视频的时空逻辑，同时保证在这一逻辑下，画面中所有物体的运动、变化，符合要求，符合现实世界规律。 🔸图生视频、视频生视频，皆有“照猫画虎”的意味，因此反倒要简单一些。这也是为什么，市面上的AI视频生成，始终停留在2-4s的时长范围内——一旦超过了这个时长，视频的可控性和质量都将大大下降。 🔸在视频领域，字节的嗅觉更加敏锐。2023年11月，字节跳动发布PixdelDance，通过上一个视频片段尾帧，为下一个视频片段头帧提供指导的思路，在视频时长上有所突破，但截止到发稿时间，仍然没有开放用户测试。 🔸像OpenAI这样的企业，正屹立在市场上。他们几乎重现了当年Oracle市场领导力，一步快，步步快，降维打击所有竞争者。对于所有做模式、赶风口的机会主义创始人而言，巨头若要杀死你，恐怕也只会发生在一夜之间。 🔍完整内容可全网搜索「OpenAI再次举起屠刀，以及几个推论」查看

魔女团新闻

文智谈职场