【东北数字经济】豆包开源视频生成模型，多模态模型奇点时刻或将到来事件：豆包团队

潘欣然谈娱乐 2025-02-11 00:04:19

【东北数字经济】豆包开源视频生成模型，多模态模型奇点时刻或将到来

事件：豆包团队发布视频生成实验模型“VideoWorld”。2月10日中午，豆包大模型团队发布视频生成模型最新成果“VideoWorld”，在业界首次实现无需依赖语言模型，即可认知世界。

VideoWorld仅依赖视觉数据进行训练并取得良好效果。当前主流视频生成模型如Sora、DALL-E、Midjourney，主要依赖语言和标签数据进行知识学习。VideoWorld去掉了语言模型，以包含大量视频演示的数据集为训练数据。同时该模型引入潜在动态模型（LDM）对帧间视觉变化进行压缩，提高模型的知识挖掘效率。VideoWorld 在仅有300M的参数量下，且不依赖任何强化学习中的搜索或奖励函数机制，达到专业 5 段的 9x9 围棋水平，能够在多种环境中执行机器人任务，并在不同环境中表现出良好的泛化能力。

VideoWorld的视觉因果理解能力提升，利好视频制作、自动驾驶等方向。我们认为，VideoWorld仅依赖视频数据喂养，一方面使模型能够更加充分地学习视频隐含的物理、因果规则，改善训练效果，另一方面也降低了训练成本和难度。根据研究案例，目前该模型在围棋和模拟机器人操控中展现了卓越性能，预计未来该模型有望改善视频生成的效果和物理世界理解能力，赋能于电商、设计、自动驾驶等多个应用场景。

相关标的：

视频制作及生成：万兴科技、美图公司

自动驾驶：虹软科技

0 阅读：26

潘欣然谈娱乐

感谢大家的关注

作者最新文章

1

这竟然是贾静雯以前的剧照。

2

秒懂集合竞价

3

我们都说炒股要了解人性，那可以从哪里了解人性呢？我分享两个途径。1、日常生活日常

4

大摩-DeepSeek：对美国电力基础设施的影响DeepSeek的消息引发了与人

5

微软CEO纳德拉称DeepSeek“有一些真的创新”，并认为AI成本下

6

【浙商计算机刘雯蜀/陶韫琦】海外AI厂商电话会AI相关要点速览微软 Mic

7

华为鸿蒙简单梳理！华为旗下的鸿蒙是中国人自己的国产操作系统，从此在系统方便不用担

8

新的裁员方式出现了[允悲]

9

谁是旺夫脸？

10

低空经济！

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

娱乐TOP

1

具俊晔放弃大S遗产具俊晔声明有2则重点：1.所有的遗产，熙媛在生前为了保护她

2

王菲看了受得了吗？

3

大S今天的结局，源于她做错的3件事：1.她结婚之后应该跟汪小菲住北京。本来她嫁

4

小S说，我姐夫汪小菲动不动就叫120，我姐手出血，他也要大惊小怪的叫救护车，太离

5

杨颖看完疯马秀后拍的照片你怎么看[并不简单][并不简单][并不简单]

6

大S生前的最后两条微博

7

“迷倒”刘强东的蒋聘婷，到底有什么魅力？看完生活照就理解了！

8

大S一家果然不是一般人，7大疑点，想想就让人害怕！似乎在掩盖什么。第一、大S

9

原来真的有心灵感应！大s生命最后一刻，可能在向汪小菲求救！虽然汪小菲远在泰国，但

10

白鹿在宣传片里那件衣服挺透的，她自己不知道吗

娱乐最新文章

1

《哪吒2》去美国上映这事儿，简直离谱到家了。就上映6天，票价还定到25美元，虽说

2

陈思诚这波操作彻底玩明白了！拍《唐人街探案1900》砸5个亿不请顶流，反而在山东

3

不好意思智商不够，没看懂饺子导演用心良苦原来从一开始，反派早就出来了你们仔

4

《蛟龙行动》扑街不是没原因，这3个雷它全踩了！先吐槽演员，挑来演硬汉的都是些

5

柳岩大腿内有这么大的纹身？这纹的是什么啊？感觉她很叛逆。

6

突然就理解沈腾了！

7

王菲看了受得了吗？

8

刘晓庆年轻时有一次在法国坐出租车，司机是位黑人，这位司机告诉刘晓庆，他和一位中国

9

本次春节档最赚和最亏的电影出来了，哪吒2成本4亿，史诗级巨赚。唐探花了5亿，

10

最嫉妒饺子导演的5个人：1，第一个是：导演宁浩，2024年上映的《红毯先生》，