AI日报:字节重磅推出豆包视觉理解模型;AI“魔改”宠物跳舞爆火;Op...

科技家的家人们 2024-12-19 16:28:37

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、字节推出豆包视觉推理大模型:价格低至0.003元/千token

在火山引擎FORCE原动力大会上,火山引擎总裁谭待发布了豆包视觉理解大模型,该模型通过结合文本和图像信息,展现出卓越的内容识别和推理能力。新模型的价格大幅降低,使得企业用户在智能化转型中更具信心。豆包大模型的日均tokens使用量已超过4万亿,显示出强大的市场需求和应用潜力。

【AiBase提要:】

🖼️ 新推出的豆包视觉理解大模型能同时处理文本和图像信息,提升内容识别和推理能力。

💰 自今年5月以来,豆包大模型的行业价格降低了99%,使企业用户更易于应用该技术。

📈 目前豆包大模型的日均tokens使用量超过4万亿,增长超过33倍,显示出其市场需求。

2、OpenAI开放满血o1模型API:成本降低60% 新增高级视觉处理能力

在为期12个工作日的连续直播活动中,OpenAI在第9天面向开发者发布了o1模型的API,并宣布对实时API进行重大升级,支持WebRTC技术。自发布日起,OpenAI将向API使用等级5级的开发者提供o1API的访问权限。此次更新的o1模型API相较于之前的预览版本,在思考成本上实现了60%的降低,并新增了高级视觉处理能力。同时,GPT-4o在音频处理上的成本也减少了60%,而mini版本的价格也大幅下降了10倍。

【AiBase提要:】

🚀 o1模型API发布,支持WebRTC技术,提升实时交互能力。

💰 成本降低60%,新增高级视觉处理能力,提升用户体验。

📈 周活跃用户超3亿,显示出OpenAI用户基数的快速增长。

3、Ideogram推出批量图像生成工具:告别繁琐操作,大规模创意图像一键生成

AI图像生成平台Ideogram近期推出了一项批量图像生成工具,旨在通过上传表格文件简化图像生成流程。用户可以在CSV文件中预先填写提示词和设置,Ideogram将根据这些信息自动生成图像。这一创新大幅提高了专业设计师和创意人士的工作效率,减少了逐条输入的繁琐操作。该功能目前仅对Ideogram Pro用户开放,展现了AI在设计领域的巨大潜力和智能化的创作方式。

【AiBase提要:】

🚀 批量生成工具允许用户上传包含提示词的表格,简化图像生成流程。

🖼️ 用户只需下载模板、生成提示词并上传CSV文件,即可自动生成图像。

💼 该功能目前仅对Ideogram Pro用户开放,为设计师提供了高效的创作体验。

4、即梦AI上线海报生成功能 可一键将静态海报变为动态海报

即梦AI在2024年12月18日的火山引擎FORCE大会上推出了全新的海报生成功能。这项技术的发布标志着图像生成领域的一次重要进步。用户只需输入一句简单的描述,系统便能快速生成创意海报,大幅简化了传统设计所需的时间与技能要求。此外,新增的动态海报生成功能为内容创作者提供了更丰富的展示方式,尤其适合社交媒体和广告使用,能够有效吸引观众注意力,提升营销效果。

【AiBase提要:】

🌟 用户只需一句描述,即可快速生成创意海报,简化创作过程。

🎥 新增动态海报生成功能,让作品展示更生动,适合社交媒体和广告使用。

📈 即梦 AI 考虑用户个性化需求,提供灵活的内容生成选项,助力品牌推广。

5、扣子1.5版正式推出:支持多模态能力 可第一时间体验豆包新模型

扣子Coze在火山引擎FORCE原动力大会上推出了全新版本的扣子1.5,标志着在AI应用开发领域的重要进展。此版本支持GUI搭建界面,用户可轻松创建和发布多种应用形式,极大地降低了开发门槛。同时,扣子1.5增强了多模态能力,支持最新的豆包大模型,提供丰富的模板和解决方案,助力开发者提升效率,已吸引了超过100万活跃开发者。

【AiBase提要:】

🖥️ 扣子1.5支持GUI搭建界面,用户可一键发布多种应用形式,降低开发门槛。

🌐 多模态能力显著增强,支持豆包视觉理解、音乐和图像生成模型,扩展AI应用范围。

📊 提供海量精品模板,覆盖多业务场景,提升开发效率,吸引了超过100万活跃开发者。

详情链接:https://www.coze.cn/docs/guides/vlm

6、字节跳动:豆包视频生成模型将于2025年1月正式对外开放服务

在2024火山引擎FORCE原动力大会·冬上,火山引擎展示了豆包大模型家族的全新升级,日均tokens使用量超4万亿,增长显著。大会推出了视觉理解模型及多个模型的升级,提升了豆包通用模型pro的综合任务处理能力。此外,火山引擎发布了支持AIGC创作的veOmniverse+豆包·3D生成模型,并宣布豆包·视频生成模型将于2025年1月正式对外开放服务,标志着大模型技术的深入发展。

【AiBase提要:】

🌟 豆包大模型日均tokens使用量超过4万亿,增长超过33倍,显示出广泛应用。

🛠️ 新发布的veOmniverse+豆包·3D生成模型支持高保真3D资产生成和编辑,提升AIGC创作能力。

📅 豆包·视频生成模型将于2025年1月正式对外开放服务,用户可预约体验。

7、字节跳动火山引擎全域AI搜索发布:支持多模态搜索

在2024火山引擎FORCE原动力大会·冬上,字节跳动推出了全域AI搜索服务,旨在通过整合多种信息和需求,提升企业的推荐精准度和信息发现能力。该服务依托强大的A1搜推引擎,支持多模态理解,能够快速处理海量内容并提供实时热点答案,增强用户体验。同时,火山引擎还推出了大模型记忆方案,助力客户构建高效的记忆系统,这是大模型发展的重要方向。

【AiBase提要:】

🌐 火山引擎全域AI搜索整合了场景化搜索、企业私域信息和联网问答服务,提升信息推荐的精准性。

⚙️ A1搜推引擎利用豆包大模型家族的技术,支持文本、图像、音频和视频等多模态理解,适用于多种应用场景。

💡 大模型记忆方案结合上下文缓存和RAG技术,帮助客户构建有效的记忆系统,提升大模型的记忆能力。

8、微信上线“作者朗读音色”新能力

微信平台推出的“作者朗读音色”功能,允许公众号作者用个性化语音为文章配音,提升了阅读体验的互动性和个性化。作者需下载“订阅号助手”APP录制语音,复刻个人语气和情感,并可在公众号中应用。此功能目前处于灰度测试阶段,尚未全面开放,微信鼓励创作者耐心等待。此举标志着微信在提升用户体验和满足创作者需求方面的重要进展,预计将丰富公众号内容表现形式。

【AiBase提要:】

🎧 作者可通过个性化语音为文章配音,增强互动体验。

📱 需要下载“订阅号助手”APP录制语音,复刻个人风格。

🔄 功能目前处于灰度测试阶段,尚未全面开放。

9、英伟达发布生成式AI超级电脑:仅249美元 性能提升1.7倍

英伟达推出的Jetson Orin Nano Super是一款面向开发者的生成式人工智能超级电脑,定价249美元,性能提升显著,适用于多种AI应用场景。该设备在生成式AI性能上提升了1.7倍,并且在内存带宽和运算能力方面也有显著进步。黄仁勋强调,该设备以更低的成本为开发者提供卓越的运算性能,展现出在智慧城市、农业及机器人开发等领域的广泛应用潜力,标志着AI技术的普及与应用迈出了重要一步。

【AiBase提要:】

🚀 性能提升:Jetson Orin Nano Super的生成式AI性能提升了1.7倍,内存带宽提高50%。

💰 亲民定价:该设备定价为249美元,适合开发者使用,降低了AI技术的门槛。

🌍 广泛应用:支持多种功耗场景,适用于智慧城市、农业和机器人等多个领域。

10、OpenAI表态:暂未计划推出 Sora API,视频生成需求超预期

OpenAI最近宣布,暂时没有推出其视频生成模型Sora的API计划,原因在于用户需求远超预期。Sora能够根据文本或图像生成逼真视频,但由于申请用户激增,OpenAI不得不暂停新用户注册。CEO山姆·阿尔特曼对此表示歉意,并强调解决这一问题需要时间。与此同时,竞争对手谷歌和AWS已推出各自的视频生成API,OpenAI面临着市场压力,未来的策略备受关注。

【AiBase提要:】

🌟 OpenAI表示暂无Sora API推出计划,因需求远超预期。

📈 Sora因用户申请激增而暂时关闭注册,CEO对此表示歉意。

🤖 谷歌和AWS等竞争对手已推出视频生成API,OpenAI面临压力。

11、AI“魔改”宠物跳舞爆红网络:猎奇、荒诞成流量密码

近期,AI生成的宠物跳舞视频在抖音上引发热潮,展现出荒诞与搞笑的完美结合。这些视频中的猫狗们瞬间化身舞蹈高手,带来了强烈的视觉冲击和戏剧性。尽管部分观众对这种奇特的视觉体验感到不适,但它们无疑挑战了我们对动物形象的固有认知,展示了AI技术的无限可能性与创意。

【AiBase提要:】

🎉 AI生成的宠物舞蹈视频在抖音迅速走红,播放量已达8.8亿次。

😹 视频中的宠物展现出超现实的舞蹈动作,打破了传统认知,带来强烈的视觉冲击。

🤖 这些视频不仅是技术的展示,更是娱乐和创意的新维度,挑战了人们对动物形象的理解。

12、不需要喂食也能陪伴你 AI宠物Moflin在小红书走红

Moflin是一款新型AI宠物,因其可爱的外形和情感互动特性在小红书上迅速走红。用户通过视频分享与Moflin的互动体验,吸引了众多网友的关注。尽管Moflin无法替代真实宠物,但其提供的情感陪伴满足了现代人的需求,成为一种新的消费趋势。Moflin的情感模拟和个性化互动使其在市场上具备了巨大的溢价空间,成为一种新型的情感陪伴产品。

【AiBase提要:】

🐾 Moflin是一款情感互动的AI宠物,外形可爱,吸引了大量网友关注。

💰 其售价为2832人民币,上市后迅速售罄,显示出强大的市场需求。

❤️ Moflin通过模拟情感与用户互动,满足了人们对情感陪伴的需求。

详情链接:https://www.moflin.com/

13、波士顿动力裁员5%,因资金压力急需转型

波士顿动力公司近期宣布裁员5%,约45名员工受到影响,几乎涵盖所有部门。公司面临严峻的财务压力,尽管其机器人产品如Spot和Atlas在市场上受到关注,但商业发展未达预期。CEO罗伯特・普莱尔指出,资金消耗速度超过收入增长,迫切需要优化运营以实现可持续发展。在竞争激烈的市场环境中,波士顿动力需应对特斯拉等公司的压力,转型成为当务之急。

【AiBase提要:】

🦾 波士顿动力裁员5%,约45名员工,涉及几乎所有部门。

💰 公司面临资金消耗过快的问题,迫切需要精简运营以实现可持续增长。

🤖 市场竞争加剧,波士顿动力需应对来自特斯拉等公司的压力,且难以将媒体关注转化为盈利。

14、数百名OpenAI员工即将通过私人股票出售获得1000万美元巨额收益

最近,OpenAI宣布将为软银进行16亿美元的股票回购,数百名现任及前任员工将有机会通过这一交易获得高达1000万美元的收益。这一消息引发了广泛关注,尤其是对于那些早期加入公司的员工而言,他们可能会实现财务自由。此次股票出售不仅激励了员工,也加强了公司与投资者之间的信任关系,显示出OpenAI作为创新型公司的潜力与价值。

【AiBase提要:】

💰 数百名现任及前任 OpenAI 员工将有机会通过股票回购获得高达1000万美元的收益。

📈 OpenAI 为软银提供的16亿美元股票回购提议吸引了广泛关注。

🤝 此次股票出售不仅激励员工,也增强了公司与投资者之间的信任关系。

0 阅读:0