从Siri到专属端侧大模型,这一次,智能手机真的有了“智慧”?

智微科技 2024-01-29 19:19:44

最近几天,微软市值一度反超苹果的消息,引起了资本市场的沸腾。

微软,这个曾经PC时代的王者,一度在移动互联网时代掉队,如今重新拿回“全球市值最高公司”的头衔,最主要的原因就是,它多次用巨额资金“押注”了初创公司OpenAI。

一年多以前,OpenAI推出的ChatGPT掀起全球AI热潮,而作为最大股东兼合作伙伴的微软,公司市值也在一年多时间里暴涨了一万亿美金,再次反超苹果。

ChatGPT横空出世,影响的不止是资本市场,而且带动整个AI产业。

在刚刚过去的2023年,AI的一举一动,都备受关注。尤其是技术驱动的大数据模型,更是在一夜之间几乎能胜任各种各样的工作,撑起了我们对AI向往,成了科技发展的新方向。

但AI潜能并不是一夜爆发,在数据大模型出现之前,很多行业都在尝试并应用了它。比如,我们天天握在掌中的智能手机,就在AI应用上进步最快的产品。

很多人对手机AI的最初认识,是2011年被应用到iPhone 4S上的智能语音助手——Siri。

在那个苹果手机还在引领智能手机技术风潮的年代,一声“HI Siri”,手机就可以帮用户完成一系列的动作,从设定闹钟,到播放音乐,又或者调用系统查询天气预报……这个市场上没有出现过的“语音助手”似乎都能应对。

但由于手机算力有限,Siri这个语音助手有着明显的短板:绝大多数问题,只能机械式的回答;而遇到复杂问题时,只能跳转到浏览器的网页。正因由此,互联网上一度流传着很多Siri傻瓜式回答的搞笑段子。

随后几年,人脸识别、指纹解锁、深度学习等AI技术,先后在手机上落地,满足了用户在手机使用过程中的多种需求。而让用户使用体验感最强,也最具代表性的当属在影像上的应用。

比如,影像的美颜处理,画面亮度的整体提升,视频的防抖处理,人像图片的背景虚化……背后都有AI的参与。

而在ChatGPT这类大模型快速崛起后,主流手机厂商也纷纷涉足AI大模型,并尝试将大模型在硬件上落地;在端侧AI的帮助下,手机影像能力的提升更加突出。比如,OPPO最近发布的旗舰机型Find X7系列,并率先在手机端应用了70亿参数的AI大模型,使得多个相关功能既实用又有惊艳的效果呈现。

日常拍照,尤其是外出拍照时,可能一不小心就会有路人或者杂物入镜。删除吧,舍不得;留下吧,却达不到想要的效果;只能让它们静静躺在手机相册中。

Find X7系列在端侧大模型的帮助下,具备了OPPO AI消除功能。该功能支持路人、物体等多类型元素的“发丝级”识别与消除,还会将消除后的区域,进行自然的画面填充,一秒就可以无痕拯救废片。

比如下面动图显示,该功能地把吴磊对面的障碍物清除,同时补全了对应位置上的背景和道具,画面变得干净又聚焦,AI生成的部分图像,不仅看不出任何P图的痕迹,没有其他手机AI消除后带来的涂抹和塑料感。

基于大模型和AI深度计算的双重加持,Find X7 Ultra的专业哈苏人像模式再度进化,告别了那种“十级美颜滤镜”式傻白傻亮傻磨皮的人像,将哈苏专业人像“渐进式的虚化”调教得更加细腻,也更接近高端相机实拍出的效果。

从实拍样张来看,我们能十分直观地感受到Find X7 Ultra的虚化能力有多出色,复杂的背景光源,被调教得十分柔和,而人像衣服的纹理、许多细小的头发丝保持着清晰的细节表现,真正是做到了“发丝级”虚化效果。

Find X7 Ultra还首次做到了只有相机才有的“回眸人像”功能。

在都有的瞬时双帧技术的加持下,Find X7 Ultra能在极短时间内采集长短两帧图像,其中短帧捕捉瞬时画面,长帧保证画质,两者叠加,就能记录画质和色彩都媲美哈苏相机水准的画面。

从实拍样张看,风好吹起发丝那一刻,阳光透过发丝那一瞬间,画面定格,留下心动人像抓拍。

除影像之外,Find X7系列还基于大模型能力,带来了目前手机唯一的AI大模型“语音通话摘要”功能,史上升级幅度最大的小布助手;通过自研语音降噪大模型,在重噪和强干扰的条件下,能够实现人声通话增强的效果……使用场景更多更丰富。

端侧大模型融入手机系统,不止会提升手机的图像处理、语言处理等功能,而且还会更灵活地响应用户需求,随着用户的使用,不断加深对用户个性化习惯的理解、记忆,预测用户的行为并提前进行优化,变得越来越聪明,越来越智能,直至彻底改变用户的使用体验。

或许用不了多久,终端侧AI在手机上的应用,真的有可能再次改变手机的形态,让手机从智能机走向智慧机。

万事开头难,以黑厂为代表的国产手机厂商已经迈出了第一步,变革已经开始,剩下的交给时间。

0 阅读:2