您的位置首页 >创业新闻 >

0.6秒!手机跑Stable Diffusion创下最快速度,而这仅仅是开始

  导语:如今,随着将大模型塞进手机的进程加快,普通用户也能亲自体验生成式AI的魅力了。

  2023 已经行至尾声,这一年大模型和生成式 AI成为人工智能圈的主流趋势。自ChatGPT 出现以来,各式各样通用、专业的 AI 大模型层出不穷,喷涌之势已经不可阻挡。随着量化、网络剪枝和知识蒸馏等模型压缩技术进步,手机等终端设备AI算力持续增强,大模型在云端部署之外正在向终端落地迈进。

  

1700119921105038.png

 

  对于这场已经拉开了序幕的「终端侧革命」,芯片巨头和手机厂商们成为主力军,他们不断尝试在手机等终端设备上部署运行生成式AI大模型,时不时给人们一点小小的惊喜和震撼。

  今年2月,我们第一次看到了在手机上运行超过10 亿参数的文生图大模型Stable Diffusion。那是在一部搭载高通第二代骁龙 8移动平台的安卓手机上运行的,不到15秒的时间执行20步推理,生成了一张512×512像素的图像。这也创造了当时智能手机上最快的推理速度。

  

 

  你以为这就是手机运行Stable Diffusion的速度极限了吗?显然不是。在上个月举行的2023骁龙技术峰会上,不到15秒的生成时间又被整整缩短数十倍。高通最新旗舰移动平台第三代骁龙8(以下简称骁龙8 Gen 3)让速度飞升成为可能。

  在峰会现场,高通用搭载了骁龙 8 Gen 3的手机运行相同的Stable Diffusion大模型,这次不到1秒(0.6秒)的时间便在本地生成了一张图像。从15秒到0.6秒,终端侧生成式AI大模型的进化速度让我们惊叹不已。

  

 

  这只是高通在本届骁龙技术峰会上展示其终端侧AI能力的牛刀小试。除了生成速度(从 15 秒到 0.6秒)有了质的飞跃,骁龙8 Gen 3将支持运行的大模型参数规模(从10亿到百亿)提升一个量级。

  大模型赋能平台也不再局限于手机,高通下一代 AI PC 芯片骁龙X Elite亮相,将百亿参数大模型「塞进」PC平台,极大拓展了生成式AI应用的广度。

  至此,高通在终端侧AI领域积累起来的领导力和技术领先性进一步得到加强,更赋予了手机、PC,甚至耳机等厂商更多终端AI落地的想象力和可能性。

  双平台并进,让生成式AI更加触手可及

  自今年2月以来,高通先后在搭载第二代骁龙8移动平台的安卓手机上运行Stable Diffusion、ControlNet,让大模型跑在手机端成为现实。此次骁龙峰会上发布的骁龙 8 Gen 3 将大模型终端侧落地的潜力提升到了新的高度,使其自身继续在该领域引领潮流。

  

 

  据了解,骁龙8 Gen 3采用的高通AI引擎拥有面向移动终端的强大Hexagon NPU,集成了升级后的硬件加速单元、微切片推理单元、加强张量、标量和矢量单元,所有单元共享 2 倍带宽的大容量共享内存。同时支持 INT8+INT16的混合精度以及 INT4、INT8、INT16和FP16的所有精度。性能较前代提升98%,能效提升40%。

  骁龙 8 Gen 3 集成的高通传感器中枢也更强,拥有2个始终感应ISP、2个micro NPU和1个DPS,内存增加了30%,支持INT4精度,AI性能提升了3.5倍。

  

1700119954542952.png

 

  可以说,骁龙 8 Gen 3赋予了手机前所未有的强大终端侧AI性能,成为高通首个专为生成式AI打造的移动平台。那么这款旗舰级移动平台是否名副其实呢?这是我们大家最为关心的问题。

  在该平台上,高通AI引擎首次支持多模态生成式AI,包括了多种大语言模型、视觉语言模型等。尤其是在终端侧,骁龙8 Gen 3 首次支持运行 100亿参数的模型,规模迈入百亿量级。同时将 Stable Diffusion 生成图像的时间降到了1秒之内,再次创下最快速度。

  在跑Meta大语言模型Llama2-7B时,骁龙8 Gen 3每秒可以生成20个token,同样是手机终端侧最快之一。

  

1700119962158195.png

(图注)高通产品管理高级副总裁Ziad Asghar

  骁龙平台已经支持运行OpenAI、Meta、微软、安卓、stability.ai、BLOOM、百度、智谱、百川智能、有道等企业或机构的大模型,既为这些厂商将自身大模型能力「下放」到终端侧提供契机,也为用户体验生成式AI带来了丰富的选择项。

  牵一发而动全身,随着高通在赋能大模型终端落地上的进一步动作,采用骁龙 8 Gen 3移动平台的手机厂商快速跟进,加速了大模型集成到手机的进程。

  以首发搭载骁龙 8 Gen 3移动平台的小米14系列新机为例,AI大模型技术已经集成到小米全新澎湃 OS 中,并上线各种终端侧应用。有了大模型能力加持,小米14 支持了 AI 妙画、AI搜图、AI写真、AI扩图等多项功能,让输入法、WPS、相册焕发新的活力。

  

20231116154221_485401700120541.gif

 

  vivo旗下品牌iQOO 12系列同样搭载了骁龙8 Gen 3移动平台,全新高通AI引擎使其影像体验大幅升级,照片质感和细节拉满。同时该系列手机预装的 OriginOS 4系统引入生成式AI功能,AI助手蓝心小V可以进行超能语义搜索、超能问答、超能写作、超能创图、超能智慧交互,智能化程度明显提升。

  

 

  此前在骁龙峰会上,荣耀CEO赵明宣布新旗舰手机荣耀Magic 6将搭载骁龙8 Gen 3移动平台,已支持70亿参数的终端侧AI大模型,为用户提供更加智能化的体验。他在现场演示了终端侧AI进行照片搜索、生成视频等智能操作,效果着实不错。

  

 

  手机终端融合大模型能力催生了大量或好玩、或有助于提升生产力的生成式 AI应用。未来更加丰富的生成式AI应用会让更多用户切身体验到 AI的魅力,提升自身交互体验,这也正是高通致力于在终端侧打造生成式AI能力的重要源动力之一。

  在持续利用AI赋能手机移动平台之外,高通也在寻求利用并把握好大模型及生成式AI的发展契机,以此来重塑PC行业,扩大自身在AI领域的领先优势。

  生成式AI有了「第二阵地」

  高通发布了面向PC 平台的全新处理器骁龙X Elite,它采用4nm制程工艺,集成定制的高通Oryon CPU,运行速度是英特尔 12 核处理器的 2倍,功耗比英特尔竞品低68%,高峰时段的运行速度比苹果M2快了50%。

  如果这些参数还无法让你相信骁龙X Elite的强悍,那就跑个分吧。骁龙 X Elite 拥有两个版本:注重续航表现的 23W 版本、主打性能的 80W版本。Geekbench 6测试下的单核和多核得分情况如下图所示,单核性能尤为亮眼。

  

1700119997165467.png

(图注)图源fonearena

  同样地,骁龙X Elite专为AI打造。它采用业界领先的、集成高通Hexagon NPU的高通AI引擎,异构算力高达75TOPS,Hexagon NPU算力为45TOPS,为创意应用、视频会议和生产力助手的变革性体验提供了算力基础。高通 AI引擎还支持了大量的加速应用程序和体验,创造无限可能性。

  超强生成式 AI 能力也成为骁龙X Elite的一大标签,截止到发布时,它已支持在端侧运行超过130亿参数的生成式AI模型,面向70亿参数大模型每秒生成30个token,AI处理速度是竞品的4.5倍。下图为PC端AI作画能力的展示。

  

 

  从手机到 PC,多样化的端侧平台为释放生成式 AI能力提供了更多渠道。这也表明,高通在终端侧生成式AI落地这条赛道上继续「加码」,背后既离不开技术上的厚积薄发,也是其在大模型时代自身AI发展战略的延续。

  手机、PC加速迎来全新AI时代

  在当今大模型时代,终端侧部署生成式AI这条路线越来越明晰。基于此,高通秉持「混合AI是AI的未来」这一理念和战略,注重云端与终端的协同发展,并认为终端侧AI是扩展生成式AI至全球更广泛范围的关键。

  遵循这一前瞻性认知,高通一步步积累,逐渐在自身布局中构建了强大、全面的终端侧AI能力,并引领了端侧大模型及生成式AI的革新与进步。毫无疑问,此次骁龙峰会上发布的骁龙 8 Gen 3、骁龙X Elite将进一步夯实高通作为终端侧AI领导者的地位。

  

1700120012639500.png

(图注)高通全栈AI优化方案

  如果大模型继续保持当前的落地步伐,我们将可以在手机、PC 甚至XR可穿戴设备、智能网联汽车等智能终端上体验到更多生成式AI应用,让人机交互更加自然且个性化。反过来,这些生成式AI应用以及带来的体验变革也将对这些终端设备产生深远影响,甚至改变它们的核心驱动力,重新定义它们。

  我们以与人们日常工作、生活息息相关的手机为例,在追求绝对性能之外,人们越来越多地关注一些创意性应用。这就需要AI大显身手,生成式AI性能更是成为下一代手机处理器角逐的核心竞争力。

  骁龙移动平台近年来持续发力于此也在意料之中了。从去年的骁龙8 Gen 2 到此次骁龙峰会上的骁龙 8 Gen 3,AI 早已无处不在,生成式 AI 一跃成为「AI 皇冠上的新明珠」,受到了广泛关注和青睐。

  随着大模型及生成式AI在手机终端落地的范围越来越广、成熟度越来越高,我们或许可以看到:传统智能手机被生成式 AI 能力全方位加持的「AI 手机」所取代。小米等手机厂商新发布的旗舰机在这方面已经初具雏形,利用生成式AI增强一些场景的使用体验和效率,为未来颠覆手机的质变做好了充分的量变。

  同时,PC 终端的革新也有类似向生成式 AI 能力倾斜的发展趋势。在这方面,集成到Windows 中的微软 Copilot是一个很好的例证。当然还有更多生成式AI变革人类与 PC 交互的场景和方式,借此实现更高效的智能协作、更简化的工作流程、更强大的生产力、更定制化的使用体验。

  骁龙 X Elite 一出手便瞄准生成式 AI,势必会为当前的PC市场注入新鲜血液。在第六届虹桥国际经济论坛 ——「智能科技与未来产业发展」分论坛上,高通公司中国区董事长孟樸发表了主题演讲,认为下一代 PC 将进入一个全新的「AI PC」时代,以智能、高性能、高效等为特点, 并将对办公效率等方面产生重要意义。

  相信未来高通会在骁龙 8 Gen 3 等移动平台和骁龙 X Elite等PC平台的基础上,继续加强自身在大模型和生成式AI上的基础能力。加之更多搭载这些平台的厂商发布全新旗舰手机和 PC 产品,他们不断增强的自主性及自研能力可以让我们期待更多样化生成式AI应用的亮相。

  不过,在「AI 手机」和「AI PC 时代」真正到来之前,还要看生成式AI能力是否能让用户产生强烈感知、是否能准确满足他们的需求、是否能对相关应用产生依赖性、以及是否能带动他们换机的欲望,这些都是高通和手机厂商现在及未来要考虑的问题。

  结语

  自发布以来,骁龙 8 Gen 3、骁龙X Elite展现出的强大生成式AI能力留给人们无限的想象空间。 正如高通公司总裁兼 CEO 安蒙所言,「我们正在进入将改变用户体验的生成式AI时代,也将创造一个移动行业和计算行业的全新周期。」

  在这一进程中,作为终端侧领导者的高通正担负起应有的时代角色。一方面,利用自身强大的全栈AI优化能力汇聚软硬件各方,助力终端侧AI生态快速发展;另一方面,全新的跨平台技术「Snapdragon Seamless」实现安卓、Windows 和其他操作系统无缝衔接,这种多终端体验有望将 AI在手机、PC 等终端上的落地进一步拓展开来。

  可以预见,基于骁龙生态的AI体验会非常快速铺展开来,各种应用落地的速度也将大大加快。未来,高通将继续保持自身在终端侧AI的技术优势,推动大模型在部署应用时更便捷、更丰富、更有吸引力。同时,携手各大厂商创新基于大模型的生成式AI应用,降低普通用户使用生成式AI的门槛。

  随着新的生成式AI时代开启,高通是否能持续满足人们的期待,我想这次骁龙峰会已经给了我们答案。

  (文章转载自机器之心公众号)

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。