最新要闻
- 每日观点:39℃高温来袭!今起西安地铁调整运营时间
- 首发高频版骁龙8 Gen2!红魔8S Pro定档7月15日:170万分安卓天花板
- 即时:双枪快充 比亚迪猎跑SUV腾势N7上市定档:两张脸你中意哪个
- 用完成“蓝精灵”?多芬客服回应沐浴露现蓝光:没加荧光剂-天天新视野
- 2999元!努比亚首款AR智能眼镜Neovision Glass预约:6月28日开售_当前热文
- 骁龙8 Gen2+200W快充!iQOO 11S官宣:7月4日见_环球热门
- 世界报道:志愿怎么报?现场免费问!2023海南高招咨询会6月26日举办
- 济南市委书记会见张玉良 称一如既往支持绿地重点项目建设
- 环球时讯:暴雨红色预警信号!海口市灵山镇近1小时雨量已达83.5毫米!
- 《原神》3.8 版本爆料:“清夏!乐园?大秘境!”全新区域+玩法
- 2023年中级经济师《建筑与房地产》精选习题(15)
- Coser们最难应付的不是布料少的动漫角色,而是这种 全球报资讯
- 当前最新:皮海洲:拟套现后低息借款给前夫公司,“中国好前妻”意欲何为?
- 世界信息:普里戈任接受白俄缓和局势建议 其刑事立案将获撤销
- 10万韩元是多少人民币啊_韩元10万是多少人民币
- 高校招生咨询忙_全球时快讯
手机
世界快播:06月25日逸盛大化PTA为5750元
全国口岸办主任会议在合肥召开
- 世界快播:06月25日逸盛大化PTA为5750元
- 全国口岸办主任会议在合肥召开
- 画世界怎么办账号转移 操作方法介绍
- 每日信息:中国农业发展银行梨树县支行 还绿水青山于民
- 同程旅行与葛仙村联合推出2023葛仙村同程音乐节_环球动态
- 今亮点!微信QQ实现双向账号互通 可以微信登录QQ了
家电
天天报道:高通押注混合AI,终端侧或将运行100亿参数模型
2022年末,美国人工智能公司Open AI推出了ChatGPT对话模型,迅速风靡全球并快速迭代,其在不到4个月后又发布了能力更强大的GPT-4,而后乘胜追击,推出了联网和第三方应用插件功能,不断刷新人们对生成式AI强大能力的认知。毫无疑问,生成式AI带来的巨大机遇将成为业界变革的转折点。
然而,随着生成式 AI 模型使用量和复杂性的不断增长,仅在云端进行推理并“不划算”,因为包括硬件、场地、能耗、运营、额外带宽和网络传输在内的数据中心基础设施成本也将持续增加。而将一些处理从云端转移到边缘终端,则可以减轻云基础设施的压力并减少开支。这也是为何混合 AI 对生成式 AI 的规模化应用至关重要。
高通技术公司作为终端侧AI领导者,面向包括手机、汽车、XR头显与眼镜、PC和物联网等在内的数十亿边缘终端,可以提供行业领先的硬件和软件解决方案,对推动混合AI规模化扩展独具优势。6月16日,高通正式发布了白皮书《混合AI是AI的未来》,进一步阐释了混合AI在大模型时代的优势,以及高通如何凭借终端侧AI领导力、全球化规模和生态系统赋能,让混合AI成为现实。
(资料图片)
“混合AI是AI的未来”
所谓的混合AI是指终端和云端协同工作,在适当的场景和时间下分配AI计算的工作负载,以提供更好的体验,并高效利用资源。在一些场景下,计算将主要以终端为中心,在必要时向云端分流任务。在以云为中心的场景下,终端将根据自身能力,在可能的情况下从云端分担一些AI工作负载。而混合AI架构可以根据模型和查询需求的复杂度等因素,选择不同方式在云端和终端侧之间分配处理负载。例如,如果模型大小、提示(prompt)和生成长度小于某个限定值,并且能够提供可接受的精确度,推理即可完全在终端侧进行。如果是更复杂的任务,模型则可以跨云端和终端运行。
此外,混合AI还能支持模型在终端侧和云端同时运行,也就是在终端侧运行轻量版模型时,在云端并行处理完整模型的多个标记(token),并在需要时更正终端侧的处理结果。更重要的是,随着强大的生成式AI模型不断缩小,以及终端侧处理能力的持续提升,混合AI的潜力将会进一步增长。参数超过10亿的AI模型已经能够在手机上运行,且性能和精度达到与云端相似的水平。不久的将来,拥有100亿或更高参数的模型将能够在终端上运行。混合AI可以说是能够适用于几乎所有生成式AI应用和终端领域,包括手机、笔记本电脑、XR头显、汽车和物联网,并在成本、能耗、性能、隐私、安全和个性化体验方面更具优势。
例如,在成本方面,生成式 AI 搜索可以提供更加出色的用户体验和搜索结果,但每一次搜索查询 ,其成本是传统搜索方法的10倍。所以,当前面向大语言模型推理的云计算架构,将导致搜索引擎企业的运营成本升高。但混合AI能够利用现已部署的、具备 AI 能力的数十亿边缘终端,以及未来还将具备更高处理能力的数十亿终端,在一定程度上减轻运营成本压力。
在能耗方面,边缘终端能够以很低的能耗运行生成式AI模型,尤其是将处理和数据传输相结合时。而在时延方面,当生成式 AI 查询对于云的需求达到高峰期时,会产生大量排队等待和高时延,甚至可能出现拒绝服务的情况,向边缘终端转移计算负载可防止这一现象发生。
高通全栈AI优化
众所周知,高通已经将其AI能力带入了包括智能手机、笔记本电脑、PC、汽车在内的众多终端产品中,其终端侧AI技术在大模型时代下也将成为推动混合AI规模化落地的重要推力。据高通技术公司产品管理高级副总裁兼AI负责人Ziad Asghar介绍,高通已经在飞行模式下实现了全球首个Android手机上的Stable Diffusion终端侧演示。Stable Diffusion是一个参数超过10亿的超大神经网络基础模型,能够基于输入的文本提示生成图片。而通过高通的全栈AI优化,这一模型能够完全在终端侧运行,实现在15秒内完成20步推理,生成饱含细节的图像。
Ziad Asghar也直言,虽然高通目前已经能够支持Stable Diffusion这一超过10亿参数的模型在终端侧运行,但许多关键的生成式AI模型的规模可以达到10亿到100亿参数之间,例如文本生成图像、自然语言处理、编程、图像理解、图像创作等。所以,在未来几个月内,高通将有望支持参数超过100亿的模型在终端侧运行。而这无疑也将成为基于高通技术的产品的重要差异化优势。
此外,通过高通AI软件栈,高通已经实现在搭载骁龙计算平台的笔记本电脑上运行Stable Diffusion。凭借行业领先的高通AI引擎,基于骁龙计算平台的笔记本电脑在MLCommons V3.0上率先实现了出色的MLPerf基准测试结果。同时,高通也是唯一一家能够在MLCommons V3.0的笔记本电脑品类中获得测试结果的公司,这也正是因为其拥有能够在终端侧运行如此大规模AI用例的硬件引擎。
其实,早在2022年6月,高通就推出了专门面向边缘侧AI的领先软件栈产品——高通AI软件栈,将其所有相关的 AI 软件产品集成在统一的解决方案中。OEM 厂商和开发者可在其产品上创建、优化和部署 AI 应用,充分利用高通 AI 引擎性能,让 AI 开发者创建一次 AI模型,即可跨高通所有硬件运行 AI 负载。谈及高通AI软件栈的核心优势,Ziad Asghar表示,基于高通AI软件栈的模型一旦开发出来,就可以在不同地方使用,再与混合AI部署相结合,形成杀手级的组合,将帮助生成式AI在不同终端上进行规模化扩展,实现生成式AI的普及。
未来,高通将不断提高边缘侧支持的模型参数阈值,Ziad Asghar提出,在不久的将来,拥有100亿或更大参数的生成式AI模型将能够在终端上运行。
关键词:
天天报道:高通押注混合AI,终端侧或将运行100亿参数模型
山西河北广西广东等地将有强对流天气
武汉7宗集中挂牌住宅地块再延期! 每日速递
皮海洲:拟套现后低息借款给前夫公司 “中国好前妻”意欲何为?
实探北京租房市场:旺季来临 量价齐升
当前头条:智利连日强降雨造成2人死亡6人失踪
6月22日丁二烯外盘市场收盘价持稳
世界快播:06月25日逸盛大化PTA为5750元
重庆养老金调整计算公式最新消息 2022~2023年重庆养老金调整方案细则新消息(全文)
每日观点:39℃高温来袭!今起西安地铁调整运营时间
今日快看!2023年江苏徐州中级会计职称什么时候报名及开通入口
世界通讯!谁能阻挡福州?
江西产业链创新链高效融合
港股异动 | 高鑫零售(06808)午后涨超5% 疫后回暖趋势明显 转型升级推动盈利能力提升
首发高频版骁龙8 Gen2!红魔8S Pro定档7月15日:170万分安卓天花板
即时:双枪快充 比亚迪猎跑SUV腾势N7上市定档:两张脸你中意哪个
用完成“蓝精灵”?多芬客服回应沐浴露现蓝光:没加荧光剂-天天新视野
2999元!努比亚首款AR智能眼镜Neovision Glass预约:6月28日开售_当前热文
全国口岸办主任会议在合肥召开-当前要闻
骁龙8 Gen2+200W快充!iQOO 11S官宣:7月4日见_环球热门
热浪蓄力中,这些健康防护知识赶紧掌握 全球最新
全国口岸办主任会议在合肥召开
辽阳县住建局重拳整治私占公共停车位行为|速读
世界报道:志愿怎么报?现场免费问!2023海南高招咨询会6月26日举办
天天即时看!重庆养老金2023增长细则最新消息和2022~2023年重庆养老金调整最新消息(全文)
济南市委书记会见张玉良 称一如既往支持绿地重点项目建设
世界球精选!南昌今日启动户外广告安全隐患整治
惨淡!1-5月纯电动汽车销量榜:75款未破万,元PLUS第3,唐EV第61 世界要闻
长实集团有意收购龙光和合景香港豪宅项目债权,或借此获得项目控股权
当前快播:阿那亚戏剧海报,收留每个错过上影节的伤心人
福安警方破获一起非法狩猎案 非法捕鸟者反成“笼中鸟”-天天观察
都市悬疑剧《暗恋者的救赎》在蓉开机 将全程在成都取景 世界热资讯
每日动态!支付宝消费券、优惠团、春选合并为消费圈,可领最高 5 元专享券
山西省汾阳市发布雷暴大风蓝色预警
祥符区杜良乡祁绍雷:养殖蛋鸭 助力乡村振兴
我赴马里维和部队全体官兵荣获联合国“和平勋章”_全球最资讯
酥红豆家常做法? 全球视点
聚焦:投诉株洲抖兴文化传媒以教短视频直播变现售卖课而骗钱
世界观焦点:A股遇上端午“劫”?不要被直觉所俘虏 弱市反而酝酿着高收益!“钟摆运动”正在底部
37手游全球发行负责人:游戏出海必须做好本地化 MMO品类需要做出差异性|天天关注
天天热门:广东最大降雨量逾310毫米 一地突发山洪7人被困后获救
1.06亿人次出游!端午节假期国内旅游收入373.10亿元-世界新要闻
乳汁分泌 乳汁分泌怎么样)
【速看料】1—5月全市规模以上工业增加值增长4.5%
环球时讯:暴雨红色预警信号!海口市灵山镇近1小时雨量已达83.5毫米!
舟山市“六大行动”助力食品生产“千企万坊”帮扶活动_世界看点
当前视点!代号鸢三千宇宙渔女怎么打
天地科技:6月21日融券卖出金额51.13万元,占当日流出金额的0.92%
今日关注:广东城市GDP差距大,如何改变?
众生药业:复方血栓通胶囊拟中选全国中成药采购联盟集中带量采购_全球信息
“下”到最基层 “沉”出大作为——湖南公安警力下沉速写|全球速看料
【科普中国军事科技】坦克火炮也要预瞄?坦克火炮打准需要哪些黑科技?_世界播资讯
北京开通2023年高考成绩查询系统_环球热点
画世界怎么办账号转移 操作方法介绍
《原神》3.8 版本爆料:“清夏!乐园?大秘境!”全新区域+玩法
失道寡助?大小S发文提告葛斯齐,圈内好友无一人站出来力挺! 世界速递
快讯:数据资产和NFT:一种新的方式来帮助全球流离失所的人
河东区天铁街道神山社区工会组织志愿活动:关爱户外劳动者 爱心驿站送清凉
当前速讯:小鹏蔚来站在悬崖之上
每日信息:中国农业发展银行梨树县支行 还绿水青山于民
同程旅行与葛仙村联合推出2023葛仙村同程音乐节_环球动态
爷俩炒豆干家常做法?
今日播报!小红书博主如何开通笔记带货?怎么引流?
2023年中级经济师《建筑与房地产》精选习题(15)
今亮点!微信QQ实现双向账号互通 可以微信登录QQ了
你关心的都在这!2023年高考志愿填报十问十答来了-资讯
乌克兰宣布从多方向发起反攻
天天新动态:暗黑破坏神4危险的旅行任务怎么做-危险的旅行任务攻略
【世界新视野】传真机的使用方法步骤_传真机的使用方法
热消息:浙商银行(02016)拟斥资约 23.34 亿元购置深圳分行营业办公用房
天天滚动:四川省养老金上调今日公布最新消息了吗?四川省退休金上调方案2023计算方法最新消息
最新消息:50TB仅398元!国产小龙盘全新升级:新增影音、游戏、种子资源
白夜极光平民玩家不氪金怎么搭配阵容-最强零氪平民阵容推荐
互动| 川能动力:正在积极筹备采矿系统的试生产前期准备工作
环球快看:佳电股份公司简介
世界今日报丨2023年北京中考语文作文题出炉
环球微资讯!超1200亿元!秒级审批 “深圳方案”遥遥领先
一拳超人:原子武士够资格成为四小天王中的一员?网友却一致反对 世界观点
【快播报】新乡市凤泉区“3个100%”实现“零距离”服务群众
Coser们最难应付的不是布料少的动漫角色,而是这种 全球报资讯
SSSS古立特小说全功率IF新形态公开:玩具实物赏析真五倍的快乐 世界新资讯
中国石化和中国石油有什么区别_中国石化和中国石油有什么区别和联系 全球速讯
95分钟绝平!同1人再演神剧情,中甲垫底队3分飞了,大热门升第2
9月20日统计开放日_9月20日
高考志愿填报相关App会员费不菲,AI填报靠不靠谱? 讯息
成绩的英文单词缩写-成绩的英文单词
速看:2023年湖南高考600分以上考生17012人
日乒天才少女夺冠!女单决赛,张本美和4-2申裕斌
亚洲藤球锦标赛落幕 中国队获一银三铜 天天观焦点
当前最新:皮海洲:拟套现后低息借款给前夫公司,“中国好前妻”意欲何为?
高龄产妇需要做哪些检查_高龄产妇的危险有哪些_每日资讯
火车软座图片真实_火车软座是什么样的
世界信息:普里戈任接受白俄缓和局势建议 其刑事立案将获撤销
实时焦点:为什么看斗罗大陆2的人远比斗罗大陆1的少,只因为有这两个原因
如何开发一个电商平台?-加速度jsudo
佐可胶囊或三金片_左克胶囊和三金片的区别
全球视点!环球时报社评:这种“美国病”真的无药可救
端午假期福建沿海水路运送旅客近39万人次-世界热推荐
斥资10亿元!富士康在郑州成立新公司,涉及新能源车业务
世界快看点丨依法合规科学利用好“坡耕地”——全国农技中心、耕地质量中心负责人就“水稻上山”等话题答记者问