最新要闻
- 聚焦基层医疗短板 昆医大附一院召开对口帮扶医院专题调研会
- 葡萄籽维E软胶囊(关于葡萄籽维E软胶囊简述)
- 《心灵杀手2》延期10天发售 为玩家留出更多时间
- 闪光艾菲亚刷什么(闪光艾菲亚)
- 高中生发展报告长什么样(高中生发展报告是什么意思)
- 带三娃买五票 合规不合理
- 「异动股」减肥药板块下挫,华森制药(002907.CN)跌6.81%
- 策略点评:A股要成为社会财富创造者
- 陕西横山:殿市派出所巧借“X”力量,助“1”破解纠纷难题
- 点评报告:23H1产品稳健运营,关注自研产品上线情况
- 华为动力电池新专利:集成于车身!
- 山东省高唐县发布暴雨橙色预警
- 远程新能源商用车7月销量超7000辆
- 东安县:“她力量”奏响乡村振兴“交响曲”
- “途虎养车818 夏季养车趴”开启:大牌轮胎、保养买一送一!
- 预售两天超15万台!一加这性价比王炸又要封神了
手机
股票行情快报:特发信息(000070)8月18日主力资金净卖出1814.55万元
股票行情快报:康龙化成(300759)8月18日主力资金净卖出7655.59万元
- 股票行情快报:特发信息(000070)8月18日主力资金净卖出1814.55万元
- 股票行情快报:康龙化成(300759)8月18日主力资金净卖出7655.59万元
- Cruise无人驾驶出租车又闯祸了?驶入混凝土中,此前刚获得全日运营资
- 税务总局驻广州特派办:推动湾区税收营商环境持续优化
- 三大航7月份运营数据齐报喜 暑运支撑三季度业绩有望创新高
- 岳阳市中医医院:扎实开展纠风防腐行动 持续推进清廉医院建设
家电
端侧AI,如何化解国内算力之困?
解决了算力之困后,端侧大模型将有可能最先引爆本轮AI革命的盈利点。
算力和数据的天花板,决定了本轮的AI热潮究竟能走多远。
但不幸的是,对国内而言,其中的算力天花板,离“到顶”已经越来越近。
(资料图片)
就在8月初,美签署最新行政令,禁止美国对中国计算机芯片等敏感技术进行一些新投资,重点将在限制美国资本对于中国半导体设计软件和制造硬件的投资。
此消息一出,不少人顿感:国内算力危矣!
而机警的大厂,也开始了各自未雨绸缪的准备。
《金融时报》的一篇报道称,国内包括阿里、字节在内的科技巨头,已经订购50亿美元的英伟达的A800芯片,来面对训练大语言模型需要的算力挑战。
按照此前媒体报道,目前中国企业GPU芯片持有量超过1万枚的不超过5家,拥有1万枚A100的至多1家。
那么,在愈发紧张的算力之下,中国AI的前途、命运将如何发展?
短期来看,算力之困对于业内,似乎是个无解的问题。然而,技术的发展,有时就像生物的进化,当一种技术在面临“生存挑战”时,也会由于选择压力而发生一系列的突变。
而对国内而言,这样的突变方向,也许就是分散于各个终端里的端侧大模型。
01 端侧大模型,如何解算力之困?
端侧大模型的发展,对国内算力突围有着怎样的意义?这还得从目前云计算的需求说起。
当下,面对大模型高昂的算力成本,许多致力于涉足AI领域,但却算力匮乏的企业,往往都选择了租用云算力的方式,来满足训练需求。
在此背景下,昇腾AI集群这样的云服务平台也趁势而起,成为了孵化国内各个大模型的“母工厂”。
然而,即使是云计算本身,也需要大量的GPU支撑。
如果云服务商无法获取足够的GPU资源,那么它们也无法为国内AI企业提供高效、可靠的云计算服务。
而端侧AI最重要的意义,就在于分担了目前国内云计算的压力。
倘若我们将十几亿分散的智能手机,当成了一个个潜在的、拥有大量闲置算力的移动计算单元,那么部署在手机中的端侧AI,就能在这些设备闲置时间里,将这些碎片化、分布式算力利用起来,产生颇为可观的规模效应。
鸿蒙4中出现的手机大模型
具体来说,联邦计算,就是这样为人熟知的分布式计算方式之一。
所谓联邦计算,简而言之,就是在数据源(例如用户设备)上进行模型的局部训练,然后将这些局部模型的参数或更新聚合到中央服务器上,形成一个“全局模型”。
相比于集中式的训练,这种分布式的方式可以更好地利用各个设备的计算能力,降低中央服务器的算力需求。
在这样的过程中,依靠终端设备(例如手机)的庞大数量规模,每个“全局模型”的训练成本,在无意中便被不断摊薄了。
因为每个“小模型”的训练只需要消耗端侧设备的计算资源,而不需要传输大量的原始数据到云端。这样,就可以节省网络带宽和云端存储空间,也可以减少云端服务器的计算压力。
更重要的是,与云端GPU这类高成本的训练方式相比,由于端侧AI芯片往往是针对特定的AI应用和算法,进行优化和定制,因此其往往有着相对更明确的“回血”途径。
例如,前段时间,爆火的妙鸭相机,大家应该都听说了。在其最受追捧的初期,成千上万的用户涌进应用中,高峰期一度有4000-5000人排队,需要等待10多个小时才能出片。
之后,是阿里云进行了紧急扩容,才勉强应对了这暴涨数百倍的算力需求。
但倘若用户不用在云端等待,而是直接在本地,或者通过端云协同的方式,就能实现这样的生成效果呢?
一种可能的方式,是先在端侧生成低分辨率的图片,之后再上传到云端,用较少的资源对图片进行清晰化处理。
如此一来,既降低了云端算力的负担,又在一定程度上保障了生成的质量、效率。
在当下的AI应用开发中,开发者不仅需要支付云端大模型API接口的成本,还得自己租用服务器,保证密钥安全。
如果是文字生成类AI,文字量大的话,相应的token也是一笔不小的开支。
而随着算力门槛的降低,众多AI应用的开发者,将不再被云端算力的成本所缚,而只需调用端侧大模型提供的开放API,就可以快速开发各类AI应用。
在此基础上,一个开放的、多样化的AI应用生态,就随着端侧大模型的普及,而应运而生了。
02 以“偏”补“全”的端侧芯片
AI应用井喷的时代似乎近在眼前,但要想让每台手机都标配一个大模型,前面还有道难以回避的门槛——硬件基础。
由于芯片架构不同,在端侧部署时,往往需要对模型网络结构进行一通修改才能勉强“上车”。
具体来说,目前GPT这类主流AI所使用的Transformer架构,往往部署于云端服务器。
这是因为GPU对于MHA结构(Transformer中的多头注意力机制)计算支持更友好。而端侧AI的芯片,则主要侧重于CNN(卷积神经网络)的结构。
如果将前者强行转移到端侧,带来的一个明显问题,就是模型精度下降。
那么有没有什么办法,能让大模型在进行端侧化改造的同时,仍能保证其精度呢?
爱芯元智推出的端侧芯片AX650N,似乎提供了一个可能的路线。
AX650N芯片拥有自研混合精度NPU和爱芯智眸AI-ISP两大核心技术,其对Transformer结构的网络进行了专门的优化,在其NPU中增加了专门用于自注意力计算的单元,可以大幅提升Transformer网络的运行速度和准确率。
凭借着这类针对端侧的优化技术,AX650N已经做到了在端侧部署原版Swin Transformer只需要5分钟,而跑起私有模型,只要1个小时就能搞定。
但尽管如此,受限于架构和内存,这样的优化,仅仅只是针对视觉大模型方向而言的,因为从硬件算力上来说,端侧AI芯片,始终难以做到GPU芯片那样“面面俱到”的通用性、兼容性。
既然如此,国内的大模型之困,是否就指望不上它了?
其实不然,从量的角度来讲,边缘侧、端侧的需求一定比云侧更大,毕竟边缘侧、端侧设备会更多。
而在这众多的需求中,只要使用了大模型的终端(如手机、智能音箱),能做到两点,那么国内大模型在应用层,就有盘活的可能。
其中第一点,就是够降低人们获取信息、知识的成本。
倘若以后人们打开手机或者其他终端,就能获得一个诸如私人医生和律师、厨师的AI助理,能为我们提供成本低廉、快速的咨询服务,那么人们就会对其产生依赖。
因为从行为学上来说,人总归是有惰性的。
虽然目前的某些律所,也能为人们提供免费的咨询服务,但这其中却包含了无形的时间成本、沟通成本。
正如互联网出现后,虽然人们仍能通过纸制地图进行导航,但大部分人却再也离不开手机上的定位功能一样。
从某种程度上说,压缩了各种知识、智能的端侧模型,将会重复这一过程。
第二点,则是个性化功能的普及。
在“前AI时代”,个性化定制的大规模推广,是一件不可想象的事。
在没有AI技术支持的情况下,实现个性化定制通常需要大量的人力和时间投入。为每个用户提供个性化的产品或服务,往往需要大量的人工处理。
然而,随着本轮AI革命的到来,人们已经在应用层,看到了AI用于个性化、定制化服务的可能。
例如character.Ai一类的应用,支持用户根据自己的需求、偏好,量身定制一个“AI伴侣”。
试想一下,倘若这样的定制化服务进入到了端侧,端侧大模型就能不断收集用户数据,再进行反馈、训练,并最终打造出一个独一无二的、贴身的AI助手。
而这样量身定制的体验,显然比大规模的标准化服务,更具吸引力。
03 总结
尽管在模型规模、性能等方面,端侧大模型目前还远无法与云端大模型相比,但分布式的算力格局,以及庞大的规模效应,都将大大降低目前国内云端算力的负担。
而在算力成本降低之后,大量基于API接口的AI应用,也得以通过一个个部署在本地的端侧大模型不断涌现。
在应用大爆发的背景下,一些捕捉到先机的应用,就会基于端侧大模型实时响应、个性化定制的功能,引爆本轮AI革命真正的盈利点。
而这,正是无数人在这股AI浪潮中苦苦追寻的。
原文标题 : 端侧AI,如何化解国内算力之困?
关键词:
端侧AI,如何化解国内算力之困?
50个项目赋能 稀土产业“链”上发力
《流放之路》s23传奇装备汇总
奔驰召回共计231249辆进口及国产汽车
《Fi-Knight Kingdom》上架steam 像素RPG+掷筛走格
聚焦基层医疗短板 昆医大附一院召开对口帮扶医院专题调研会
百度电商发起“百城万品”计划
点滴暖心事 让守护更有温度
苹果15充电速度介绍详情
卢卡申科被问“瓦格纳事件”是表演吗:只有“疯子”才会说这是表演 具体是什么情况?
vivo S16 Pro可以用5G网吗
股票行情快报:特发信息(000070)8月18日主力资金净卖出1814.55万元
一人从业,三代受惠,小银行的福利你“想不到”啊
股票行情快报:龙津药业(002750)8月18日主力资金净卖出628.42万元
股票行情快报:康龙化成(300759)8月18日主力资金净卖出7655.59万元
漳州高新区人才工作专题会召开
互怼!诺辉健康连发公告回应做空报告,疑似做空方朋友圈发声
葡萄籽维E软胶囊(关于葡萄籽维E软胶囊简述)
《心灵杀手2》延期10天发售 为玩家留出更多时间
闪光艾菲亚刷什么(闪光艾菲亚)
FBM山体模拟生成
Nginx反向代理
高中生发展报告长什么样(高中生发展报告是什么意思)
带三娃买五票 合规不合理
网红老师张雪峰终于换掉5年前手机 用上华为Mate 50
绿豆糕怎么做好吃又简单视频(绿豆糕怎么做)
港股异动 | 优趣汇控股(02177)涨超6% 跨品类运营带来业绩增量 全年线上渗透率有望持续提升
作为软件开发经理要避免的10个错误(下)
宁德时代发布神行超充电池 续航可达700公里 仅10分钟即可行驶400公里
“赶粉”记
Cruise无人驾驶出租车又闯祸了?驶入混凝土中,此前刚获得全日运营资
电影《长安三万里》,接连陷入“致歉漩涡”
沃尔沃大中华区突发人事调整:总裁钦培吉离职、瑞典总部“收权”
香港青少年军开启湖北之旅
江西百家食品生产企业公开承诺落实主体责任
税务总局驻广州特派办:推动湾区税收营商环境持续优化
陕西省西乡县发布高温黄色预警
19号线二期,距离开通又进一步!
英国:应考虑人工智能“终止开关”的必要性
MC小洲经典语录歌词搞笑(mc小洲经典语录歌词)
诺丁汉森林vs谢菲尔德联:奥里耶、达尼洛首发,贝尼-特拉奥雷、艾哈迈多霍吉奇出战
我国首个薄煤层气大规模开发项目全面投产
这家券商发话:5年冲100亿!
门头沟区三条山区公交线路恢复全线运营
尼日利亚恐怖分子宣称击落尼空军直升机
股票行情快报:*ST富吉(688272)8月18日主力资金净卖出20.34万元
三大航7月份运营数据齐报喜 暑运支撑三季度业绩有望创新高
2023年上半年,枣庄市中区居民人均可支配收入居枣庄第一
华擎推出新款迷你主机 1.92L尺寸 支持65W处理器
越剑智能:业绩说明会定于8月25日举行
8月18日南航新开广州至湘西边城航线,每周三周五周日执飞
岳阳市中医医院:扎实开展纠风防腐行动 持续推进清廉医院建设
「异动股」减肥药板块下挫,华森制药(002907.CN)跌6.81%
《写在初秋》文/李勇
互动|?康盛股份:中植集团通过子公司持有我司22.63%股份 相关股权不存在质押冻结等情形
“全国新闻记者职业资格考试”培训教材出版发行
奇瑞汽车召回部分奇瑞eQ1电动汽车,共计20063辆
“约会双节,金秋购车”500万元!延吉汽车消费补贴来啦!
兴业证券业绩快报:上半年净利润17.96亿元 同比增30.73%
2023无畏契约全球冠军赛八强产生 两支中国队伍成功晋级
上海封存的公积金可以线上提取吗 网上提取住房公积金的方法如下
虎牙开拓新路线
荣盛发展:河北万惠通能源科技有限公司为公司控股子公司荣万家生活服务股份有限公司的下属公司
央行:要保持货币信贷总量适度、节奏平稳
淄博烧烤牵手青岛啤酒 一瓶一串拉开初秋序幕
读书郎(02385.HK)授出1500万元贷款
珍惜黄金这段波动不大的时光吧
区领导专题调研南上海体育中心项目推进情况
策略点评:A股要成为社会财富创造者
阿富汗霍斯特省一酒店发生爆炸致3死7伤
博人传:川木踏上忍者道路,鸣人决定考验他,与电气组队执行任务
河南某名酒代理商吐槽:太卷了,我做了一辈子的酒,从来没有今年这么难
自力村碉楼群好玩吗 自力村碉楼群
学警阻击2(4DVD)(关于学警阻击2(4DVD)简述)
中海物业遭业主投诉,被指电梯故障频繁、擅自取消楼栋管理员
新华社纪录片|生态贵州
炭黑油概念上市公司股票有哪些?炭黑油股票一览
液晶屏龙头股票一览(2023/8/15)
陕西横山:殿市派出所巧借“X”力量,助“1”破解纠纷难题
民生民事新站广场音乐喷泉成为市民休闲打卡网红地
24小时连续发电!“清洁+储能+调峰” 超万面定日镜“绽放”戈壁滩
创新医疗科技成果将亮相2023年服贸会健康卫生服务专题展
小鹏汽车在北京城区真实测试:自动避障、主动超车
朱绍禹先生百年诞辰纪念会暨第四届朱绍禹语文教育思想研讨会召开
骑行潮来了,自行车消费迈向中高端
中原证券:建议短线关注金融、房地产、医疗服务等行业投资机会
点评报告:23H1产品稳健运营,关注自研产品上线情况
【恐怖灵异故事】︰《逃不出的八楼》完整版
国科军工:8月16日融券卖出金额170.28万元,占当日流出金额的1.89%
印尼首都将抽查车辆排放状况
昔日”千亿房企“阳光城告别A股,已累计偿债超450亿元仍无力回天
我国工业机器人装机量占全球比重超50%
微盟2023年上半年营收12.1亿元 净亏损同比收窄55.2%
华为动力电池新专利:集成于车身!
运势腾飞,财库滔滔:九月三大星座财富大丰收,好运连连!
重塑当代影像 三影堂厦门呈现中荷建交50周年特别展览“想象荷兰”
图说丨缩水
股票行情快报:芯碁微装(688630)8月18日主力资金净买入604.16万元
股票行情快报:吉祥航空(603885)8月18日主力资金净卖出274.05万元
连续涨停!又一行业卷土重来,集体变妖股?