

2026年6月5日,在北京召开的在英特尔至强 6+ 新品发布会暨数据中心翻新日上,英特尔给出了其对AI时间下一个要害转念点的判断:当AI从大模子进修全面转向Agentic AI(智能体AI)的限制化落地,数据中心对算力的诉求正在加快回想CPU。这并非对GPU报复性的含糊,而是对AI基础法度架构的一次系统性重构。
英特尔市集营销集团副总裁兼中国区总司理郭威在会上指出,以算力、数据、算法和汇聚为核心的AI基础法度形状正在重塑。跟着AI向云、边、端更正常地部署,夹杂式AI成为主流,CPU行动核心的作用日益突显。“面向Agentic时间,通过CPU、GPU、存储与汇聚的高效协同,构建系统级才略,才智果然开释AI限制化应用的价值。”

这一判断的背后,是一组要害数据:2025年,中国AI推理数据量初度跨越进修数据量;展望2026至2027年,企业场景中的活跃智能体数目将同比增长超200%。当AI的责任负载从“真金不怕火大模子”转向“用智能体”,一场围绕“算力、存力、算计力、保险力”的新式智算中心底座之争果决打响。
从1:8到1:1,智能体时间CPU重回C位
在当年的大模子进修时间,一台GPU就业器一样搭配两颗CPU,酿成典型的1:8配比。CPU在很猛进度上饰演着“破裂”,正经数据预处理和任务治愈。可是,当海量智能体初始运行,任务模子发生了根人性编削。

“当年几个月咱们不雅察到,不论你养了些许个智能体,每个都会消费CPU;当你要让它去调用数据库、践诺一段剧本,这又会占用出奇的CPU算力。”英特尔数据中心集团副总裁兼中国区总司理陈葆立在会后的媒体群访中炫耀,国内某开拔点大模子厂商从旧年到本年,其CPU需求已提高了5倍。“这是果然的反馈”,他基于此判断,CPU与GPU的比例正从1:8冉冉向1:1以致更高演进,最根蒂的逻辑在于:“当你要给AI更多任务的时期,绝大多数任务的践诺者是CPU。”

这一不雅点赢得了产业链伙伴的印证。腾讯云计较产物运营总监周驰从业务体量的角度指出,不应仅从单台就业器的比例去看待这一变化。他形色了一个显耀的“破圈”表象——当腾讯初度在线下引申其智能体应用时,前来体验的东说念主群中确立者仅占少数,更多的是讼师、白领、工东说念主、农民,年齿跨度以致是从七八十岁的老东说念主到十岁的小一又友。“他们都能讲出来我想用智能体干什么,这个破圈表象相称热烈。”
这种破圈意味着,大批当年因ROI分辩算而未被确立的琐碎、个性化需求正在被AI自动化。这些高并发、需求万般但单点算力条款不高的责任负载,并不需要崇高的GPU,而是极度渴求高密度、高性价比、擅长治愈与抓续处理的CPU。 周驰判断,从全球CPU装机量来看,这将带来普遍的增量。
行动基础法度提供商,云尖信息副总裁张欢军则从就业器架构角度不雅察到,token(词元)爆发式增长带来的数据进口、治愈、路由乃至token化处理,险些总计在CPU集群上完成。“当年几年GPU发展快,是因为世界都聚焦在大模子。跟着Agentic AI的出现,这种主动的、主见驱动的AI,让业务负载主要升沉到了CPU上。”他想象,翌日企业级Agent大批表示后,CPU的比重会越来越大。
至强6+:“四力”皆发,用系统想维破解智算痛点
恰是捕捉到这一趋势,英特尔推出了全新的至强6+处理器。行动首款基于Intel 18A制程的数据中心CPU,它并非一次简便的产物迭代,而是围绕Agentic AI时间智算中心的痛点,从四个维度进行了系统性升级。

在算力层面,至强 6+ 处理器领有最高 288 能效核心,使其能在单个液冷机架(32U空间)内提供36864个核心,以极高密度承载多智能体的并发运行。其内置的AMX(高等矩阵推广)工夫,可摊派AI数据预处理并为向量数据库提供加快。不错为客户提供更高并发、更低时延、更优能效的云表算力就业,撑抓 AI 时间万般化的责任负载需求。

在存力层面,全新的至强 6+ 处理器不仅领有576MB 三级缓存,还支抓 12 通说念 DDR5 内存、96 通说念 PCIe Gen 5。搭配英特尔 QAT,可解放 CPU 处理才略,加快压缩、重删、传输等存储责任负载。
陈葆立指出了一个行业痛点:当下大模子的波折文窗口已动辄百万Token,翌日可能达到几百万,由此产生的KV Cache(键值缓存)会马上占满崇高的显存。行业趋势是将这些数据卸载到内存或SSD中,径直导致高端SSD“奇货可居”。
“至强 6+ 处理器还有两个报复的工夫,是措置这个痛点的两把‘金钥匙’。”英特尔中国区工夫部总司理高宇强调,QAT(英特尔快速扶持工夫)和IAA(英特尔存内分析加快器) 恰是为此而生。QAT能在KV Cache存盘前进行硬件级压缩,压缩比至少达50%,径直简陋一半的存储老本。IAA则能对内存数据进行及时压缩息争压,在不影响加载速率的前提下,大幅简陋珍爱的内存资源。高宇默示:“以前世界合计改软件来用这些功能很阻挠,但今天它们能省下几千、几万块,世界都抢着用。契机是留给有准备的东说念主的。”
在算计力层面,至强 6+ 处理器提供从 200GbE 到 800GbE 的抓续迭代。最新推出的英特尔以太网 E835 铁心器支抓从 10GbE 到 200GbE 蒙眬量的活泼推广,通过提高每核带宽,在高密度诬捏化环境中充分开释高核心数 CPU 平台的性能。
在保险力层面,至强 6+ 处理器通过 6 大类 52 项 RAS 功能(可靠性、可用性、可就业性),愚弄英特尔 TDX 构建端到端的高明计较环境,为 AI 就业器和集群的高可靠、高可用和高可儿护提供硬核督察。
单个处理器支抓“1000个智能体部署”
亚搏体育app中国最新版本在发布会现场,“单颗至强6+处理器支抓上千智能体”的说王法东说念主印象深入。这一极限才略在随后的群访中赢得了更缜密的解构,新京澳门葡萄城(股份)有限公司它揭示了英特尔面向智能体时间极致的弹性。

英特尔数据中心集团副总裁兼中国区总司理陈葆立将智能体比方为“数字职工”,才略有波折之分,因此硬件建树也需因地制宜。支抓上千智能体的案例,是通过至强6+的单核架构优化,将一颗物理核心的算力资源精细切分,同期“分身”运行3到4个智能体。但他坦言,这种模式更顺应处理市集调研、查询信息等相对简便的日常责任,单个智能体的弥散性能会有所采选。这在刻下大批探索性、以致免费的就业阶段尤为适用,大约最大化固定金钱的愚弄着力,承载海量用户。而跟着翌日高价值付费就业的出现,单个智能体将需要更强的才略保险,资源配比当然会走向新的均衡。

这种工夫上的“弹性”,不仅体当今核心资源的切分上,更不绝于处理器翌日的宏不雅缠绵。靠近是发展“大核”照旧“小核”的行业争论,陈葆立给出了明确的回答:两者都需要,并阐述超线程工夫将回想。其根蒂主见是为了给客户提供采用的摆脱度。若是业务需要海量并发线程,不错开启超线程让诬捏核数翻倍;若是追求极致的单核性能来处理数据库调用等重型任务,则不错关闭该功能。“咱们会抓续把产物迭代的弹性作念进去,以撑抓翌日万般不同的变化。”
这种活泼应变的底层才略,恰是为了贯串云尖信息副总裁张欢军所不雅察到的产业需求:在GPU机头侧需要处理复杂治愈的“大核”,而在承载海量轻量级智能体实质运行时,则需要高能效的“能效核”。英特尔同期领有并能无缝兼容这两种架构,使得基础法度厂商大约针对不同行务场景活泼定制。
那么,这是否意味着,翌日客户可能只需要径直冷漠关于智能体需求,诠释我方需要什么样的智能体才略即可,而不是像当今这么,要提具体需要多大的内存、需要什么建树的CPU。然后云就业商通过提供智能体的这种就业才略,来酿成一种全新的买卖模式?
关于芯智讯冷漠的这个问题,腾讯云计较产物运营总监周驰修起说念:“我合计这照旧不是翌日了。 ” 他炫耀,腾讯云已推出to B的“ClawPro”平台,为企业搭建好一整套包含用户照顾、安全审计等才略的智能体平台。职工只需一键认领一个智能体,无需关爱其背后是些许核、多大内存的就业器。而在to C鸿沟,“LightVela”则将这一理念贯彻得更为透澈,完全屏蔽了工夫想法,让非工夫布景的用户嗅觉仅仅在“养一只可帮我方打工的虾”,需要更强才略时再进行“升格”。这种将智能体行动一种就业径直托付的模式,正在空匮传统IaaS、PaaS的界限,它不再售卖算力资源,而是径直托付分娩力。
这恰是Agentic AI时间最迷东说念主的变革,当基础法度具备了高度的弹性,当底层芯片的复杂性被巧妙地封装和治愈,最终用户所触遭逢的,将不再是冰冷的就业器和晦涩的参数,而是一个个活生生的、即取即用的“数字职工”。英特尔与它的生态伙伴们,正在为这幅图景铺设最底层的基石。
生态共振:加快落地
工夫才略的开释,最终需要落地于场景。在这次发布会上,多家国内空间领军企业展示了基于英特尔至强6+的合营后果,勾画出Agentic AI落地的果然图景。
腾讯云基于全栈自研的星星海就业器,行将推出搭载至强6+的新一代云实例。周驰炫耀,从上一代能效核初始,腾讯云便是其AP平台的全球独占伙伴,早期的合营已正常应用于微信、腾讯告白、腾讯会议等业务。新一代实例将开释288核的并发上风,正好匹配智能体场景“对单个处理条款不高,但需求量普遍”的特色。
针对KV Cache带来的存储错愕,新华三展示的UniStor X20000 AI数据存储平台,借助至强的高性能存力进行I/O数据流优化,以提高推理着力。阿里云则带来了QAT的履行,其在加解密、压缩/解压缩场景下性能提高超4倍,达成了物理空间、系管辖宽和能效的全面优化。而火山引擎发布的AICC高明计较平台,则愚弄英特尔TDX工夫,为多佃户环境下的AI大模子应用构建了简直践诺环境。
“咱们回想到底层的工夫和架构缠绵,英特尔在一语气迭代和架构一致性上相称出色。”云尖信息副总裁张欢军指出,关于硬件厂商而言,无需重新缠绵硬件、即插即用的兼容性,是快速反应市集需求的要害。
小结:
从大模子到智能体,AI的竞争焦点正从单一的峰值算力,转向由系统级才略撑抓的限制化、普惠化应用。在这场变革中,以英特尔至强为代表的x86 CPU,不仅是PC与就业器时间的始创者,更是新的智能体时间的智算基础法度的要害底座。
尽管出路光明,但总计参与者都贯通地意识到,Agentic AI时间的大幕刚刚拉开。当被问及芯片缺货问题时,陈葆立坦言新京澳门葡萄城股份有限公司官网,从旧年年底初始感受到了相称刚劲的需求,急切态势短期内可见。他的底气在于,英特尔是独一领有我方产能的CPU/GPU芯片公司,大约为供应提供保险。但他也严慎地默示:“这个需求能否抓续繁盛,最终取决于AI是否果然提高了分娩力。当今还处在相称相称早期的阶段。”