某某发电机公司
Mou Mou Jidian Generator
客户统一服务热线

020-88888888
13988889999

币安交易所
Binance jiaoyisuo
您的位置: 主页 > 币安交易所

Binance 币安 ——比特币、以太币等加密货币交易平台2025SemiAnalysis详解微软AI战略报告全文:从能源到Token

  加密货币交易所,币安钱包,币安app官网下载,币安电脑PC版,币安交易所网址,币安app下载,币安邀请码返佣,币安交易所官方网站下载,币安交易所,币安,币安下载,币安注册,币安交易所网址,币安靠谱吗

Binance 币安 ——比特币、以太币等加密货币交易平台2025SemiAnalysis详解微软AI战略报告全文:从能源到Token

  报告认为,2025年,微软意识到战略失误,重新加码AI投资,积极寻求各类算力扩容方式,包括自建、租赁、合作等多元路径。得益于与OpenAI新签订的协议,Azure增长预期强劲。微软不仅拥有OpenAI模型和芯片的IP访问权,还在积极布局自研模型(MAI系列)、拓展Office Copilot生态,并尝试打造“Token-as-a-Service”业务模式,力图实现AI垂直整合,提升利润率和市场竞争力。

  在硬件方面,微软甚至能够使用OpenAI的定制芯片IP,这是目前最令人兴奋的定制芯片ASIC之一。鉴于OpenAI的ASIC开发进展远优于微软的Maia项目,微软最终可能会使用该芯片来支持OpenAI模型。这反映了微软与OpenAI模型的关系。虽然他们可以访问OpenAI模型,但仍在尝试用微软AI训练自己的基础模型。我们相信他们正试图成为真正垂直整合的人工智能巨头,消除大部分第三方的毛利空间,并以低于同行的成本提供更高智能的产品。

  这次建设的最具标志性项目或许是“Fairwater”计划。2023-2024年,微软计划并同时建造了地球上两座最大的数据库中心。让我们简要回顾一下微软2023-2024年建设规模。下图展示了他们的第一个大型训练集群,位于爱荷华州,GPT3.5即在此训练。我们估计该集群配备了约2.5万块A100芯片。虽然下图所示园区相当大,但我们认为OpenAI仅使用了Ballard建筑中的两个数据大厅,大约19兆瓦。

  通过与140多位来自大型AI公司(如OpenAI、Meta、Snowflake和Cursor)及初创企业(如PeriodicLabs、AdaptiveML、Jua、NousResearch、DatologyAI和Cartesia)的计算采购负责人交流,我们发现Azure在托管集群或按需虚拟机领域并非重要玩家。Azure的大规模集群GPU容量似乎直接供应给OpenAI,剩余部分被财富500强的传统企业内部开发者抢占。这些喜欢开发内部RAG聊天机器人的公司通常签有企业协议,专门从Azure采购所有基础设施即服务(IaaS)。

  行业内典型的GPU计算买家仍然主要寻找规模在64到8000个GPU的H100、H200、B200或B300HGX服务器。买家寻求GB200、GB300或任何AMD产品的情况则较少。然而,微软在AMD GPU以及针对其最大客户(即OpenAI)的GB200/GB300NVL72机架规模系统上投入了大量时间和精力。你可以通过工程师薪资的运营支出(OPEX)或GPU采购及新设施的资本支出(CAPEX)来衡量这一点。

  戴尔、SuperMicro、惠普企业(HPE)、联想和思科等服务器制造商(OEM)长期以来都提供标准的3到5年保修期服务器。5年保修当然更贵,但也有许多延长保修选项可达6年或7年。价格自然会上涨,但只要供应商备足备件,就能对磨损的节点进行维修。同时,思科、Arista、Aruba和瞻博网络(Juniper)等网络设备供应商已尝试对其交换机提供终身保修。存储设备供应商也提供类似服务——只需支付年度支持合同,他们就会持续更换磨损的硬盘。可以把它想象成汽车市场:高端市场可能每两年租赁并升级他们的奔驰,而其他人则开着二十年车龄的老旧车,只需支付油费和保险。

  日本理化学研究所(RIKEN)于2020年安装的Fugaku仍在运行,排名Top500第七。2018年安装在劳伦斯利弗莫尔国家实验室(LLNL)的Sierra仍在运行,排名第20。2016年安装在中国无锡国家超级计算中心的神威·太湖之光仍在运行,排名第21。Exascale级系统如ElCapitan、Frontier和Aurora(分别排名第1、2和3)于2021至2025年间投入使用,预计将运行至2027至2032年。

  未来会怎样?Vera Rubin是否能兑现其性能承诺,促使大型云服务商在GPU仅服役2-3年后就拆除这些仍能产生收入的GPU,正如Burry博士所言?或者我们是否会看到H100 GPU价格的底部保持坚挺?这些问题尚待解答,但我们的TCO模型提供了最佳估计。借助我们专有的GPU云测试(ClusterMAX)和每日基准测试平台InferenceMAX,我们致力于提供市场上最优质的洞见。我们的免费开源InferenceMAX平台展示了系统级创新,例如Nvidia的GB200BVL72,在某些应用场景和配置下,相较于传统的基于HGX的GPU,能带来数量级的性能提升。

  具体来说,微软的风险投资基金MI2最近发布了一张活动照片,活动邀请了Modular、Neurophos等初创企业。Modular是一家致力于为Nvidia之外多样化加速器开发推理和编程框架的软件初创公司;Neurophos是一家开发光处理单元(OPU)的芯片初创公司,也在挑战Nvidia。如果成功,这些公司将成为对抗Nvidia的重要力量:Modular MAX可替代vLLM和SGLang等推理运行时,Neurophos则用其OPU挑战芯片本身,并宣称“每皮焦能耗FLOPs提升1000倍”。

  谷歌在超大规模云厂商中的硅芯片霸主地位无可匹敌,第七代TPU与Nvidia Blackwell不相上下。TPU为Gemini模型家族提供算力,Gemini能力不断提升,在某些任务的每美元智能性价比接近帕累托前沿。虽然不是代码领域最强模型,Gemini 2.5 Pro依然表现不俗,Gemini 3即将推出将进一步提升谷歌实力。TPU不仅满足了谷歌内部搜索、广告和Deepmind的AI需求,谷歌正接近成为像Nvidia一样的商用AI硬件公司。

  微软没有借口,他们通过早期且有远见的投资OpenAI,早已洞察模型架构。但照目前速度,OpenAI(也参与了Maia 200设计)即便晚几年开始定制硅芯片,可能最终芯片做得比微软还好。不过这对微软来说也许是好事:微软对OpenAI IP的使用权涵盖除消费硬件外的全部领域,包括访问OpenAI Titan ASIC系列。鉴于OpenAI ASIC发展轨迹明显优于微软Maia,微软很可能最终用Titan来服务OpenAI模型。这和微软用OpenAI模型的情况类似:虽然有访问权,但微软还在尝试用自家AI训练基础模型。和模型一样,芯片路线图的访问权并非永久。依赖OpenAI的ASIC无法实现超大规模云厂商定制ASIC项目普遍追求的硬件自给自足目标。

Copyright © 2018-2025 Binance 币安机电发电机设备公司 版权所有 非商用版本  ICP备案: