IT之家 5 月 6 日消息,在 2026 财年第 1 财季(2025 年 12 月 28 日 ~2026 年 3 月 28 日)财报电话会议上,AMD 首席执行官苏姿丰表示, 智能体 AI(Agentic AI)正在重塑服务器 CPU 市场格局。 苏姿丰表示 AI 成为本季度增长的核心驱动力,所有主要云服务商都在扩展部署霄龙(EPYC)处理器,广泛覆盖通用计算、数据处理和新兴智能体应用等场景。 苏姿丰解释称智能体 AI 工作负载需要额外的 CPU 算力进行编排、数据移动和并行执行,同时还要作为 GPU 和加速器的核心节点,因此 AMD 的服务器 CPU 需求更加强劲。 瑞银在 2025 年 11 月曾预估,到 2030 年服务器 CPU 总可寻址市场(TAM)将增长 5 倍,从 2025 年的 300 亿美元增至 1700 亿美元(IT之家注:现汇率约合 1.16 万亿元人民币),未来 4~5 年的复合增长率为 18%。 而在本次财报会议上,苏姿丰预估在智能体 AI 推动下,该数值可能达到 35%。 针对 CPU 需求是否会蚕食 GPU 市场的疑问,苏姿丰给出否定答案。她强调,加速器运行基础模型需要 CPU 配合,智能体也会“衍生”出大量 CPU 任务, 因此 CPU 需求“很大程度上是对 GPU 市场的补充”。 更关键的变化在于 CPU 与 GPU 的配比演进。苏姿丰透露,传统数据中心中 CPU 与 GPU 的比例多为 1:4 或 1:8,主要作为主机节点存在。但随着智能体 AI 普及,这一比例正在向 1:1 靠拢,甚至在智能体密集部署的场景下,CPU 数量可能超过 GPU。
IT之家 5 月 3 日消息,据《The Information》今日报道,马斯克旗下人工智能公司 xAI—— 也就是 Grok 大模型的幕后团队,目前手头上约有 55 万块英伟达 GPU(包括 H100 与 H200),但实际利用率仅有 11%。 据介绍,这些硬件目前主要部署在孟菲斯的 Colossus 超算集群中,采用液冷配置。尽管与 Blackwell 最新一代产品相比稍显老旧,但这样的体量在全球范围内依然位居前列。 然而,如此海量的硬件并未转化为有效的计算产出。该集群的实际利用率仅有 11%。当然,这并非意味着其余 89% 的 GPU 处于完全闲置状态,而是指模型的实际浮点运算利用率远远低于理论峰值。 业内人士解释称,衡量 AI 算力效率的关键指标叫做 MFU(Model FLOPs Utilization),即模型浮点运算利用率。11% 的 MFU 意味着,理论上能产生 100 份训练吞吐量的硬件,实际只产出了 11 份,大量的电力和硬件时间都消耗在了数据等待、通信开销和重新计算等环节,而没有转化为有效的训练吞吐。 面对这一数字,xAI 总裁 Michael Nicolls 在一份内部备忘录中承认其“低得尴尬”,并为团队设定了在未来几个月内将利用率拉升至 50% 的目标。 xAI 并非个例,算力利用率偏低是整个 AI 基础设施领域的行业性难题。报道指出,在超大规模集群下,软件优化跟不上硬件部署速度是普遍现象。作为对比,Meta 和谷歌在软件堆栈上投入了大量精力,因此其 GPU 利用率相对较高,但也只有约 43% 和约 46%。 IT之家此前曾报道,Colossus 集群的建设速度令人瞠目,从启动到首阶段投用仅用了 19 天,英伟达 CEO 黄仁勋更指出“这通常需要四年的时间”。这种飞速扩张虽然让 xAI 在硬件储备上占据了先机,但目前似乎也暴露出了软件配套与分布式训练能力的滞后。 此外,业界分析指出,AI 训练具有间歇性特征,硬件在模型推理时满负荷运转,但在数据分析阶段则会陷入闲置,这是导致利用率较低的重要因素。 除了 AI 训练本身的间歇性,业内人士指出,GPU 供应短缺带来的行为扭曲也加剧了算力浪费。由于高端 GPU 产能紧张且获取周期长,许多企业担心被回收资源而倾向于囤积硬件,实际负载却无法消化,从而造成了庞大的闲置资源与高昂的闲置成本并存的现象。 为了改变现状,xAI 计划从基础设施和软件堆栈优化入手。同时,有消息指出,xAI 未来可能会推出针对其庞大 GPU 集群的租赁服务,将闲置算力转化为收入。 此外,马斯克也在大力投入 TeraFab 项目,旨在为 xAI、SpaceX 等企业设计自研 AI 芯片,并基于 Intel 14A 工艺打造下一代先进计算方案。
IT之家 5 月 2 日消息,据央视新闻今天报道,我国首个大规模“算电协同”绿电直供项目现已正式投运。标志着我国“东数西算”工程实现从沙漠风光光电到数字算力直连直通。 据报道, 本项目名为“中国大唐中卫云基地 50 万千瓦光伏电站” ,位于宁夏中卫,是我国首个新能源综合示范区。 该项目拥有 50 万千瓦光伏电站和 150 万千瓦风电场以及配套储能装置 ,可让算力园区用上清洁、低价、稳定的电力。 该项目全容量投产后,发电量可达 43 亿千瓦时,每年减少碳排放 365 万吨。届时可以保障整个中卫云基地 22.9 亿千瓦时的用电需求,实现了绿电消纳与电网稳定性的“双向奔赴”。
IT之家 5 月 2 日消息,随着 AI 生成视频的崛起,今年 2 月,一则 AI 短剧《霍去病》以“3000 元成本、48 小时、3 个人、80 集、5 亿播放”的词条,引爆舆论场。 然而,这个“低成本、高产能”的“神话”被从业者质疑,称其扰乱市场。 据央视新闻 4 月 21 日发布的导演杨涵涵采访报道,《霍去病》所谓的“神话”——3000 元、48 小时、80 集、5 亿播放、3 个人,是一个被省略前提的“爽文”模板。 3000 元, 仅为算力成本 ,不包含人力成本。 48 小时, 仅为工作时间 ,不包含休息和吃饭。 至于 80 集、5 亿播放,实属夸大 ——《霍去病》只有两个版本,4 分多钟 MV 和 6 分钟正片;5 亿播放量源于未经核实的数据。 报道称,只有“3 人”属实。杨涵涵作为项目导演,负责剧本和分镜把控;另外两人,一个是 AI 动画师,主攻 AI“抽卡”和剪辑;一个是 AI 音乐创作人,负责音乐和音效。 2026 年 1 月底,《霍去病》开始制作,团队每天工作约 12 小时,4 天完成。 IT之家查询发现,B站账号“杨涵涵 AIGC”自称是视频的原创者,其视频标题却使用了“AI 短剧成本仅 3000”“耗时 48 小时完成”等字样,存在自我炒作再辟谣的嫌疑。
IT之家 4 月 30 日消息,据《金融时报》昨日报道,OpenAI 正调整其“星际之门”(Stargate) AI 基础设施建设计划的运行方式, 更大程度上通过租赁来满足其算力需求 ,缩减了自建容量的规模。 消息人士表示,OpenAI 现在倾向于通过一系列大型双边交易来达成算力目标。 OpenAI 实际上仍会从 Nscale 的原“星际之门 · 挪威”数据中心站点获得算力资源 ,但将以 Nscale → Microsoft(微软)→ OpenAI 的间接方式进行。 与此同时,微软正为因“星际之门”实现方式变化受到影响的企业提供支持:在原“星际之门 · 挪威”外,微软还将接手原本作为“星际之门”首个站点扩建项目的 Crusoe 美国得克萨斯州阿比林园区二期。 图源:Pexels 相关阅读: 《 OpenAI 当前已锁定 8GW 算力,到 2030 年将达 30GW 》
IT之家 4 月 28 日消息,香蕉派(Banana Pi)本月推出 BPI-SM10 微型计算机,搭载进迭时空(SpacemiT)的 K3 RISC-V 处理器, 声称是全球首个符合 RVA23 标准的 RISC-V AI CPU 平台。 IT之家注:RVA23 Profile(RVA23 配置文件)是 RISC-V 国际基金会于 2024 年 10 月正式定稿的一项重要标准,旨在统一 64 位高性能 RISC-V 应用处理器的功能集合。 它标志着 RISC-V 从嵌入式领域迈向数据中心、AI 计算、高性能工作站等主流应用场景的关键一步,解决了过去因扩展过多导致的“碎片化”问题。 处理器方面,该微型计算机搭载进迭时空 K3 处理器,采用 8 核设计,主频达 2.4 GHz,符合 RVA23 配置文件标准。 该处理器集成 AI 加速器,可提供最高 60 TOPS 的 AI 算力,板载支持最高 32GB LPDDR5-6400 内存。整机功耗预计在 18 至 35 瓦之间,性能足以支撑 300 亿参数 AI 模型,能每秒 10 个 Token 的速度运行。 接口方面,载板尺寸为 103 x 90.5 x 35 毫米,扩展接口丰富,包括 1 个 PCIe 4.0 x4 插槽、1 个 PCIe 4.0 x2 插槽、4 个 USB 3.2 Gen 2 Type-A 接口以及 1 个 USB 3.2 Gen 2 Type-C 接口。 显示输出配备 DisplayPort 1.2 接口,网络连接提供千兆以太网端口。载板还配备了 2 个 MIPI-CSI 摄像头接口、1 个 40 针扩展接口及直流电源输入。
IT之家 4 月 27 日消息,机构 Epoch AI 统计的数据预估,截至 2025 年第四季度,谷歌是 全球最大的单一 AI 算力持有者 ,掌握了全球累计 AI 算力的大约四分之一。和其他超大规模云服务商不同,谷歌的算力主要来自自研 TPU 芯片,而不是英伟达 GPU。 微软和 Meta 同样在研发自行设计的 AI 芯片,然而目前没有纳入追踪范围。该机构判断,这部分芯片 对整体估算结果的影响很小,基本可以忽略 。 基于 AI Chip Owners 数据库的估算,该机构统计了截至 2025 年第四季度,全球四大算力持有者 谷歌、微软、Meta 和亚马逊 分别掌握的累计 AI 算力,并按芯片制造商进行拆分。结果显示,谷歌当时 持有的算力最多 ,核心原因是谷歌大量使用自研 TPU 芯片。 AI Chip Owners 数据库从 2022 年第一季度开始,按具体芯片型号追踪不同实体持有的计算能力,统计范围包括英伟达和 AMD 的数据中心 GPU、谷歌 TPU、亚马逊 Trainium 和 Inferentia 芯片,以及华为 AI 芯片。据IT之家了解,该机构估计,这五大类芯片 已经覆盖全球绝大多数专用 AI 算力 。
IT之家 4 月 25 日消息,据中国证监会官网今日披露,超聚变数字技术股份有限公司(简称“超聚变”)首次公开发行股票并上市辅导工作已完成,辅导机构为中信证券。 中信证券在辅导报告中认为,经辅导,超聚变具备成为上市公司应有的公司治理结构、会计基础工作和内部控制制度,公司管理层已充分了解多层次资本市场各板块的特点和属性。这标志着这家从华为 x86 服务器业务独立出来的算力独角兽,正式进入了 A 股冲刺的最后准备阶段。 公开资料显示,超聚变成立于 2021 年 9 月,源于华为 2021 年剥离的 x86 服务器业务部门,目前由河南地方国资控股。 估值方面,《世界独角兽企业发展报告 2024》曾显示,超聚变凭借 89.2 亿美元(IT之家注:现汇率约合 610.76 亿元人民币)的估值,位列全球独角兽榜单第 47 名,且是河南省唯一上榜的独角兽企业。 据公开报道,2022 年,即超聚变独立运营后的第一个完整年度,其销售收入便突破了 100 亿元;2023 年超过 280 亿元;2024 年报收 435 亿元,迈上了 400 亿元的大台阶。2025 年,公司延续高速增长,上半年营收已超过 300 亿元,知情人士透露全年有望冲刺 600 亿元。 在市场份额方面,据 IDC 发布的报告,2025 年超聚变凭借 12.7% 的市场份额,位列国内 x86 服务器整机厂商第二名(浪潮 31.3%、新华三 12.5%、联想 10.7%、中兴 8.5%)。同时,在液冷服务器这一细分赛道,超聚变已连续两年(2023 至 2024 年)蝉联中国标准液冷服务器市场份额第一的位置,2023 年市场份额曾一度达到 43%。 自独立以来,超聚变已累计完成至少 8 轮股权融资,其股东构成堪称“豪华国资团”。除了控股股东 —— 河南超聚能科技有限公司(持股比例为 31.38%)之外,第二大股东为中国移动旗下的中移资本。此外,其股东名单中还包括中国电信投资、中国互联网投资基金、国务院国资委旗下的国调基金、中金资本、纽尔利资本、深圳招商资本、人保资本、申万创新投资、宏源汇富、联通中金等一众实力派机构。在 2025 年 11 月的最新一轮融资中,国调基金宣布战略入股以支持超聚变突破关键核心技术,同时郑州航空港科创集团、惠友资本、金石投资、芯联资本等也纷纷加注。
IT之家 4 月 24 日消息,据《科创板日报》今日报道,美团新一代基础大模型 LongCat-2.0-Preview 已经开放邀请测试,该模型总参数规模突破万亿,量级跻身全球顶尖大模型行列。 这款尚未公布正式命名的大模型参数量级达到万亿级别,采用了混合专家(MoE)的先进架构,整体能力被业内人士认为对标 GPT-4。此外,有知情人士称该模型完全基于国产化算力集群训练,这表明美团可能已经率先在使用国产算力训练万亿模型上取得突破。 早在 2024 年财报业绩会上,美团创始人王兴就曾首次公开披露美团的 GPU 储备战略,不仅在当年持续投入数十亿美元保障充足的算力供应,还明确表示未来将进一步加大投资力度,为大模型的研发筑牢基础。 去年 9 月,美团已发布并开源了首款自研大语言模型 LongCat-Flash,该模型同样基于 MoE 架构,拥有 5600 亿总参数,凭借打破常规的“零计算专家机制”等创新优化设计,在保持了极高推理效率的同时显著降低了运营成本,详情可见IT之家此前报道。 相关阅读: 《 美团发布 LongCat-AudioDiT 音频生成模型:说话人相似度指标提升至 0.818,现已开源 》 《 美团发布开源原生多模态大模型 LongCat-Next,让视觉和语音成为 AI 的母语 》 《 美团开源 LongCat-Flash-Prover 大模型:5600 亿参数,刷新两项 SOTA 水平 》 《 美团 LongCat 大模型官方 App 发布:支持联网搜索,还可以发起语音通话 》 《 美团发布并开源 LongCat-Flash-Chat 大模型:总参数 560B,AI 智能体任务表现突出 》 《 王兴披露美团 AI 业务进展:基础大模型能力接近 GPT-4o 水平,6 月将推业务决策助手 》
IT之家 4 月 23 日消息,在刚刚结束的华为乾崑技术大会上,华为智能汽车解决方案 BU CEO 靳玉志正式发布了鸿蒙座舱 HarmonySpace 6 和乾崑智驾 ADS 5。 据介绍,华为乾崑的算力规模已从 2023 年的 2.8 EFLOPS 增长至现在的 60 EFLOPS,29 个月增长了 21 倍。 2026 年,华为乾崑预计将在智驾领域研发投入超 180 亿元人民币 ,算力部分投入近百亿元、未来 5 年至少再投入 700-800 亿元。 IT之家注意到,靳玉志还直言: 算力,是自动驾驶持续发展的基石 。 相关阅读: 《 华为乾崑鸿蒙座舱 HarmonySpace 6 发布,小艺智能体能边聊边开车 》 《 华为乾崑智驾 ADS 5 发布:首发防误打方向盘,车位到车位 3.0 版本 》
IT之家 4 月 23 日消息,OpenAI 官方当地时间昨日宣布, 这家人工智能企业当前已锁定总功率超 8GW 的算力资源 ,离 2025 年初设立的 10GW 目标已经不远,而到 2030 年则将达到 30GW。 IT之家注意到,建设 1GW 规模的 AI 数据中心通常需要数百亿美元 ,30GW 数据中心的总建设投资至少与 OpenAI 当前估值 (8000+ 亿美元) 相当 ,甚至有可能达到这一数值的 2 倍。 尽管 OpenAI 主要以租赁服务形式取得算力,但每年的云服务开支对其来说也将是一笔沉重的负担。
IT之家 4 月 22 日消息,在今日的地平线年度产品发布会上,地平线发布了“中国首款舱驾融合整车智能体芯片”—— 星空 Starry 6P 。 官方展示了 Starry 6P 域控制器,以及带散热的整体产品,宣称是一个单芯片单控制器的车辆计算大脑。 性能方面,星空 Starry 6P 芯片采用 5nm 工艺打造, 20 核 CPU,最高 650TOPS 算力 ,专为整车智能体 OS 而生,支持最高 273GB/s 的带宽。 此外,星空 Starry 6P 的端侧大模型预处理速度是 Mac Mini(M4 Pro)的 2.4 倍。 IT之家从发布会获悉,地平线还推出了一款 星空 Starry 6H 芯片 ,算力可达 500TOPS,搭载 14 核 CPU。 地平线将两套域控制器合而为一,节省一半空间和器件,同时节省成本达 1500~4000 元 / 车。 星空 Starry 6H 芯片将在 奇瑞的 iCar V27 新车 中首发搭载,发布即可量产。奇瑞 iCAR 品牌已官宣登陆北京车展,iCAR“新物种”届时将迎来全球首秀。除了全新概念车首发外,iCAR 纯电方盒子销冠超级 V23、家庭新硬派 V27 也会一同亮相,现场还有 V23“白武士”改装版首秀。 地平线还公布了星空系列芯片的首批意向量产伙伴,包括比亚迪、北汽、奇瑞、长安、大众等。
IT之家 4 月 22 日消息,据新华社今日报道,中国移动北京公司昨日面向个人用户推出了“算力 Token 套餐”,采用词元(Token)计费模式,用户可按需付费使用人工智能算力。这一举措旨在将算力从实验室场景延伸至普通消费者的日常生活。 对于已经拥有云电脑的用户,北京移动提供了最低 5.99 元的算力次包,以及低至 24.99 元、包含 1000 万词元的算力月包。 对于尚未使用云电脑的用户,北京移动则推出了内置智能体工具 OpenClaw(IT之家注:俗称“龙虾”)的云电脑融合套餐,用户无需自行部署复杂的运行环境,开机即可使用,并且该套餐支持主流的通用大语言模型。 目前中国移动已在北京、湖北、河南等地陆续推出此类算力套餐,试图解决用户在调用人工智能服务时面临的本地部署复杂、算力成本偏高以及数据安全存忧等实际问题。 此前,广东移动 4 月 3 日在省级运营商中率先宣布,面向个人市场推出算力 Token 套餐,广东移动用户 4 月 30 日前可 0 元尝鲜;江苏移动 4 月 13 日也推出了“龙虾 AI Token 套餐”,限时优惠价 5 元起。 相关阅读: 《 国家超算互联网单用户免费词元(Token)额度升至 3000 万 》
IT之家 4 月 21 日消息,萤石今日发布了一款 EZVIZ AI Core X 智能大模型主机,是一款主机、NAS、家居中控多合一产品。 EZVIZ AI Core X 内置 64Tops 算力 ,配有 24GB 内存 + 128GB 闪存,采用黑色的桶装外观。 萤石 EZVIZ AI Core X 搭载 首个智能家居“小龙虾”Home Vita ,支持通过“龙虾”管理设备和文件,拥有操作记忆。 萤石 EZVIZ AI Core X , 还能联动家里的其他智能家居产品 ,比如通过监控摄像头观察院子里的孩子,在手机上推送“孩子在院子里踢球”的相关信息。 萤石 EZVIZ AI Core X 还能动态总结今日的录像、事件,帮助用户快速筛选有用信息。 对于存储的视频、照片等内容,萤石 EZVIZ AI Core X 支持通过自然语言对话搜索。 此外,萤石 EZVIZ AI Core X 通过 Home Vita 统一管理和控制多种协议的智能家居设备, 一句话就能设置自动化提醒程序 ,并根据用户的生活习惯主动推荐设置场景模型。 IT之家从发布会获悉,萤石 EZVIZ AI Core X 的价格信息暂未公布,国内暂时不进行发售。
IT之家 4 月 21 日消息,据财联社报道,国新办 4 月 21 日举行新闻发布会介绍 2026 年一季度工业和信息化发展情况。 工业和信息化部副部长张云明表示,下一步,工信部将引导算力基础设施按需有序建设,推动绿色电力与算力协同布局,推进算力自动化监测全域覆盖,完善中国算力平台,促进算力供需精准对接,提升算力资源利用效率。同时,将深入实施算力强基揭榜行动,推动成果落地转化和创新赋能,完善算力标准体系建设,支持开展太空算力技术前瞻性研究,有序推动太空算力产业发展。 张云明还表示,近年来,算力基础设施已成为驱动人工智能发展的关键底座。目前工信部正在开展算电协同政策研究和标准制定。 IT之家注意到,一季度,人工智能等新技术在电子、消费品行业应用加速拓展,无人机、AI 眼镜等终端产品日益丰富,工业机器人、集成电路等产品产量同比分别增长 33.2%、24.3%。
IT之家 4 月 18 日消息,科技媒体 Wccftech 昨日(4 月 17 日)发布博文,报道称 AMD 已与 AI 公司 Anthropic 达成合作, 后者计划采用 Instinct MI450 AI 加速器。 消息称受行业算力供应短缺影响,Anthropic 寻求多元化供应链。 在推进自研 AI 芯片的同时 ,Anthropic 目前已采用 NVIDIA GPU 和 Amazon Trainium 芯片,此外该公司还和博通、谷歌合作,使用其 TPU 芯片。而最新消息称,该公司计划和 AMD 合作,在其服务器中部署下一代 Instinct MI450 GPU 加速器。 AMD 此前已获得 OpenAI 和 Meta 等客户,其中 Meta 签署了 6 吉瓦的算力采购承诺。此次合作若达成,将是 AMD 在 AI 硬件市场的又一重要突破。 IT之家注:Instinct MI450 隶属于即将发布的 MI400 系列,基于 CDNA 5 架构,提供 MI450X 和 MI430X 型号。官方数据显示,MI400 计算性能达 40 PFLOP(FP4)和 20 PFLOP(FP8),较 MI350 系列翻倍。 新品引入 HBM4 内存标准,容量提升 50% 至 432GB,带宽达 19.6 TB/s,是前代产品的 2.45 倍,GPU 还配备 300 GB/s 的扩展带宽。
北京时间 4 月 16 日,据彭博社报道,英伟达 CEO 黄仁勋(Jensen Huang)周三表示,Anthropic 最新网络安全大模型 Mythos 取得的突破表明,美国应寻求与中国加强合作,以便这全球两大经济体的 AI 研究人员能够就如何安全使用这一日益强大的技术达成共识。 黄仁勋周三在接受科技播客 Dwarkesh 采访时表示:“我们希望美国能赢,但我认为保持对话、开展研究层面的交流可能是最安全的做法。我们必须努力达成一致,明确哪些用途是不能用 AI 去做的。这一点至关重要。” 他担心,美国与中国在贸易和安全问题上的紧张关系,已经阻碍了双方在关键研究领域的协作。 “由于我们当前把中国视为对手的态度,这一领域的交流明显缺失,”黄仁勋称,“我们的 AI 研究人员与他们的 AI 研究人员进行真正的对话,是至关重要的。” 出口管制 过去一年,黄仁勋一直在向特朗普政府施压,要求放宽美国的出口管制。这些管制以国家安全为由,阻止英伟达向中国销售其最顶级的 AI 处理器。 当被问及美国的出口管制是否限制了中国时,黄仁勋表示,中国市场并不会因算力不足而受限,因为中国拥有丰富的能源资源、制造“主流”芯片的技术,以及将更多处理器组合在一起的能力。 他表示,训练 Anthropic Mythos 模型所需的算力“相当普通”,并且“在中国大量可得”。 由于该模型具备强大的网络安全能力,目前仅向部分企业和政府官员开放。 “他们拥有如此丰富的能源。他们有完全空置、供电充足的数据中心,”黄仁勋称,“如果他们愿意,他们可以把更多芯片组合在一起使用,即使是 7 纳米的芯片。” “他们的芯片制造能力是世界上最强之一。”黄仁勋表示。
IT之家 4 月 15 日消息,Unigen 优力勤当地时间 13 日宣布推出 Amaretti E1.S AI Module,这是其首款生成式人工智能硬件解决方案。 IT之家了解到,Amaretti 模块采用 EDSFF E.1S 外形规格, 基于日本半导体企业 EdgeCortix 开发的 SAKURA-II 加速器 ,集成至高 32GB 的 128-bit LPDDR4x-4266 内存。 其整体功耗约为 10W,可提供 60 TOPS 的 INT8 算力或 30 TFLOPS 的 BF16 算力,支持 TensorFlow、PyTorch、ONNX、Hugging Face 等行业标准框架, 能满足 20B 模型本地运行的需求 。
谷歌上月宣布,将向Anthropic提供高达5吉瓦的服务器算力,但当时双方并未披露这笔合作涉及的具体金额。据知情人士透露,这项合作将于明年正式启动,作为协议一部分,Anthropic计划未来五年在谷歌累计投入约2000亿美元。谷歌上周向投资者披露了云业务合同储备收入,Anthropic一家就占到其中40%以上,代表着谷歌已锁定的云客户长期合约承诺规模。(新浪财经)
36氪获悉,银河证券认为,4月人工智能板块在板块内部仍然呈现出结构严重分化的特征,整体呈现硬件强、软件及应用弱的结构,短期看来地缘冲突以及油价中枢维持高位震荡的影响弱化,但受到财报季的影响,上游算力基础设施尤其是国产算力业绩大幅超预期,资金也更加青睐业绩确定性较强以及预期较高的板块及公司,短期来看结构分化仍然在延续,建议关注景气度较高的上游算力基础设施,尤其是国产算力产业链。