IT之家 4 月 29 日消息,今日腾讯混元宣布开源手机端离线翻译模型 Hy-MT1.5-1.8B-1.25bit,把支持 33 种语言的翻译大模型压缩至 440MB,无需联网,下载即可直接在手机本地运行,“翻译质量优于谷歌翻译”。 演示设备:高通骁龙 865,8GB 内存 IT之家附官方详细介绍如下: 基于混元翻译大模型 Hy-MT1.5 打造,翻译效果比肩商用翻译模型 Hy-MT1.5 是腾讯混元团队打造的专业翻译大模型,原生支持 33 种语言、5 种方言 / 民汉及 1056 个翻译方向。从常见的中英互译,到法语、日语、阿拉伯语、俄语,甚至藏语、蒙古语等少数民族语言,它都能游刃有余地处理。 仅以 1.8B 参数量,Hy-MT1.5 实现了比肩商业翻译 API 和 235B 级大模型的翻译效果。在严格的评测基准中,其翻译质量不仅超越了谷歌翻译等主流系统,更证明了在高效优化下,轻量级模型能够迸发出令人印象深刻的翻译能力。 Hy-MT1.5-1.8B 翻译效果评分,详情见文末链接「Hy-MT1.5 技术报告」 但问题来了:原始的 1.8B 模型即使在 FP16 精度下,依然占用 3.3GB 内存。对于手机上金子般的内存来说,依然太大、太慢,所以需要量化压缩。 最极致的量化压缩,把模型装进手机 量化压缩,简单来说就是:把模型里原本用 16 位数字 (16-bit) 表示的参数转用更低位数字储存。这就像把一幅高清照片压缩成缩略图,文件小了很多,但你还是能看清楚里面的内容。针对不同的手机用户,腾讯特别推出了 2-bit 与 1.25-bit 两种极致的量化压缩方案。 不同大小的模型在 FLORES-200 中外互译的效果评分 2-bit 模型:性能与质量的平衡(适用:中高端机型) 2-bit 模型采用了业内顶尖的拉伸弹性量化(SEQ),将模型参数量化至 {-1.5,-0.5,0.5,1.5},并结合量化感知蒸馏,在将模型体积压缩至 574MB 的同时,实现了几乎无损的翻译质量,效果超越上百 GB 的大模型。在支持 Arm SME2 技术的移动设备上,2-bit 模型能够实现更快速、更高效的推理。 2-bit 模型在 SME2 及 Neon 内核的速度对比演示 1.25-bit 模型:Sherry 极致压缩(适用:全系机型) 为了达成极致的轻量化,腾讯推出了基于 Sherry(稀疏高效三值量化)技术的 1.25-bit 模型。该技术方案已经被 NLP 顶级学术会议 ACL 2026 录用。 链接: https://arxiv.org/ abs/2601.07892 Sherry 压缩方案的核心逻辑在于“细粒度稀疏”策略:每 4 个模型参数,3 个最重要的用 1-bit 储存,1 个用 0 储存,平均每个参数仅需 1.25-bit。 配合腾讯专门为手机 CPU 设计的 STQ 内核,该方案实现了对 SIMD 指令集的完美适配。最终,3.3GB 的原始模型被进一步压缩至 440MB,轻松常驻后台,让内存紧张的普通手机也能顺滑进行高质量离线翻译。 FP16 (八倍速)vs.1.25bit 速度对比,演示设备:高通骁龙 888,8GB 内存 实际体验:全离线、零成本、零隐私暴露 本次开源不仅包含模型权重,我们还特别制作了一个实际可用的腾讯混元翻译 Demo 版,特别适配了“后台取词模式”。无论是在本地查看邮件还是浏览网页,混元翻译都能随叫随到。无需网络,无需订阅,完全本地处理、不涉及个人信息的采集和上传,一次下载永久使用! 演示设备:高通骁龙 7+gen2,16GB 内存 立即体验 所有的模型权重、代码及技术报告均已全面开源。(暂时只支持安卓体验 demo,后续正式版会添加对 IOS 等平台的支持。) 体验链接: Huggingface(海外用户):: https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-1.25bit-GGUF / resolve / main / Hy-MT-demo.apk 魔搭社区(国内用户): https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-1.25bit-GGUF / resolve / master / Hy-MT-demo.apk 模型下载 1、Huggingface(海外用户): 2-bit 模型权重: https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-2bit 2-bit 模型 gguf: https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-2bit-GGUF 1.25-bit 模型权重: https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-1.25bit 1.25-bit 模型 gguf: https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-1.25bit-GGUF 2、魔搭社区(国内用户): 2-bit 模型权重: https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-2bit 2-bit 模型 gguf: https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-2bit-GGUF 1.25-bit 模型权重: https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-1.25bit 1.25-bit 模型 gguf: https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-1.25bit-GGUF 3、技术报告: Sherry 论文地址: https://arxiv.org/ abs/2601.07892 AngelSlim 技术报告: https://arxiv.org/ abs/2602.21233 Hy-MT1.5 技术报告: https://arxiv.org/ abs/2512.24092 4、代码仓库: AngelSlim: https://github.com/tencent/AngelSlim
IT之家 4 月 29 日消息,在目前正在进行的 2026 数字中国建设峰会上,腾讯展示了旗下多款 Agent 智能体生态,腾讯混元 Hy3 preview 语言模型同步迎来展会首秀。 现场工作人员向IT之家展示了腾讯 WorkBuddy 桌面智能体工作台,其号称只需要一句话描述,就能自动完成工作并交付可验收的结果。 同时,工作人员还介绍了腾讯专为中国用户优化的 AI Skills 社区“SkillHub”,腾讯已将腾讯文档、腾讯会议、腾讯地图、ima、QQ 浏览器等核心产品能力封装为官方 Skills 分享在社区中,同时在第三方开发者加持下,目前 SkillHub 已收录超过 3.5 万个技能并在持续增长中。 本届峰会上,最新发布的腾讯混元 Hy3 preview 语言模型迎来展会“首秀”。据介绍,这款模型是快慢思考融合的混合专家模型,总参数 295B,激活参数 21B,最大支持 256K 上下文长度。 作为混元重建后训练的第一个模型,Hy3 preview 在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升,让中小企业无需高额投入,即可快速搭建专属 AI 应用。目前腾讯混元 Hy3 preview 已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy 等产品首发上线,实现“模型 + 产品”的协同。
IT之家 4 月 27 日消息,腾讯云官方今日宣布 QClaw 发布 v0.2.14 版本更新。据介绍,这是该项目迄今为止力度最大的一次版本更新。 本次升级中,QClaw 正式接入支持 Hermes 框架,用户可创建并运行 Hermes 类型的 Agent,实现单一应用内同时运行两种 Agent 内核。 在此次更新中,原有的“灵感广场”功能全面升级为“专家广场”。新版本内置了超过 100 个按行业和场景分类的 AI 专家,用户选择对应领域的专家后,只需用自然语言描述需求,专家即可直接生成可用的文档、报告、代码或分析结论。每个专家都拥有独立的人设与隔离的会话空间,交互流程简化为“选专家、说需求、拿结果”三步,用户无需了解 Prompt、Skill 或 Agent 的概念,也无需进行额外配置或训练。首期上线的专家覆盖内容创作、数据分析、代码开发等多个领域。 远程操控方面,QClaw 的微信小程序同步升级,新增语音交互与文件共享功能。用户可通过微信小程序「QClaw 管家」以语音方式远程下达指令,并支持将文件分享给好友。此外,小程序还支持一键绑定用户在 Lighthouse 云服务器上已购买的云端 Agent 实例。完成绑定后,本地和云端的 Agent 可在小程序中统一管理和调度,用户即使不在电脑前也能远程执行任务。 底层模型方面,QClaw 从固定使用模式升级为自由切换模式。用户可选择系统智能匹配模型,也可手动指定。目前已支持的模型包括 Hy 3 preview、DeepSeek-V4 Pro、KIMI-K2.6 及 GLM-5.1。其中,Hy 3 preview 是腾讯混元重建后训练的首个模型,为快慢思考融合的混合专家模型,总参数 295B,激活参数 21B,最大支持 256K 上下文长度。IT之家注意到,DeepSeek-V4 Pro 则是 DeepSeek 于 4 月 24 日发布的开源模型,总参数 1.6T,激活参数 49B,上下文长度达 1M。与此同时,积分统计体系也从原有的 Token 计数改为按任务类型和所用模型匹配积分额度。 连接器方面,本次更新新增了对百度网盘、携程、飞猪和腾讯新闻四个平台的接入支持。用户可通过对应的连接器让 Agent 访问百度网盘中的文件、查询携程和飞猪上的行程信息,以及获取腾讯新闻的内容摘要。 此外,QClaw 还上线了基于腾讯文档的 Agent 团队协作功能,团队成员之间可以通过腾讯文档指挥 Agent 共同编辑同一份文档,实现团队协作。
IT之家 4 月 23 日消息,腾讯混元 Hy3 preview 语言模型今日发布并 开源 。这是一个快慢思考融合的混合专家模型,总参数 295B,激活参数 21B,最大支持 256K 上下文长度。 官方表示,今年 2 月,腾讯混元重建了预训练和强化学习的基础设施,以及模型追求实用性的三个原则(能力体系化、评测真实性、性价比追求), Hy3 preview 是重建后训练的第一个模型,也是混元迄今最智能的模型 ,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。 Hy3 preview 已在元宝、CodeBuddy、WorkBuddy 、QQ、ima、QQ 浏览器、腾讯文档、腾讯乐享上线,并在微信公众号、腾讯新闻、腾讯自选股、和平精英、腾讯客服等多个产品陆续上线中。另外,Hy3 preview 已支持流行的开源智能体产品,如 OpenClaw、OpenCode、KiloCode 等。 官方表示在腾讯云上推出了有竞争力的 API 价格,以及定制化的 Hy3 preview Token Plan 套餐, 个人版定价最低 28 元 / 月 ,IT之家附详细价格如下: Hy3 preview API 价格 输入分桶 每百万 Tokens 输入价格 每百万 Tokens 输出价格 每百万 Tokens 输入价格(命中缓存) 0~16K 1.2 元 4 元 0.4 元 16~32K 1.6 元 6.4 元 0.6 元 32~256K 2 元 8 元 0.8 元 Token Plan - Hy3 preview 套餐 套餐 月费 单价(元 / 百万 Tokens) Tokens 额度(百万) Lite 28 元 0.80 35 Standard 78 元 0.78 100 Pro 238 元 0.74 320 Max 468 元 0.72 650
IT之家 4 月 16 日消息,腾讯宣布,今天,混元 3D 世界模型 2.0(HY-World 2.0)正式发布并开源。 IT之家从官方介绍获悉,HY-World2.0 是一个多模态世界模型,能够根据文字、图片、视频等不同类型输入,自动生成、重建和模拟 3D 世界,同时支持多格式 3D 资产(Mesh/3DGS / 点云等)导出, 支持与现有的游戏工作流无缝对接 ,用于快速生成游戏地图和关卡原型。混元世界模型 2.0 让 AI 从“对话”、" 画图 "、“捏物体”,进化到了“造世界”—— 生成包含人、物、景的完整“世界”。 此前主流的世界模型,例如谷歌 Genie 3 和混元世界模型 1.5,仅能生成视频文件,本次发布的世界模型 2.0 的实用性更进一步 —— 它可以直接生成可二次编辑的 3D 资产文件 ,并且,这些生成的 3D 资产可以直接导入到游戏制作或者具身仿真引擎。 支持多种模态输入,草图变地图、图片变空间 输入一段文字或一张图片,模型即可精准解析复杂语义,一键生成风格多样的可漫游世界。相比较混元世界模型 1.0,2.0 的模型架构全面升级,画面精细度和真实感大幅提升。用户还可以自定义风格,按需生成真实风、漫画风、游戏风的 3D 空间。生成完成后, 用户可以将资产导入到 Unity、UE 等引擎、进行二次编辑 ,显著降低了游戏地图的创作门槛。 模型还支持角色模式,用户可以操作角色在街道、建筑、场景中自由探索,不限时间,具有物理碰撞,就像在游戏里一样。 同时,世界模型 2.0 支持复刻真实 3D 场景,用户输入一段真实空间的视频或者多视角图片,模型就能构建出高精度的数字孪生空间。基于升级后的 WorldMirror 2.0 架构, 模型支持任意尺寸图像与视频输入 ,一次性预测密集点云、多视角深度图、表面法线及相机参数,一次生成永久可复用。未来,室内装修预览、城市规划、文化遗产保护等场景,都可以基于这一能力实现快速构建和还原。 与其他世界模型相比,混元世界模型 2.0 在场景完整度(物体侧面和背面)以及对输入图片的遵循程度表现更优。混元生成的 3DGS 与 Mesh 的混合表征,也让用户能够开启角色模式进行有真实物体碰撞的交互。 以 3D 生成为主轴,统一空间理解、生成、重建 混元官方称,传统方法需要精确的相机参数才能生成全景图,但现实中这些参数往往拿不到。 HY-World 2.0 全新升级 HY-Pano-2.0 模型,采用端到端隐式学习方案,让模型自己学会从普通图片到 360 度全景的空间映射, 完全不需要任何相机元数 。再配合团队的真实全景照片和 UE 引擎合成数据的混合训练策略,保证了生成质量和泛化能力。 通过团队自研的空间 Agent 技术,结合 VLM 与游戏自动寻路算法常用的 navmesh 表征,让大模型能够理解空间语义,并智能规划出有意义的漫游轨迹,确保覆盖场景中最有价值的区域, 同时避免穿墙、跑飞 。模型会根据每个场景的不同语义,规划出“环绕物体”、“最大漫游”等五类运镜轨迹,这样搭配下一步的世界扩展模型,可以让用户在 3D 世界中的探索路径既自然又有趣。 这一步的关键创新在于“精确的相机控制 + 细粒度视觉细节保持 + 空间一致性记忆机制”,这一套流程可以确保新生成的区域与已有区域在几何和视觉上完美衔接,不会“穿帮”。通过记忆力机制的设计以及体系化的中间训练和后训练,团队打造了目前业界最强的新视角生成(NVS)模型 HY-WorldStereo。生成画面对输入相机的精准跟随,且多条运镜的生成结果保持空间一致不会有冲突;通过后训练算法的设计,使得保持快速生成的同时画面质量不会衰减。 最后,将所有生成的片段通过 HY-WorldMirror 2.0 整合为一个统一的、可交互的 3D 世界。使用定制的 Depth alignment 和自适应 Mask gaussian 场景优化算法,生成的场景采用 3D 高斯泼溅(3DGS)表示,同时可以转出高质量 mesh,可以无缝导出到 Unity / UE 等主流游戏引擎,支持二次编辑和创作。 参考 申请体验 开源代码 技术报告
36氪获悉,4月29日,腾讯混元推出并开源极致量化压缩版本翻译模型Hy-MT1.5-1.8B-1.25bit,把支持33种语言的翻译大模型压缩至440MB,无需联网,下载即可直接在手机本地运行。
36氪获悉,4月29日,OpenRouter发布最新全球大模型API调用量排行榜,腾讯混元新模型Hy3 preview在总榜上排名第一。同时,在分场景的调用量排行中,Hy3 preview在工具调用排名第一,在编程排名第二。
36氪获悉,4月23日,腾讯混元Hy3 preview语言模型发布并开源。该模型总参数295B,激活参数21B,最大支持256K上下文长度。这是混元重建后训练的第一个模型,也是混元迄今最智能的模型。
36氪获悉,4月16日,混元3D世界模型 2.0(HY-World 2.0)正式发布并开源。HY-World 2.0是一个多模态世界模型,能够根据文字、图片、视频等不同类型输入,自动生成、重建和模拟3D世界,同时支持多格式3D资产(Mesh/3DGS/点云等)导出,支持与现有的游戏工作流无缝对接,用于快速生成游戏地图和关卡原型。