语言 - WWW.VNIRY.CN - WWW.VNIRY.CN

www.ithome.com · 2026-04-30 16:15:34+08:00 · tech

IT之家 4 月 30 日消息，今日，快手宣布推出 AI 桌面智能体产品 KroWork。据介绍，KroWork 面向非技术用户，通过自然语言即可驱动 AI 自主完成文件处理、浏览器自动化、应用生成和本地部署，意味着用户可使用 KroWork 将重复性工作流生成为本地桌面应用，同时数据不上传云端。KroWork 团队表示，希望通过 AI 降低软件开发门槛，让不会编程的人也能把日常需求变成自己的桌面工具。 IT之家附官方详细介绍如下：今天，KroWork 正式上线！ KroWork 是快手研发的一款运行在桌面端的通用 AI 智能体，用自然语言告诉 KroWork 你需要什么 —— 它会自主规划步骤、在安全沙箱中执行，然后把结果交给你。KroWork 不光能帮你完成写报告、做分析等常见的办公任务，还能帮你把重复性工作写成应用，并安装到桌面。你的应用你来管理。所思即所得，让创意效率直达桌面。 KroWork 适合谁？ KroWork 为非程序员的知识工作者而生 —— 市场营销、数据分析师、财务经理、研究人员、内容创作者、HR 专员。任何一位每天花大量时间在重复性电脑任务上的人，都值得拥有一位不知疲倦、能力出众的助手 KroWork。 KroWork 核心优势 1. 重复工作固化成应用，省力省钱和其他 AI 产品 " 每次从头推理 " 不同，KroWork 能更进一步，可以把用户的工作流固化为本地应用，下次使用只需点击 " 运行 "，无需再消耗积分 / token。以财务中发票报销的场景为例，财务人员只需告诉 Kro" 做一个发票报销汇总工具 "，它即可生成一个本地桌面应用 —— 导入发票明细后自动按部门归类、校验金额、标注异常项并生成汇总报表。下次月底报销时，双击打开直接使用。当然，KroWork 不止于工作，生活中你的小妙思也可以告诉 Kro，它会帮你做成你想要的应用。当然，所有应用都可以部署在你电脑本地，是你的个人资产。 Kro 解决本地部署的难题：做一款桌面应用不仅需要写代码，还需要配环境、装依赖等等，这一系列的事情对非技术用户来说难如登天。但没关系，Kro 来帮你，从代码生成、界面搭建到应用打包，Kro 一步到位。Kro 生成的应用直接出现在你的桌面上，双击即用，并且支持开机自启和系统级管理。固化为本地应用后，优势明显： • 代码部分在本地运行 —— 零 Token 消耗。 • AI 按固化指令精准执行 —— 输出稳定一致。 • 数据留在你的电脑上 —— 本地运行，数据安全。从一次性的 Prompt，到永久留存的产品。你的工作流，在本地，成为你的资产。不再为重复工作反复付费。 2. 本地托管，权限可控，安全透明 KroWork 在帮用户完成任务的过程中： • 沙箱执行：每项操作都在隔离的工作区中运行。 • 权限管控：在触碰沙箱外的任何内容之前，KroWork 都会先征求用户同意。 • 白盒可见：用户可以查看它执行的每一个步骤。 3. 集成市面顶尖模型，聪明好用 KroWork 集成了当前主流模型，能基于简单的自然语言指令，快速完成任务。国内版支持 Qwen、Kimi、Deepseek 等最新模型，国际版支持 OpenAI 和 Anthropic 最新旗舰模型。 KroWork 强项是写应用、帮用户部署、让用户来管理应用。当然，这并不意味着 KroWork 只会做应用，它会根据用户的实际需求选择最佳执行方式。你日常工作中的常规任务，KroWork 也能帮你高质量完成。KroWork 具备操作文件、生成文档、自动化浏览器操作等能力。日常工作中查资料、爬数据、做分析、写报告等全都不再话下。

腾讯多款 Agent 智能体亮相 2026 数字中国建设峰会，混元 Hy3 preview 语言模型同步迎来展会首秀

www.ithome.com · 2026-04-29 16:13:04+08:00 · tech

IT之家 4 月 29 日消息，在目前正在进行的 2026 数字中国建设峰会上，腾讯展示了旗下多款 Agent 智能体生态，腾讯混元 Hy3 preview 语言模型同步迎来展会首秀。现场工作人员向IT之家展示了腾讯 WorkBuddy 桌面智能体工作台，其号称只需要一句话描述，就能自动完成工作并交付可验收的结果。同时，工作人员还介绍了腾讯专为中国用户优化的 AI Skills 社区“SkillHub”，腾讯已将腾讯文档、腾讯会议、腾讯地图、ima、QQ 浏览器等核心产品能力封装为官方 Skills 分享在社区中，同时在第三方开发者加持下，目前 SkillHub 已收录超过 3.5 万个技能并在持续增长中。本届峰会上，最新发布的腾讯混元 Hy3 preview 语言模型迎来展会“首秀”。据介绍，这款模型是快慢思考融合的混合专家模型，总参数 295B，激活参数 21B，最大支持 256K 上下文长度。作为混元重建后训练的第一个模型，Hy3 preview 在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升，让中小企业无需高额投入，即可快速搭建专属 AI 应用。目前腾讯混元 Hy3 preview 已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy 等产品首发上线，实现“模型 + 产品”的协同。

FFmpeg 再次感谢腾讯提交 2200 行手写汇编代码，执行效率比 C 语言快 20 倍

www.ithome.com · 2026-04-25 21:19:41+08:00 · tech

IT之家 4 月 25 日消息，开源多媒体框架 FFmpeg 今天在 X 平台发文，感谢腾讯提交手写的 ARM NEON 汇编代码。据悉，本次新提交的补丁包含 2200 行手写汇编代码，主要针对 VVC（多功能视频编码）/H.266 Angular Prediction（角度预测）模块。在苹果 M4 处理器上，新代码执行效率相比原来的 C 语言代码快 20 倍。值得注意的是，FFmpeg 并不是第一次公开发文感谢腾讯。早在今年 1 月，腾讯提交的手写 ARM 汇编补丁就获得 FFmpeg 认可，比 C 语言快了 5 倍以上。 IT之家注：汇编语言（Assembly Language）是用于电子计算机、微处理器、微控制器或其他可编程器件的低级语言，相比目前众多高级语言的编写难度更高但运行效率也更高，可以直接通过指令操控寄存器、内存等。

小米发布 MiMo-V2.5-TTS / ASR 语音大模型：通过自然语言调度声音表现

www.ithome.com · 2026-04-24 07:34:22+08:00 · tech

IT之家 4 月 24 日消息，小米今日正式发布 MiMo-V2.5-TTS Series 与 MiMo-V2.5-ASR —— 一套面向 Agent 时代的全链路语音模型系列，覆盖识别与合成两大核心能力，让语音的输入与输出都可以被语言自由调度。 IT之家从官方介绍获悉，MiMo-V2.5-TTS Series 包含三款模型，现已登陆小米 MiMo 开放平台，并且限时免费。三者共享统一的风格指令遵循、音频标签控制与文本理解能力，让声音表现可以被语言精细调度，分别覆盖三种典型创作需求： MiMo-V2.5-TTS：内置多款高质量精品音色，支持语速、情绪、语气等精细化控制，开箱即用，满足多场景表达。 MiMo-V2.5-TTS-VoiceDesign：一句话快速定义并生成全新音色，让音色创作更直观、更高效。 MiMo-V2.5-TTS-VoiceClone：少量样本高保真复刻目标音色，同时保持稳定的风格指令遵循与音频标签控制能力。 MiMo-V2.5-ASR 正式开源。模型在中英双语、中文方言、Code-Switch、强噪音、多说话人等复杂真实场景下的语音识别性能达到业界领先水平，为 Agent 提供清晰可靠的语音转写，确保每一次交互都建立在精准的理解之上。 MiMo-V2.5-TTS 精准的风格指令遵循能力从简短的单句指令，到一整份导演笔记，模型都能稳定理解并遵循，覆盖情绪、语气、语速、发声方式、语言风格等多个维度。指令不必写成结构化参数 —— 像给演员说戏一样把想要的感觉描述出来，模型就会落到对应的演绎之中。对于一致性要求更高的场景 —— 有声剧、游戏 NPC、角色化对话等 —— 模型还支持导演剧本级的结构化输入：把人物、场景、详细指导分层描述，各层按自己的节奏独立更新、自由组合。这种分层既让角色的音色身份贯穿始终，也让每一句话的表演都能被单独控制。灵活的音频标签控制能力除了段落级的自然语言指令，模型还支持行内音频标签，用于在文本特定位置精准控制情绪、状态或风格。标签支持中英双语和开放文本描述，允许在同一段文本中灵活混用。从简单的情感标注，到多标签叠加、细粒度排布的复杂编排，模型都能稳定表达，在标签的表达力和组合稳定性上均有出色表现。丰富的文本理解能力即便没有任何 prompt，也没有任何标签 —— 就是一段最普通的文本 —— 模型也能直接表现出其中的韵律与情感。标点的停顿、句式的起伏，会被自然呈现；文本中暗藏的情感弧线，从平静叙述到激烈转折，模型能主动捕捉；甚至连字里行间透露出的说话人身份（年龄、气质、角色类型），也会自动落到声音里。换句话说：最朴素的纯文本，交给它，也能还你一段有血有肉的演绎。 MiMo-V2.5-ASR 如果说 TTS 是在“输出”端让声音成为创作工具，那么 ASR 就是在“输入”端为这一切打开大门。在真实场景下，语种切换、背景噪声、说话人带着浓重的方言口音，在这样的环境里还能听清、听准，才是真正好用的语音识别。 MiMo-V2.5-ASR 作为全链路语音模型系列的听觉基座，在中英双语、中文方言、Code-Switch、强噪音、多说话人、高知识密度等复杂真实场景下均达到业界领先水平。它不只是为了把清晰的语音转成文字，更是让 Agent 在嘈杂的真实声音里，抓住每一个值得被理解的字词。核心特点中文方言：支持吴语、粤语、闽南语、四川话等方言英文复杂场景：在 AMI 等复杂英文场景 Open ASR Leaderboard 上达到领先水平 Code-Switch：中英 Code-Switch 语音转录自由流畅，无需预设语种标签歌曲识别：中英文歌曲歌词识别，在伴奏与人声混合场景下保持高精度强噪音场景：在高噪音、远场拾音等复杂声学环境中保持鲁棒识别多说话人：支持多人交叉对话场景的准确转录，如会议场景强知识关联：古诗词、专业术语、人名、地名等知识密集型内容的精准识别原生标点：结合语音韵律与语义原生输出标点，转写结果即拿即用，无需后处理性能表现 MiMo-V2.5-ASR 在中英文通用、中文方言、Code-Switch 及歌词识别等多个维度上均取得当前最优或极具竞争力的结果，展现出跨场景、跨语种的稳定优势。以下为代表性评测结果：如何使用 MiMo-V2.5-TTS、MiMo-V2.5-TTS-VoiceDesign、MiMo-V2.5-TTS-VoiceClone 均在 Xiaomi MiMo API 开放平台限时免费，同时，用户可以到 Xiaomi MiMo Studio 进行快速体验。 MiMo-V2.5-ASR 目前已开源模型权重和代码，支持开发者和研究者直接使用或二次开发。参考 Xiaomi MiMo API 开放平台限时免费 Xiaomi MiMo Studio 快速体验 MiMo-V2.5-ASR Demo page MiMo-V2.5-ASR 项目开源地址 MiMo-V2.5-ASR 权重开源地址 MiMo-V2.5-ASR Huggingface space:

混元迄今最智能的模型：腾讯发布并开源 Hy3 preview 语言模型

www.ithome.com · 2026-04-23 15:54:07+08:00 · tech

IT之家 4 月 23 日消息，腾讯混元 Hy3 preview 语言模型今日发布并开源。这是一个快慢思考融合的混合专家模型，总参数 295B，激活参数 21B，最大支持 256K 上下文长度。官方表示，今年 2 月，腾讯混元重建了预训练和强化学习的基础设施，以及模型追求实用性的三个原则（能力体系化、评测真实性、性价比追求）， Hy3 preview 是重建后训练的第一个模型，也是混元迄今最智能的模型，在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。 Hy3 preview 已在元宝、CodeBuddy、WorkBuddy 、QQ、ima、QQ 浏览器、腾讯文档、腾讯乐享上线，并在微信公众号、腾讯新闻、腾讯自选股、和平精英、腾讯客服等多个产品陆续上线中。另外，Hy3 preview 已支持流行的开源智能体产品，如 OpenClaw、OpenCode、KiloCode 等。官方表示在腾讯云上推出了有竞争力的 API 价格，以及定制化的 Hy3 preview Token Plan 套餐，个人版定价最低 28 元 / 月，IT之家附详细价格如下： Hy3 preview API 价格输入分桶每百万 Tokens 输入价格每百万 Tokens 输出价格每百万 Tokens 输入价格（命中缓存） 0~16K 1.2 元 4 元 0.4 元 16~32K 1.6 元 6.4 元 0.6 元 32~256K 2 元 8 元 0.8 元 Token Plan - Hy3 preview 套餐套餐月费单价（元 / 百万 Tokens） Tokens 额度（百万） Lite 28 元 0.80 35 Standard 78 元 0.78 100 Pro 238 元 0.74 320 Max 468 元 0.72 650

多邻国向免费用户开放高级语言学习内容：涵盖中英日韩等九种语言

www.ithome.com · 2026-04-22 22:31:36+08:00 · tech

IT之家 4 月 22 日消息，在线语言学习平台多邻国（Duolingo）今日宣布，将其此前仅向付费订阅用户开放的高级语言学习内容免费向所有用户开放，适用于英语、西班牙语、法语、德语、意大利语、葡萄牙语、日语、韩语和中文九种语言，用户可通过网页端以及 iOS、Android 客户端访问相关课程。此次开放的高级内容对应欧洲共同语言参考标准（CEFR）的 B2 水平。B2 水平在 CEFR 六级框架中属于“独立使用者”级别，意味着学习者能够理解复杂文本的核心要义，能够进行流畅自然的交流，并能就复杂主题撰写清晰、详细的文本。 B2 水平的材料强调脱离翻译环境，通过复杂情境和专业词汇训练，帮助学习者在真实语境中理解和表达。多邻国表示，这意味着免费用户有机会从基础沟通能力进一步迈向“独立使用者”水平。 IT之家注意到，多邻国新提供的内容包括多项功能模块：“高级故事”用于强化阅读理解能力；类似播客的音频体验 DuoRadio 用于提升听力理解。借助这些工具，用户可以围绕更复杂的语言情境进行训练，例如准备求职面试、计划赴海外留学，或在无需依赖翻译的情况下阅读新闻报道、观看影片及阅读书籍。在多邻国应用内，用户的学习进度由“Duolingo Score”衡量，B2 水平对应约 129 分的分数，该分数还可直接整合至 LinkedIn 个人档案中展示。

阿里通义 Fun-ASR1.5 语音识别大模型发布：精通 30 国语言及中文七大方言

www.ithome.com · 2026-04-20 14:29:18+08:00 · tech

IT之家 4 月 20 日消息，4 月 20 日（今天）下午，阿里通义实验室正式推出语音识别大模型 Fun-ASR1.5。其基于统一的大模型架构，单模型即可覆盖 30 种语言、汉语七大方言体系及 20+ 地方口音，古诗词吟诵也能精准转写。目前，Fun-ASR1.5 已在阿里云百炼平台正式上线，面向教育、传媒、金融、科技、文化等各行业客户提供 API 服务。在一些“高难度”的跨语言切换（Code-Switching）场景下，它也能应对自如。比如，同一段对话里夹杂多种语言，模型也能准确识别，无需提前告诉它接下来要说哪种语言。Fun-ASR1.5 现在可以做到无需预设语种标签，就自动识别并切换，保证转写的准确性。据IT之家了解，该能力源于模型的架构和训练创新。MoE（混合专家）架构让模型内部可以分工协作，听到特定语言时仅激活相关部分进行处理，因而更为灵活高效。同时，在训练阶段分级、分阶段地使用精准数据，也让模型能更好地应对真实世界中的复杂语音情况。在中文本土化方面，基于数十万小时真实方言语音数据的“喂养”，Fun-ASR1.5 的平均字错误率（CER）相比上一版本下降 56.2%。 Fun-ASR1.5 可原汁原味还原方言，如上海话的“侬”、苏州话“倷”（均指“你”），为下游模型处理方言文字提供了准确的基础语料。 Fun-ASR1.5 对中文古诗词识别进行专项优化。研究团队构建了先秦至近代的古诗词语音-文本对齐语料库，涵盖《诗经》《楚辞》、李白杜甫诗集、苏轼辛弃疾词作等经典文本的真人诵读录音。在内部评测集中，Fun-ASR1.5 对古诗词的字符级准确率达到 97% ，可应用于国学在线课程和有声诗词，助力文化传承。模型还可以基于上下文语义自动插入逗号、句号、问号、感叹号等标点，使转写结果接近书面表达。例如输入语音：“今天天气怎么样啊我想出去走走但又怕下雨”，输出文本就是“今天天气怎么样啊？我想出去走走，但又怕下雨。” 其还支持将口语中的非标准表达自动转换为规范格式：数字：“三千五百六十二” → “3562” 日期：“二零二六年三月二十九号” → “2026 年 3 月 29 日” 金额：“五万八千块” → “58000 元” 电话：“幺三八零零幺三八零零零” → “13800138000” 这些改进大幅降低了会议纪要、新闻采访整理、法律笔录等场景的后期人工校对和编辑成本。目前，用户可在阿里云百炼平台调用其 API，或在魔搭社区直接体验。阿里云百炼： https://bailian.console.aliyun.com/cn-beijing ?tab=model# /efm/model_experience_center/voice ?modelId=fun-asr 魔搭社区： https://modelscope.cn/studios/iic/FunAudio-ASR

DeepL 推出实时语音翻译功能，支持语言对语音通话

www.ithome.com · 2026-04-16 20:50:56+08:00 · tech

IT之家 4 月 16 日消息，此前专注于文字内容的语言人工智能企业 DeepL 德国当地时间今日宣布推出专为实时口语交流设计的实时翻译产品套件 DeepL Voice-to-Voice。 DeepL Voice-to-Voice 套件包括 Voice for Meetings 会议实时翻译、跨平台的 Voice for Conversations、跨语言群组对话、API、专门化自定义等一系列功能，部分将在未来正式推出。在 DeepL 委托 Slator 独立进行的盲测中， 96% 的语言学家更青睐 DeepL Voice 而非谷歌、微软、Zoom 提供的原生翻译解决方案。 DeepL 创始人兼首席执行官 Jarek Kutylowski 表示：今天，我们在翻译领域又迈出了新的一步：实时口语交流。我们的使命一直是打破语言障碍，而如今，我们已成功攻克了其中最难的一道。 DeepL Voice-to-Voice 语音通话功能让每个人都能用自己的语言自然交流，无需面对翻译带来的障碍或成本。我们将世界一流的语音模型与我们不断推向新高度的业界标杆级翻译人工智能相结合。现在，专业能力才是关键，语言并不重要。

阿里云 AI 开发工具妙悟 Meoo 发布：1 分钟自然语言生成完整网站或 H5 页面，集成千问、Kimi、GLM、MiniMax 四大模型

www.ithome.com · 2026-04-15 15:47:06+08:00 · tech

IT之家 4 月 15 日消息，阿里云今日宣布推出阿里 ATH 事业群首款 AI 开发工具“妙悟 Meoo”。该工具集成了千问、Kimi、GLM、MiniMax 四大模型，并内置阿里云数据库、存储等核心产品服务。用户无需具备任何编程基础，仅使用自然语言描述自身需求，Meoo 即可在最快 1 分钟内自动生成前端与后端完整的网站或 H5 页面，并支持在阿里云上一键部署上线。据官方介绍，Meoo 内置了阿里云数据库、存储服务、域名服务、FC 沙盒服务、NAS 文件系统、百炼模型 API 等核心产品，无需用户额外配置，即可直接完成前端界面、后端逻辑和数据库搭建等任务，生成的应用具备完整功能。在模型层，Meoo 集成了 Qwen3.6-Plus、Kimi K2.5、GLM-5、MiniMax-M2.5 四个大模型，能够基于简单指令快速生成匹配用户需求的代码。在 Agent 框架层，Meoo 支持蜂群 Agent 模式，允许多个 Agent 并行处理任务，简单应用的生成时间可低至 1 分钟。对于复杂任务，用户可选择 Agent 模式，Meoo 能够自主规划并拆解任务，在遇到问题时进行自我检测和修复。在实际应用场景中，销售人员准备在节假日进行促销活动，只需在 Meoo 上输入活动规则，几分钟内即可生成一个 H5 活动页面，并能展示转化数据。创作者可将个人作品集或一段文字描述发送给 Meoo，生成可交互的个人作品集网站。 IT之家附官网地址： https://meoo.com/

阶跃发布新一代自动语音识别模型StepAudio 2.5 ASR

36kr.com · None · tech

36氪获悉，4月24日，阶跃发布新一代自动语音识别模型StepAudio 2.5 ASR。据介绍，该模型率先将大语言模型推理加速技术引入语音识别领域，在推理速度与转写精度两个维度均有显著提升，主要面向会议转写、语音交互、输入法、媒体内容处理、长音频识别等场景。

腾讯混元Hy3 preview发布并开源

36kr.com · None · tech

36氪获悉，4月23日，腾讯混元Hy3 preview语言模型发布并开源。该模型总参数295B，激活参数21B，最大支持256K上下文长度。这是混元重建后训练的第一个模型，也是混元迄今最智能的模型。

智元旗下觅蜂发布一站式物理 AI 数据服务平台｜最前线

36kr.com · None · tech

2026年，大语言模型和视频生成大模型都在疯狂烧token，而具身机器人行业却正在经历“无token可烧”的局面。大模型能像人一样读书，而具身智能要去真实的世界里摸爬滚打才能获取数据——数据的匮乏成为了卡住全行业的瓶颈。 4月16日，智元机器人旗下觅蜂科技发布一站式物理 AI 数据服务平台，希望能让数据像水电一样即取即用。 “GPT5用了100万亿tokens的训练语料。1token约等于0.75个英语单词，如果一个正常人一分钟能说150个词，这个语料级就等于一个人要说100亿个小时才能说完。”觅蜂科技董事长兼 CEO 姚卯青说，“但具身智能不一样。今天，全世界的高质量数据汇聚在一起，可能也只有50万小时的规模。” 数据资源匮乏且扩容缓慢，是因为具身智能所需要的训练数据，比大预言模型需要的训练语料要难获得的多。在三维的开放世界，行业各家公司已经尝试了通过真机遥操或仿真数据等等各种方式去积累数据，但仍然难以摆脱高成本和增速慢的问题。现在，最前沿的采集方式是“无本体采集”。无本体采集（Object-free/Body-less Data Collection）是指在具身智能训练中，直接利用人类操作（手戴传感器夹爪）或轻量化设备记录动作，而非依赖昂贵的实体机器人本体进行遥控操作。它通过人手抓取、移动等方式记录高质量、多模态的动作数据，具有成本低、采集效率高、场景泛化性强等优势。发布会上，觅蜂推出了 MEgo 系列无本体数据采集硬件及 MEgo Engine 数据治理引擎。MEgo 系列包含采集夹爪、头戴式采集设备等，设备具备超 300° 全景感知与亚毫秒级数据同步能力，支持在工厂、商超、家庭等全场景随时随地轻量化采集。这款名为 MEgo Gripper 的夹爪全通道支持1080P 60fps，轨迹重建的精度可以达到一毫米，确保拿起一张纸的力度都可以被还原，“让客户拿到数据就能直接落地”，以及亚毫秒级无线时间同步。这个设备只有480g的重量，支持电池快换快拆，摆脱了电线，方便人“走到哪采到哪”。 MEgo Gripper 另一款头戴式采集设备MEgo View融合了头部超过300度的视野，以及两个附着在手腕上的局部相机，既可以兼顾超广域的环境，也可以做到腕部和手部操作细节的捕捉。它搭载7个高清摄像头，车规级九轴IMU（惯性测量单元），可以输出RGB图片、IMU，还有位姿、音频在内的全感官数据。 MEgo View 与夹爪设备一样，头戴式采集设备同样采用无线设计，支持电池快换，并能实现亚毫秒级无线时间同步。轻量化的硬件，带来了数据采集门槛的降低。在发布会后的采访环节，姚卯青告诉包括36氪在内的媒体，他认为未来理想的采集者工作模式可能会类似于“美团骑手”——“大家可以兼职来做，但同时也要经过驿站的培训才能上岗。” 在软件上，MEgo系列解决方案背后有一套MEgo Engine 数据治理引擎，用来处理所有MEgo设备采集到的数据，包括数据的预处理、提取、评估等等，而且可以评估在机器人上的表现，实现一站式数据的多种标注。姚卯青表示，觅蜂已经实现了真机遥操、无本体采集、仿真数据全范式覆盖，旨在“让高质量数据像水电一样即取即用。”该公司计划在 2026 年实现千万小时级数据产能，2030 年达成百亿小时级数据产能。作为智元机器人旗下企业，觅蜂的定位却是面向其他机器人公司的To B数据服务平台。在活动后的采访环节，有媒体向姚卯青提问：“说服说服智元的竞争对手去买你们的数据？” 姚卯青回复说，“觅蜂作为一家独立的数据服务平台，所有的用户数据交易都有严格协议。数据的交易模式分为‘使用权’和‘所有权’两种，过去大部分用户都是选择了购买使用权而不是所有权，对于极个别选择购买所有权��客户，我们会进行严格的资产转移，在本地销毁数据。” “智元并不是需要所有数据，它也没法获取觅蜂的数据。”姚卯青说，“智元现在向觅蜂获取数据的唯一途径，就是市场化下订单。智元不存在免费从觅蜂获取数据的途径。” 在发布会上，觅蜂宣布与京东云、百度云、阿里云、猎聘及贵州大数据集团等多家企业举行战略签约，各方将在数据生态、场景协同、算力支撑等领域展开深度合作。

大语言模型会在蒸馏中“夹带”自己的偏好

36kr.com · None · tech

《自然》15日发表的一项研究显示，大语言模型（LLM）可能会将某些自己的偏好“夹带私货”传授给其他算法，即使在训练数据中清除原始特征后，这些本不需要的特征，仍可能持续存在。在一个案例中，一个模型似乎通过数据中的隐含信号，将自己对猫头鹰的偏好传递给了其他模型。该研究结果表明，在开发LLM时，需要进行更彻底的安全检查。（财联社）

/tag/语言