WWW.VNIRY.CN
标签聚合 实时

/tag/实时

www.ithome.com · 2026-05-06 15:23:11+08:00 · tech

IT之家 5 月 6 日消息,有网友 5 月 5 日发布视频称,自己乘坐顺风车前往沈阳途中,司机在高速公路开启智能驾驶功能,随后躺卧在座椅上熟睡,呼噜声不断。 据二三里资讯今日报道,视频发布者介绍称,5 月 4 日,自己与同事在滴滴出行平台预约顺风车,从山东淄博前往沈阳。该司机此前从北京送游客到淄博游玩,送达后接单搭载二人。“从淄博出发,行驶至临淄、还未驶出淄博辖区时,司机就开启智驾模式并开始睡觉打呼噜,我当时被吓了一跳,立刻将他叫醒。”小张表示, 司机当时声称十分熟悉车辆性能,使用辅助驾驶从未出现问题。行程途中,他又叫醒熟睡的司机,对方始终表示不会有安全隐患 。 滴滴出行客服工作人员表示,根据平台相关规定,顺风车默认是不允许使用智驾的,顺风车与滴滴快车等是不同的,顺风车司机多为兼职,与快车等营运车辆属性不同, 目前平台暂无技术手段,无法实时监测司机是否违规使用智驾 。如果乘客在订单期间发生任何问题,滴滴出行都会有专员跟进处理,乘客不用害怕。出现这种情况是他们监管不到位,导致出现危险驾驶情况,这个问题确实是他们的问题。 据IT之家今日早些时候报道 ,杭甬高速上昨日发生了一例因过度信任辅助驾驶而产生的违规行为,司机开辅助驾驶后睡着,车辆在高速上违停险被追尾,司机也被罚款 200 元记 9 分。

www.ithome.com · 2026-05-06 14:38:47+08:00 · tech

IT之家 5 月 6 日消息,HarmonyOS 开发者官方微博今日宣布, 华为鸿蒙 6 系统负一屏的「Today-Task Skill」正式上线 。 据介绍, AI Claw 任务动态现已实时接入 HarmonyOS 6 的负一屏 ,从进度追踪到结果呈现,无需打开电脑,桌面右滑后可立即进行同频,展示重要进展。功能路径如下: 桌面右滑至【负一屏】→ 在顶部服务动态提醒处即可查看 参考IT之家此前报道,今年 4 月初,华为鸿蒙 HarmonyOS 6 系统的负一屏应用 —— 智慧助手 · 今天开启 15.0.22.210 版本内测, 支持关联 Claw 智能体功能 ,可提供 AI 任务完成提醒等服务。

www.ithome.com · 2026-05-05 16:40:05+08:00 · tech

IT之家 5 月 5 日消息,RingConn Gen 3 智能戒指现已正式发布,主打长期血管健康洞察、AI 健康震动提醒, 定价为 2599 元 。 系列戒指整体重量 2.5-3.5 克,拥有 IP68 认证,外部采用钛合金材质,可选未来银、磨砂黑、耀阳金、缎光银、缎光玫瑰金五种配色,覆盖拉丝、亮面、磨砂形态。 系列戒指配备“全天候血压健康评估技术”,支持“夜间血压实时追踪”“全天血压波动分析”,同时支持检测血氧、心率、体温。还可检测睡眠呼吸健康,可提供 AHI 风险监测、睡眠阶段记录、睡眠评分功能。内置电池至高提供 14 天续航。 IT之家附产品参数: 京东 RingConn Gen 3 智能戒指 2599 元 直达链接

www.ithome.com · 2026-05-04 22:20:38+08:00 · tech

IT之家 5 月 4 日消息,据外媒 Sky News 报道,英国警方目前正持续扩大 AI 人脸识别技术在执法中的应用,执法人员可以利用手机等设备将实时拍摄到的画面与警方数据库进行实时比对,从而快速确认人员身份。 根据警方规划,该系统已逐步与随身手机、执法记录仪等设备整合,可应用于街头巡逻、大型活动安保以及高风险区域执法领域,以进一步缩短身份核查时间,提高响应效率。这意味着当地部署的人脸识别功能正从过去单一固定监控摄像头延伸到更加灵活的一线执法场景。 对此,外界担心英国警方在提升执法效率的同时可能带来过度监控以及误识别等问题。对此,英国警方表示,相关技术仍在持续完善,警方将遵循现有的数据保护和法律框架,以平衡安全与隐私之间的关系。 相关阅读: 《 英国拟全面推广 AI 人脸识别系统,但黑人、亚裔“极易”被误报为涉案人员 》

www.ithome.com · 2026-05-03 08:43:54+08:00 · tech

IT之家 5 月 3 日消息,华为乾崑智能汽车解决方案昨晚公布了 4 月安全出行报告,宣布华为乾崑累计辅助驾驶里程 104.7 亿公里,跨越了百亿里程碑。 IT之家注意到,华为智能汽车解决方案 BU CEO 靳玉志宣布,除月度安全出行报告外, 华为乾崑智驾辅助驾驶实时数据已在官网正式上线 。 华为乾崑官网显示,乾崑智驾累计辅助驾驶里程已突破 106 亿公里、搭载乾崑智驾车辆累计行驶总里程突破 313 亿公里, 同时数据也正在实时累加 。官方表示,华为乾崑智驾 ADS 在平均安全行驶里程上已超越人类驾驶员。

www.ithome.com · 2026-04-30 15:19:23+08:00 · tech

IT之家 4 月 30 日消息,游戏媒体 respawnfirst 昨日(4 月 29 日)发布博文,报道称索尼获批名为《用户自定义关卡生成》的专利, 让生成式 AI 根据玩家情绪与表现,动态调整游戏难度。 该专利编号为 US20260108814,描述了基于 AI 的动态关卡生成系统,通过分析玩家的游戏行为模式,判断其倾向于进攻型、防守型还是规避型策略,并据此构建初始游戏体验。 例如,对于偏好潜行的玩家,系统初期会生成奖励谨慎行动的场景,让游戏体验高度匹配玩家的天然倾向。IT之家附上相关专利图如下: 该技术的创新之处在于其“反向挑战”机制。当监测到玩家在特定风格下持续取得成功后,系统将主动切换关卡风格,针对玩家优势提出更高挑战。 例如,热衷潜行的玩家可能会遭遇难以避开的正面交锋场景,迫使其开发新的通关策略。专利文件明确指出,此举旨在打破静态进度系统的局限,推动玩家不断适应新环境,而非单纯提升数值难度。 为防止玩家产生过度挫败感,系统内置了情绪监测与回调机制。一旦检测到玩家遭遇过度失败或沮丧情绪,游戏将自动恢复至符合玩家个人风格的状态。 索尼通过这种“支持-挑战-回调”的动态循环,试图平衡维持游戏挑战性与用户体验,避免因难度陡增导致玩家流失。

www.ithome.com · 2026-04-29 13:50:10+08:00 · tech

IT之家 4 月 29 日消息,FinalWire 于 4 月 28 日发布了系统诊断与基准测试工具 AIDA64 的最新版本 v8.30。 本次更新最主要的看点是提前引入对英特尔下一代处理器 Nova Lake 以及 AMD Zen 6 架构 Medusa APU 的初步支持,同时对 AMD EXPO 1.2 内存配置文件提供了支持。 英特尔 Nova Lake 预计于今年年底公布,并在 CES 2027 上正式发布,桌面版本最高达 52 核心、288MB 缓存,被视为英特尔在桌面市场对抗 AMD Zen 6 的重要产品。 此外,本次更新还加入了针对 Intel APX 指令集优化的 SHA3 基准测试,适用于 Diamond Rapids 和 Nova Lake 处理器,并针对酷睿 Ultra 250K Plus 和 270K Plus(Arrow Lake-S Refresh)提供了支持。 在 AMD 方面,AIDA64 v8.30 提供了针对 Zen 6 架构 APU 的初步支持。该系列 APU 代号为 Medusa,将采用锐龙 AI 500 系列的品牌命名,预计同样于 2027 年初上市。此外,Zen 6 架构也将用于桌面端的 Olympic Ridge 处理器,其发布时间与 Medusa 相近。 本次更新另一个值得关注的变化是加入了对 AMD EXPO 1.2 内存配置文件的支持。EXPO 1.2 被视为未来 DDR5 内存(尤其是 CUDIMM)的关键技术基础,但其完整功能(如 CKD 时钟驱动芯片)需要基于 Zen 6 架构的下一代处理器才能实现。目前的锐龙 7000、8000G 及 9000 系列处理器仍仅能运行在兼容模式,CUDIMM 仅能以接近标准 DDR5 的方式工作。 在功能性扩展方面,AIDA64 v8.30 为 Extreme 版本引入了名为“AIDA FPS”的全新模块。该模块可在 Win11/10 系统上实时监测 DX11 和 DX12 游戏帧数,并支持在传感器面板、OSD 显示、系统托盘图标及日志等多个输出端显示。 AIDA64 v8.30 其他更新亮点还包括: 对 Turing(Turzx)4.6 英寸及 12.3 英寸 LCD 显示屏的支持; 新增 Aqua Computer Ampinel 和 Thermal Grizzly WireView Pro II 传感器支持; 增强了对 Adaptec RAID 控制器的兼容性与检测能力; 添加了 Realtek RTL9220 控制器的 USB-NVMe 直通功能; 还包含了 Intel Arc Pro B65/B70 以及 NVIDIA RTX Pro 4500 Blackwell 服务器版的详细 GPU 信息。 IT之家提醒,随着 AIDA64 全面转向现代编译器与本机 64 位二进制文件,v8.30 版本已不再支持 32 位 Windows 系统或 Windows XP x64。对于仍在使用这些旧版操作系统的用户,可能需要继续停留在较旧的版本上。 相关阅读: 《 HWiNFO 发布 8.40 版本更新,支持英特尔酷睿 Ultra 400 系列 Nova Lake 处理器 》

www.ithome.com · 2026-04-27 15:54:20+08:00 · tech

IT之家 4 月 27 日消息,今天下午,小米手机官微宣布: 小米 17 Pro 系列手机背屏“实时天气壁纸”正式上线。该壁纸支持根据实时天气状态自动切换对应动态背景,用户抬眼之间即可掌握天气变化。 而在今天早些时候,小米手机宣布为 17 Pro 系列带来 背屏「电子木鱼」功能 。据介绍,该功能提供了八款木鱼样式,敲击可触发不同音效,同时可自定义治愈文案。 据悉,小米 17 Pro 系列手机背屏现还支持 新年 Flag:模板记录 2026 年度目标 ; 隐身模式:背屏一键关闭麦克风、摄像头等权限 ; 对话翻译:正屏中文输入、背屏即显译文 等功能。除此之外,小米 17 Pro 系列「妙享背屏」还支持电子宠物、背屏带壳截屏、AI 壁纸保存相册等多种玩法。 ▲ IT之家开箱:小米 17 Pro / Pro Max 手机图赏 小米集团合伙人 / 总裁、手机部总裁、小米品牌总经理卢伟冰曾表示, 小米 17 系列是小米数字史上最畅销的产品,尤其是 Pro 系列。

www.ithome.com · 2026-04-24 16:02:03+08:00 · tech

IT之家 4 月 24 日消息,据科技媒体 Android Authority 今天报道,Nothing OS 4.1 系统现已发布, 首批推送给 Nothing Phone (4a) 手机 , 本周新增适配 Nothing Phone (3) 。 据介绍,本次更新主要带来了 Essential Voice 智能语音输入功能,支持 100 多种语言,可自动去除口头语、结巴等,提供特定拼写短语和文本库,支持翻译。 功能方面,本次更新带来了全新锁屏时钟,灵感源自 Nothing Phone (3a) 社区版。支持“实时更新”功能,逻辑类似苹果的“实时活动”,可展示外卖配送进度、导航路程等,覆盖锁屏、AOD、Glyph 和通知栏界面。 IT之家注意到,本次更新还改善了 Nothing 音频产品的通话质量,手机本身的视频通话质量也有所改善。合入 2026 年 4 月安全补丁。本月晚些时候推送给 Nothing Phone (2a)、(3a)、(2)、CMF Phone 1、Phone 2 Pro。Nothing Phone (3a) Lite 预计下月收到更新。

www.ithome.com · 2026-04-23 21:42:17+08:00 · tech

IT之家 4 月 23 日消息,华为乾崑技术大会今晚如期举行。此次技术大会的重点就是发布了华为乾崑智驾 ADS 5 和鸿蒙座舱 HarmonySpace 6。 虽然技术大会已经结束,但是更多信息正逐步释出。据博主 @耗子发威 分享,华为在乾崑技术大会的场外布置了一个展示位,用于展示 896 线双光路图像级激光雷达点云效果。 画面显示,华为乾崑 896 线双光路图像级激光雷达可以“看清”周围环境,能够清晰地看到周边的建筑环境、人员流动情况, 使用该雷达捕捉的点云信息已经十分逼近一颗摄像头能拍摄到的画面 。 据IT之家此前报道,今年 3 月,在鸿蒙智行技术焕新发布会上,华为常务董事、产品投资评审委员会主任、终端 BG 董事长余承东宣布推出 新一代双光路图像级 896 线激光雷达 ,尊界 S800 首发搭载。这也是目前全球量产线束规格最高的激光雷达产品,感知能力从“点云级”正式迈入“图像级”。 据介绍,896 线双光路架构单帧点云量相当于 128 线的 7 倍,轮廓清晰,让车辆对小目标的识别距离大幅提升,面对鬼探头、静止故障车这些极端场景,可远距离识别 14cm 高度物体,倒地轮胎等低反射率目标感知识别距离提升 190%,横倒锥桶等异型障碍物感知识别距离提升 77%。 相关阅读: 《 华为乾崑发布全球量产最高的 896 线激光雷达:超高清、超精准、超远距 》

www.ithome.com · 2026-04-22 00:58:21+08:00 · tech

IT之家 4 月 22 日消息,在华为 Pura 系列及全场景新品发布会上,华为常务董事、产品投资评审委员会主任、终端 BG 董事长余承东正式发布了 Pura 90 系列手机。新机分为三杯:标准版、Pro 和 Pro Max,售价 4699 元起。 IT之家注意到, 华为 Pura 90 Pro Max 手机还首发带来了光感无界主题 ,在锁屏时就能实时取景,手指一按还可以把周围环境变成壁纸。成功应用主题后,在锁屏界面点亮屏幕,用户可以: 查看滤镜效果 : 转动手机,透明滤镜可实时呈现不同的动态效果。 进入实景模式 : 长按屏幕进入实景模式,可将周边实景以通透效果呈现于屏幕上;再次长按屏幕可退出实景模式。 根据官方介绍,使用光感无界主题,可实时感知周边环境,将实景画面以通透效果呈现在手机锁屏上。不过需要注意的是, 如已设置为人脸直接解锁,在应用该主题时会自动切换为人脸滑动解锁 。

www.ithome.com · 2026-04-21 21:28:10+08:00 · tech

IT之家 4 月 21 日消息,华为已在鸿蒙 HarmonyOS 6.1 系统上为畅连 App 带来了「实时对讲」功能,支持双人或多人组队对讲,并提供位置实时共享显示能力。 经过IT之家实测,华为畅连 App 的「实时对讲」功能目前需要在有网的情况下才能使用。不过据博主 @Adak封狼居胥 透露, 该功能后续将升级支持无网状态使用 。 值得一提的是, 华为曾在 Mate 80 系列手机上首发了畅连无网通信功能 。用户在手机无网络的情况下,打开“星闪”开关,就可以与附近的畅连联系人(对端同样需要支持无网通信)进行无网通信。

www.ithome.com · 2026-04-21 08:24:34+08:00 · tech

IT之家 4 月 21 日消息,Mozilla 昨日发布火狐 Firefox 浏览器 150 稳定版, 分屏视图支持右键直接打开链接,PDF 编辑器新增页面排序与导出功能,标签页分享支持批量操作。 分屏视图新增右键菜单选项,用户可直接在分屏中打开链接, 并支持搜索已打开标签页及快速反转标签(Reverse Tabs)位置。 新版增强内置 PDF 编辑器功能,用户无需依赖第三方工具,现可对 PDF 文件执行重新排序、复制、粘贴、删除及导出操作。 新版优化标签页管理与分享功能,用户可一次性选中多个标签页,通过右键菜单批量分享链接,粘贴至其他应用后会自动包含页面标题与网址。 安全方面,新版 Firefox 扩展本地网络访问限制(此前该功能仅限于开启严格追踪保护的用户)至所有用户,网站必须获得用户授权后,才能连接本地设备或服务。 翻译功能方面,桌面版 Firefox 新增实时隐私翻译页面,用户在地址栏输入“about:translations”即可快速访问,为保护用户隐私,整个翻译过程在本地完成。 系统集成方面,Linux 平台新增支持 GTK 表情选择器,并通过 .rpm 安装包适配 Red Hat、Fedora 等发行版,Windows 商店版用户现可使用 Web 应用功能。 图源:phoronix 新版全面升级配置文件管理系统,Windows 10 与 Windows 11 用户可备份配置文件为本地文件,方便数据迁移与恢复。 IT之家附上参考地址 火狐 Firefox 浏览器 150 稳定版下载地址

www.ithome.com · 2026-04-21 07:29:46+08:00 · tech

IT之家 4 月 21 日消息,苹果与《星球大战》有着长期合作历史,而这一合作将在今年 5 月上映的最新电影中继续延续。《曼达洛人与古古》的导演乔恩 · 费儒近日透露,他是如何借助苹果 Vision Pro,将古古这一角色搬上超大银幕的。 近日,在拉斯维加斯举办的电影产业博览会上,《曼达洛人与古古》导演乔恩 · 费儒接受了马特 · 贝洛尼的采访。 IT之家注意到,采访中,费儒表示,自己在制作这部最新《星球大战》电影时,使用了苹果 Vision Pro 这款消费级科技产品。 费儒特别强调,相比更专业的小众设备,消费级技术的创新速度极快,用于电影制作优势显著: 游戏领域涌现出大量优秀的创新技术。以往动作捕捉相关的技术创新非常有限,因为当时只有少数人在使用 MotionBuilder 这类软件。而游戏行业的崛起,彻底打开了新局面。 如果你来过我们的片场,就会看到我们用游戏硬件驱动前期动作捕捉和视觉预览流程。如今这些设备都是面向普通消费者的产品,因此迭代创新速度极快。我们在片场使用苹果 Vision Pro 也是同样的道理。 对于苹果 Vision Pro 这款混合现实头显而言,它几乎成为了导演在片场唯一能预览 IMAX 画幅镜头的视角工具。 我在拍摄一部 IMAX 电影,却只能盯着普通电视屏幕。无论屏幕多大,都无法还原 IMAX 的真实效果。于是我们开发了配套软件,戴上苹果 Vision Pro 后,我就仿佛置身于 IMAX 影厅,在构图时能看到完整的画幅比例。 我可以观看拍摄片段,直观感受观众最终会看到的画面。这项技术本身已经存在,我们只是在其基础上做了少量软件开发,却以工业级的方式充分利用了消费级科技。 由此可见,苹果 Vision Pro 深度参与了下一部《星球大战》电影的制作。 今年 5 月《曼达洛人与古古》上映时,如果你有机会在 IMAX 影厅观看,不妨留意一下:其中不少镜头的构图,其实都借助了苹果 Vision Pro 来完成。

www.ithome.com · 2026-04-17 20:01:28+08:00 · tech

IT之家 4 月 17 日消息,外媒 Insider Gaming 发文透露,索尼 SIE 旗下实时服务性游戏《Fairgames》将采用免费游玩形式,鼓励玩家参与。 同时,本作核心内容含有“撤离”要素,相关模式名为“Cargo Heist”,整体流程围绕潜入获取保险库权限、争夺战利品,并在激烈对抗中成功撤离,玩法结构与当前热门撤离射击游戏较为相似。 IT之家注意到,《Fairgame$》最初于 2023 年 5 月的索尼 PlayStation 展示会上亮相,是一款面向 PS5 和 PC 平台的在线服务游戏,原定 2025 年发布,不过后来本作便没有更多声音,业界一度怀疑本作被砍,不过后续又有消息称本作将于今年发布。 事实上,近年来游戏行业充斥着大量玩法雷同的实时服务型游戏,其中“开服即收官”者屡见不鲜,例如《星鸣特攻》《巅峰守卫》等作均草草收场,然而当下依然有大量厂商信奉实时服务型游戏吸金能力,炮制出了一代又一代的罐头性速亡作品,最终导致厂商和玩家本身都受到严重损失。

www.ithome.com · 2026-04-17 02:29:48+08:00 · tech

IT之家 4 月 17 日消息,华为鸿蒙 HarmonyOS 6.0.0.328 SP58 新版本已开启陆续推送,带来了全新五一劳动节限时水印、图库新增隐藏相册等功能。 ▲ IT之家图赏:华为 nova 14 Ultra 实拍 IT之家进一步实测,除了新版应用助手(游戏助手)外,HarmonyOS 6.0.0.328 SP58 版本还带来了畅连实时对讲、查看本机鸿蒙智能占用情况、星盾防诈等功能,同时更多场景也支持了沉浸光感特性。 具体来看, 畅连实时对讲功能支持双人或多人组队对讲 ,并提供位置实时共享显示能力。功能页面会提供一个“麦克风按钮”,点击后就能直接进行对讲,逻辑跟对讲机类似。该功能还支持后台运行,用户将畅连 App 放至后台或手机锁屏,该功能依旧可以正常运行, 并以实况窗的形态展现 。 在“系统设置 → 存储”页面,原本的“系统数据”和“其他数据”进行了显示优化,统一了分栏, 并支持查看“HarmonyOS”和“系统数据”的详情信息 。 其中“HarmonyOS”一栏支持查看包含鸿蒙智能所需的模型及相关数据和包含支撑系统运行所需基础硬件驱动和底层系统软件所占空间;“系统数据”支持查看包含系统日志和运行所需要的必要文件数据占用情况。 星盾防诈功能位于“系统设置 → 隐私和安全 → 星盾防诈”。 该功能首次使用时需要主动开启,并下载 AI 插件(共 39MB) ,支持陌生号码和信息识别、拦截高风险电话、拦截垃圾短信、拦截骚扰电话、拦截海外号码来电、拦截海外号码信息、和陌生号码通话时检测、视频通话时检测能力。 正式进入星盾防诈功能后,还可以设置具体的防护能力, 包括通信防护、诈骗工具防护和涉诈场景防护,并提供亲情防诈守护能力 。通信防护能力包括通话拦截、信息拦截、视频通话时检测、和陌生号码通话时检测、伪基站防护;诈骗工具防护支持 WLAN 安全检测;涉诈场景防护支持跨场景联动检测;亲情防诈支持与家人建立互助关系,及时发现诈骗风险。 另外,新版本还继续拓展了沉浸光感视效,目前,后台卡片页面的“垃圾桶”一键清理、华为 AR 测量 App 的按钮均已支持沉浸光感视效。 关于华为鸿蒙 HarmonyOS 6.0.0.328 SP58 版本的更多新特性,IT之家还在持续探索中。

www.ithome.com · 2026-04-16 20:50:56+08:00 · tech

IT之家 4 月 16 日消息,此前专注于文字内容的语言人工智能企业 DeepL 德国当地时间今日宣布推出专为实时口语交流设计的实时翻译产品套件 DeepL Voice-to-Voice。 DeepL Voice-to-Voice 套件包括 Voice for Meetings 会议实时翻译、跨平台的 Voice for Conversations、跨语言群组对话、API、专门化自定义等一系列功能,部分将在未来正式推出。 在 DeepL 委托 Slator 独立进行的盲测中, 96% 的语言学家更青睐 DeepL Voice 而非谷歌、微软、Zoom 提供的原生翻译解决方案 。 DeepL 创始人兼首席执行官 Jarek Kutylowski 表示: 今天,我们在翻译领域又迈出了新的一步:实时口语交流。我们的使命一直是打破语言障碍,而如今,我们已成功攻克了其中最难的一道。 DeepL Voice-to-Voice 语音通话功能让每个人都能用自己的语言自然交流,无需面对翻译带来的障碍或成本。我们将世界一流的语音模型与我们不断推向新高度的业界标杆级翻译人工智能相结合。 现在,专业能力才是关键,语言并不重要。

www.ithome.com · 2026-04-16 14:59:38+08:00 · tech

IT之家 4 月 16 日消息,今天蚂蚁灵波正式开源流式三维重建模型 LingBot-Map,官方称无需复杂硬件,仅靠一颗普通 RGB 摄像头,就能让机器在视频采集过程中,实时完成相机位姿估计与场景三维结构重建,填补实时空间感知领域的关键技术空白,为机器人、自动驾驶等场景提供更可靠的空间理解能力。 IT之家附官方详细介绍如下: 在流式三维重建领域,几何精度、时序一致性与运行效率的平衡,一直是行业公认的核心难点。 不同于传统三维重建“先采集、后处理”的模式,流式重建要求系统“边看边理解”,一边接收新画面,一边持续完成定位与建图,同时还要严格控制计算与存储开销,这对模型的设计提出了极高要求。 针对这一痛点,我们打造了 LingBot-Map,以纯自回归式建模为核心,基于几何上下文 Transformer,在不依赖未来帧信息的前提下,逐帧处理当前及历史画面,持续输出精准的相机位姿和深度信息,实时还原场景三维结构,真正实现“所见即所建”。 我们引入了几何上下文注意力机制(GCA),能够高效组织与利用跨帧几何信息,在保留关键历史数据的同时,大幅减少冗余计算,兼顾重建质量与运行效率。 这一设计借鉴了经典 SLAM 系统对空间信息分层管理的思路,但突破了传统方法依赖手工设计和复杂优化的局限,将核心逻辑交由模型统一学习完成,在长序列场景下也能保持稳定表现。 性能全面领跑:20FPS 实时推理稳定支撑机器人作业 多个权威基准完成严苛测试: 在 Oxford Spires 数据集(大尺度、复杂光照、高标准)上: 绝对轨迹误差(ATE)仅为 6.42 米 轨迹精度较此前最优流式方法提升约 2.8 倍 显著优于离线方法 DA3(12.87 米)和 VIPE(10.52 米) 在大场景重建中展现出更强的稳定性。 在 ETH3D、7-Scenes、Tanks and Temples 等多个主流基准上,LingBot-Map 在位姿估计和三维重建质量两个维度全面领先现有流式方法。 其中 ETH3D 基准:重建 F1 分数达到 85.70,较第二名提升超过 8%,场景还原精度大幅提升。 除精度外,LingBot-Map 还兼顾实时性与长时稳定运行能力: 推理速度可实现约 20 FPS 支持 10,000+ 帧长视频连续推理 长序列运行精度几乎无衰减 这意味着,在机器人导航、避障、操作、交互等需要连续在线处理的真实场景中,它能稳定输出可靠的空间感知结果,为上层应用提供坚实支撑。 持续开源多款模型:补齐实时三维建图关键拼图 自今年 1 月以来,我们相继开源: 高精度空间感知模型 LingBot-Depth 具身大模型 LingBot-VLA 世界模型 LingBot-World 具身世界模型 LingBot-VA 围绕空间感知、具身决策、世界模拟等关键环节,持续夯实具身智能“智能基座”的技术布局。此次 LingBot-Map 的开源,进一步补齐了实时空间理解与在线三维建图的关键能力拼图。 目前,LingBot-Map 的模型和代码已正式在 Hugging Face 和 Model Scope 开源。我们期待更多开发者、研究团队加入进来,一起探索流式三维重建的更多可能,推动技术落地,让机器人更稳定、更高效地理解和适应真实物理世界,赋能更多行业创新。 开源地址: 魔搭社区 ModelScope: https://www.modelscope.cn/models/Robbyant/lingbot-map HuggingFace: https://huggingface.co/robbyant/lingbot-map GitHub: https://github.com/Robbyant/lingbot-map Paper: https://arxiv.org/abs/2604.14141 Homepage: https://technology.robbyant.com/lingbot-map