WWW.VNIRY.CN
标签聚合 生成

/tag/生成

www.ithome.com · 2026-05-02 08:00:00+08:00 · tech

IT之家 5 月 2 日消息,据路透社 5 月 1 日报道,由 AI 生成的表演和剧本将不再符合奥斯卡奖的资格。美国电影艺术与科学学院的最新规则将于 2027 年 3 月举行的下一届颁奖典礼开始生效 。 学院更新的规则指出,虽然电影制作人可以使用 AI 工具, 但“合成”表演者不能获得任何奖项 。 同样, 获奖剧本必须是“人类创作的” 。学院可以从提交的作品中要求更多信息,以确认它们是由人类创作的。 值得一提的是,已故美国著名演员方 · 基默(Val Kilmer)通过 AI 出现在了一部新电影中,《深如坟墓》在今年 4 月发布了预告片,其中方 · 基默的角色由 AI 技术生成。 综合IT之家此前报道,行业内多位知名演员已对 AI 演员的出现发表看法,比如马修 · 麦康纳对娱乐行业的未来发出了严厉警告, 他担心人工智能最终会彻底取代人类从业者 。 尼古拉斯・凯奇则抨击 AI ,称任何让人工智能改变表演的演员都在接近“死胡同”,因为“机器人无法反映人类的真实状况”。 演员王劲松今年 2 月发文感叹 AI“太可怕了” ,称生成视频仅通过声音和口型完全辨别不出真假。 去年 10 月,来自伦敦的“AI 女演员”Tilly Norwood 在好莱坞引发了广泛讨论。美国演员工会 SAG-AFTRA 发表声明, 坚决反对这类合成演员 。

www.ithome.com · 2026-04-30 19:11:07+08:00 · tech

IT之家 4 月 30 日消息,由于任天堂几乎不可能将旗下游戏移植到 PC 平台,长期以来,模拟器一直是玩家在官方主机之外的设备上游玩任天堂游戏的唯一途径。但在过去几年间,任天堂游戏的原生 PC 移植版开始兴起,其中就包括《塞尔达传说:时之笛》和《塞尔达传说:姆吉拉的假面》的移植版本。相较于模拟器版本,这些原生移植版拥有更多进阶功能,例如支持更高分辨率。 最新一款原生 PC 移植作品是初代《任天堂明星大乱斗》。该项目也充分展现了人工智能在这类开发项目中所能达成的惊人成果 —— 这款移植版完全由 AI 生成。 据IT之家了解,这款由樱井政博创作的初代《任天堂明星大乱斗》PC 移植版命名为《BattleShip》。其 GitHub 官方介绍中写道:“本移植版为纯 C/C++ 源码架构;所有任天堂版权所属数据,均会在编译阶段从用户自行提供的游戏 ROM 中提取。若你未拥有任天堂 64 平台《任天堂明星大乱斗》的合法副本,将无法编译和运行本项目。”该移植版需要美版 NTSC-U 1.0 版本 ROM 才可运行。 这个项目的亮点,除了能在 PC 上原生游玩《任天堂明星大乱斗》系列初代作品之外,正如前文所说,其开发全程由 AI 百分百完成。开发者 JRickey 表示:“ 这是一款完全由 AI 生成的现代化移植作品 。整个开发耗时 25 天多,参与开发的仅有我本人,以及 Opus 4.6、Opus 4.7 和 GPT 5.5 大模型。截至 4 月 28 日,开发过程中从未有超过两天的空档期。开发期间,我多次部署 AI 智能体,它们能够自主进行程序构建与测试,而我可以同时处理其他事务。” 开发者启动该项目主要有两个原因:其一,深入学习 C 语言底层开发的实际原理;其二,验证 AI 足以胜任这种规模的开发任务。他表示:“这并不是说我直接把 N64 游戏卡带交给 AI,就能自动生成 PC 移植版。这款移植版依托于多年来众多开发者在逆向反编译、3D 引擎、资源素材提取等方方面面的积淀成果。我想表达的是,市面上有大量这类门槛不高、容易落地的开发需求,只要投入少量时间并借助 AI,就能轻松实现。” 他最后总结道:“我希望用这个项目证明,打造出色创意作品的门槛如今已经变得极低。人类向来都是在站在前人成果的基础上,不断拓展知识与能力边界。智能体编程,正是这一发展理念的全新前沿。我也希望这个项目能启发更多人动手实践、自主创作,并将成果无偿分享给他人。” 颇具讽刺意味的是,这款借助 AI 工具完成的《任天堂明星大乱斗》PC 原生移植作品,就连游戏制作人樱井政博本人也对此理念表示认同。去年,这位传奇游戏制作人曾谈及当下大型游戏行业的发展现状,他认为在传统游戏开发模式难以为继的行业环境下,利用生成式 AI 提升开发效率,能够让游戏行业实现可持续发展。

www.ithome.com · 2026-04-30 16:15:34+08:00 · tech

IT之家 4 月 30 日消息,今日,快手宣布推出 AI 桌面智能体产品 KroWork。 据介绍,KroWork 面向非技术用户,通过自然语言即可驱动 AI 自主完成文件处理、浏览器自动化、应用生成和本地部署,意味着用户可使用 KroWork 将重复性工作流生成为本地桌面应用,同时数据不上传云端。KroWork 团队表示,希望通过 AI 降低软件开发门槛,让不会编程的人也能把日常需求变成自己的桌面工具。 IT之家附官方详细介绍如下: 今天,KroWork 正式上线! KroWork 是快手研发的一款运行在桌面端的通用 AI 智能体,用自然语言告诉 KroWork 你需要什么 —— 它会自主规划步骤、在安全沙箱中执行,然后把结果交给你。KroWork 不光能帮你完成写报告、做分析等常见的办公任务,还能帮你把重复性工作写成应用,并安装到桌面。你的应用你来管理。 所思即所得,让创意效率直达桌面。 KroWork 适合谁? KroWork 为非程序员的知识工作者而生 —— 市场营销、数据分析师、财务经理、研究人员、内容创作者、HR 专员。任何一位每天花大量时间在重复性电脑任务上的人,都值得拥有一位不知疲倦、能力出众的助手 KroWork。 KroWork 核心优势 1. 重复工作固化成应用,省力省钱 和其他 AI 产品 " 每次从头推理 " 不同,KroWork 能更进一步,可以把用户的工作流 固化为本地应用 ,下次使用只需点击 " 运行 ",无需再消耗积分 / token。 以财务中发票报销的场景为例,财务人员只需告诉 Kro" 做一个发票报销汇总工具 ",它即可生成一个本地桌面应用 —— 导入发票明细后自动按部门归类、校验金额、标注异常项并生成汇总报表。下次月底报销时,双击打开直接使用。 当然,KroWork 不止于工作,生活中你的小妙思也可以告诉 Kro,它会帮你做成你想要的应用。当然,所有应用都可以部署在你电脑本地,是你的个人资产。 Kro 解决本地部署的难题: 做一款桌面应用不仅需要写代码,还需要配环境、装依赖等等,这一系列的事情对非技术用户来说难如登天。但没关系,Kro 来帮你,从代码生成、界面搭建到应用打包,Kro 一步到位。Kro 生成的应用直接出现在你的桌面上,双击即用,并且支持开机自启和系统级管理。 固化为本地应用后,优势明显: • 代码部分在本地运行 —— 零 Token 消耗 。 • AI 按固化指令精准执行 —— 输出稳定一致 。 • 数据留在你的电脑上 —— 本地运行,数据安全 。 从一次性的 Prompt,到永久留存的产品。你的工作流,在本地,成为你的资产。 不再为重复工作反复付费 。 2. 本地托管,权限可控,安全透明 KroWork 在帮用户完成任务的过程中: • 沙箱执行:每项操作都在隔离的工作区中运行。 • 权限管控:在触碰沙箱外的任何内容之前,KroWork 都会先征求用户同意。 • 白盒可见:用户可以查看它执行的每一个步骤。 3. 集成市面顶尖模型,聪明好用 KroWork 集成了当前主流模型,能基于简单的自然语言指令,快速完成任务。国内版支持 Qwen、Kimi、Deepseek 等最新模型,国际版支持 OpenAI 和 Anthropic 最新旗舰模型。 KroWork 强项是写应用、帮用户部署、让用户来管理应用。当然,这并不意味着 KroWork 只会做应用,它会根据用户的实际需求选择最佳执行方式。你日常工作中的常规任务,KroWork 也能帮你高质量完成。KroWork 具备操作文件、生成文档、自动化浏览器操作等能力。日常工作中查资料、爬数据、做分析、写报告等全都不再话下。

www.ithome.com · 2026-04-30 13:46:28+08:00 · tech

IT之家 4 月 30 日消息,当地时间 4 月 29 日,谷歌更新技术博客,宣布现在可以在 Gemini 应用中轻松生成文件。 官方表示,仅需一条提示词,Gemini 现可直接在对话中创建 PDF、Microsoft Word 和 Excel、谷歌 Workspace(文档、表格、幻灯片)等,意味着 用户无需离开 Gemini 应用 ,即可快速从头脑风暴过渡到完整的文件。 该功能现已 面向全球所有 Gemini 应用用户开放 。对于大多数格式,用户可以直接将文件下载到设备,或导出到谷歌云端硬盘。 IT之家附官方支持的格式如下: 谷歌 Workspace 文件(文档、表格和幻灯片) PDF Microsoft Word(docx) Microsoft Excel(xlsx) csv LaTeX Markdown(MD) 纯文本(TXT) 富文本格式(RTF)

www.ithome.com · 2026-04-29 19:03:30+08:00 · tech

IT之家 4 月 29 日消息,来自英国帝国理工学院、斯坦福大学及互联网档案馆的研究团队,本周发布一项研究指出,自 ChatGPT 于 2022 年 11 月推出以来,截至 2025 年中旬, 全球互联网中约有 35% 的新增内容存在明显的 AI 生成痕迹 ,可以看作是“完全由 AI 生成或在 AI 辅助下完成”。 据悉,研究人员通过 Wayback Machine 互联网档案馆收集 2022 至 2025 年间发布的网页,并采用“多维度分层抽样”方法模拟随机抽取。同时结合 Binoculars、Desklib、DivEye 和 Pangram v3 四种 AI 文本检测工具,对内容来源进行判断。结果显示, 在 ChatGPT 推出后,AI 生成内容的占比从几乎为零迅速攀升至三分之一以上,体现出生成式 AI 对互联网内容生态的快速渗透 。 相应研究还检查了网传所谓的“AI 对文字内容产生的负面影响”,也就是所谓 AI 会造成文章“语义收缩、事实质量下降、情绪单一且正面、知识孤岛、信息密度降低、风格同质化”。结果发现, 仅“语义收缩”和“情绪单一且正面”获得数据支持,AI 生成内容的语义相似度比人工撰写内容高出约 33% ,正面情绪评分则高出约 107%,其余所谓“负面影响”并未得到统计验证。 整体来看,生成式 AI 正在重塑互联网内容的生产方式与语言风格,目前其主要影响集中在文字内容多样性和情绪表达层面, 而对信息可信度的影响尚未得到数据层面的明确证实 。

www.ithome.com · 2026-04-28 17:07:54+08:00 · tech

IT之家 4 月 28 日消息,IT之家从中国网信网获悉,近期网信部门工作中发现, “剪映”“猫箱”App 及“即梦 AI”网站存在未有效落实人工智能生成合成内容标识规定要求等问题 ,违反《网络安全法》《生成式人工智能服务管理暂行办法》《人工智能生成合成内容标识办法》等法律规定。国家互联网信息办公室指导属地互联网信息办公室,依法对上述网站平台采取约谈、责令改正、警告、从严处理责任人等处置处罚措施。 国家互联网信息办公室相关负责人表示,网站平台要严守法律底线红线,严格落实人工智能生成合成内容标识相关规定要求。网信部门将深入推进依法管网治网,持续加大人工智能生成合成内容标识监督管理力度,切实维护社会公共利益,推动人工智能健康有序发展。

www.ithome.com · 2026-04-27 23:18:07+08:00 · tech

IT之家 4 月 27 日消息,据路透社报道,南非撤回了其首份国家人工智能政策草案,此前有消息披露,该草案参考文献列表中包含虚构来源,这些来源似乎是由人工智能生成的。 南非通信与数字技术部长索利・马拉齐表示:“最合理的解释是,草案未经严格核查就纳入了人工智能生成的引用文献,这种情况本不该发生。” IT之家注意到,他在社交平台 X 上发文称:“此次失误绝非单纯的技术问题,还损害了这份政策草案的严谨性与公信力。” 这份政策草案于本月公布,面向公众征求意见,待最终定稿。草案旨在助力南非成为非洲大陆人工智能创新领域的领军者,同时应对人工智能带来的伦理、社会及经济层面挑战。 草案拟定计划设立多家全新机构,包括国家人工智能委员会、人工智能伦理委员会以及人工智能监管局;同时推出税收减免、专项拨款、补贴等激励措施,鼓励私营部门参与合作。 马拉齐表示,将追究政策草案相关起草人员的责任,但并未说明新版政策草案何时发布。 他写道:“这次令人难以接受的疏漏,恰恰证明了人类对人工智能的应用保持审慎监督至关重要。我们将引以为戒、虚心反思。”

www.ithome.com · 2026-04-27 19:13:01+08:00 · tech

IT之家 4 月 27 日消息,今天傍晚,阿里巴巴宣布视频生成模型 HappyHorse1.0 开启灰测。据了解,全球专业创作者和企业级客户可在 HappyHorse 官网和阿里云百炼平台注册使用,大众用户可在千问 App 体验。官网 720P 视频生成刊例价 0.9 元 / 秒。 据IT之家了解,将千问 App 更新至最新版,点击首页下方“HappyHorse”按钮即可体验。作为阿里巴巴最新发布的多模态视频生成模型,HappyHorse 1.0 支持 15 秒多镜头叙事、多画幅适配及 1080P 超分输出,720P 视频生成低至 0.44 元 / 秒。 同时,在千问上,还可体验用 HappyHorse 创作 粤语、英语、法语、韩语 等多种语言的剧情短片。 本月早些时候,一个名为 HappyHorse(欢乐马)的模型 悄悄登顶 Artificial Analysis 的 AI Video Arena 排行榜 ,支持文本转视频、图像转视频,也能够生成音频。 4 月 10 日, 阿里宣布认领这款神秘 AI 视频模型 ,表示 HappyHorse 是阿里 ATH 创新事业部正在内测中的产品。 阿里 ATH 方面透露,阿里巴巴在 AI 视频生成领域已深耕多年,HappyHorse 项目由 ATH 创新事业部主导,联合阿里平台技术、通义实验室及淘天技术等多个团队协同打造。4 月底开放测试后, HappyHorse-1.0 将于 5 月份正式发布商用 。

www.ithome.com · 2026-04-27 16:16:19+08:00 · tech

IT之家 4 月 27 日消息,一个《GTA 6》粉丝账号因发布利用 Rockstar Games 版权素材生成的 AI 图片,收到发行商 Take-Two Interactive 的停止侵权律师函后,被迫公开致歉。 这些 AI 生成图片仿真度极高,酷似真实爆料内容,在官方警示消息公开前就已大范围传播,也抛出了多数内容创作者从未深思过的问题:在网上发布这类图片究竟存在多大法律风险? IT之家注意到,涉事社交媒体账号为 X 平台的 @GTASixJoker,在与 Take-Two 达成和解条款后发布了公开道歉声明。该账号博主写道:“我就擅自违规使用 Take-Two 拥有版权的素材及注册商标一事,向其致以诚挚歉意。”同时承认,受版权保护的内容被用于训练 AI 模型,可能违反相关法律法规。 此次道歉并非主动诚意之举,而是和解协议的硬性要求。该博主承认制作这些图片使用了 R 星的版权知识产权,并承诺不再制作可能被视为《侠盗猎车手 6》泄露内容的作品。 这份停止侵权禁令援引了《美国版权法》第 17 编第 106 条与第 501 条相关规定。其中第 501 条明确:蓄意侵犯受版权保护作品的行为属于联邦重罪,情节严重者将面临严厉处罚,甚至包括监禁。 近两年来,美国和加拿大针对人工智能的相关立法不断推进,开始重点整治带有欺骗误导性质的数字创作,也让这类行为陷入了更深的法律灰色地带。 Take-Two 与 R 星高度重视知识产权保护,不仅针对真实黑客泄密行为追责到底。2022 年《GTA 6》真实源码泄露事件中,涉案黑客最终被判处无限期收治监管。如果说上述案件涉及真实被盗数据,那本次事件则印证了:即便只是借用版权素材仿冒游戏爆料内容,R 星也同样会坚决采取法律维权行动。 屡次违反《数字千年版权法案》(DMCA)会被平台永久封禁账号,而 Take-Two 历来习惯通过正规法律途径,追责大大小小各类侵权行为。

www.ithome.com · 2026-04-27 13:20:55+08:00 · tech

IT之家 4 月 27 日消息,据《连线》上周报道,一名 22 岁的印度医学生(化名 Sam)利用 AI 生成了一名辣妹,在 Instagram 及 Fanvue 等平台上意外走红,每月可从中赚取数千美元。 据本人介绍,他最初曾尝试制作 YouTube 短视频和出售学习笔记,但效果不佳;随后突发奇想,开始使用谷歌 Gemini 的 Nano Banana Pro 生成 AI 美女图,并向关注者出售比基尼照片。 其初期账号表现平平,但 Gemini 建议他瞄准“MAGA / 保守派领域”,Gemini 称这类美国年长男性“可支配收入更高、更忠诚”。Sam 醍醐灌顶,于是在今年 1 月创建了名为 Emily Hart 的角色 —— 一名长相酷似詹妮弗 · 劳伦斯(Jennifer Lawrence)的注册护士,并为其开设 Instagram 账号。 尽管 Sam 从未在美国生活过,但他努力钻研 MAGA 受众的喜好。“每天我都会写一些亲基督教、亲第二修正案、亲生命、反堕胎、反觉醒和反移民的内容。” Sam 开始在 Ins 上发布了一些 Emily Hart 在冰上钓鱼、喝 Coors Light 啤酒、在步枪靶场射击的照片,配文充满表情符号,例如“如果你想找一个取关的理由:基督为王,堕胎是谋杀,所有非法移民必须被驱逐”,以及“观点:他们说你打小就聪明,但你却自认为是自由派 <小丑表情>”。 他承认这种骗局几乎太过明显,但意外的是这个账号竟然“爆火”—— 每条 Reel(短视频)获得 300 万至 1000 万次播放,一个月内 Emily Hart 粉丝破万,许多人还订阅了其 AI 生成的擦边内容。Sam 通过 Fanvue 订阅和销售 MAGA 主题 T 恤月入数千美元。 “我每天只花 30 到 50 分钟,就赚到了相当不错的收入,”他说道,“在印度,即使是专业工作也赚不到这么多。我还没见过比这更简单的网上赚钱方式。” 《连线》指出,这类 AI 生成的 MAGA 美女账号已大量涌现,其共同特征是白色皮肤、金发、职业多为警察或急救人员,并以美国国旗比基尼或 MAGA 帽示人,痛斥移民、爱泼斯坦档案或性别代词。 布鲁金斯学会研究员 Valerie Wirtschafter 指出,虚假账号并非新鲜事,但“AI 令其更可信,且可能被放大”。尽管 Instagram 要求创作者标注 AI 生成内容,但执行松散,Emily Hart 的帖子并未标注。 Sam 曾尝试创建一个对应左翼账号,但发现“民主党人知道这是 AI 垃圾,不怎么互动”。他认为 MAGA 受众都是“超级蠢的人,只有他们才会上当”。 他还注意到,这些互联网平台算法也偏向争议性内容,Sam 将其描述为“愤怒诱饵”:哪怕是黑粉也要点进去并留下他的愤怒评论。“这是一个双赢的局面,无论如何你都会获得互动,你的内容就会病毒式传播。” 在 Sam 之前,《华盛顿邮报》也曾报道过“Jessica Foster”账号 —— 该账号自称美国陆军女兵,曾发布与特朗普和普京的合影,四个月内涨粉超百万,曝光后已被关闭。 据称,Sam 的 Emily Hart 账号今年 2 月因“欺诈行为”被 Instagram 封禁,但 Facebook 账号仍在。Sam 表示不后悔创建 Emily,“我不觉得自己是在骗人”,“用户对自己看到的内容也很满意”。他目前已停止运营该账号,重新专注于学业。

www.ithome.com · 2026-04-23 12:48:48+08:00 · tech

IT之家 4 月 23 日消息,字节跳动今日正式发布更高精度的新一代 3D 生成大模型 —— Seed3D 2.0 ,目前 Seed3D 2.0 技术报告 已公开,API 也已上线火山引擎。 字节跳动表示,在与现有 3D 生成模型的对比评测中,Seed3D 2.0 在 几何生成、纹理材质生成 两项核心指标上均 取得 SOTA 结果 (指在某项具体任务或基准测试中表现最优的模型或方法)。模型对复杂结构的还原更加精细,PBR 材质的生成也具有更强的真实感和稳定性。 ▲ 几何生成维度的定性对比 字节跳动招募了 60 位具有 3D 建模经验的人类打分员,对 Seed3D 2.0 和六个主流模型的生成质量进行两两盲评对比。 ▲ 评估分为纯几何结构生成对比和带有纹理贴图的 3D 生成两部分 Seed3D 2.0 在几何形状生成的对比测试中展现出显著优势,相比所有其他 3D 生成模型呈现更高的偏好率(人类打分员认为其生成质量更优的比例),验证了架构创新带来的几何质量提升。 在纹理 3D 内容生成的人类打分中,Seed3D 2.0 同样领先其他基线方法,面对目前行业内主流模型,Seed3D 2.0 的偏好率达到 69% 以上。 IT之家附技术报告概述如下: Seed3D 2.0 引入 Coarse-to-Fine 两阶段生成策略,把“整体结构”和“几何细节”解耦,分开优化,从而在锐利边缘、薄壁结构和复杂拓扑等几何生成难点上取得突破。 ▲ Seed3D 2.0 几何生成的完整流程 同时,Seed3D 2.0 采用统一的 PBR 生成模型联合建模完整 PBR 贴图,使用 MoE 架构提升高分辨率材质细节与边界精度,并且引入 VLM 先验,增强未知光照下的材质分解稳定性与准确性。 ▲ Seed3D 2.0 的纹理生成流程 在几何与纹理之外,Seed3D 2.0 能完成部件级分割与补全、铰接资产生成以及基于图像、视频或文本的场景组合生成,让生成式 3D 模型可应用于实际部署。 ▲ Seed3D 2.0 的仿真场景生成流程

www.ithome.com · 2026-04-23 07:19:11+08:00 · tech

IT之家 4 月 23 日消息,据《商业内幕》报道,当地时间周三,谷歌称目前公司内部新编写的代码中 已有 3/4 由 AI 生成 ,随后再交给人类工程师审核。 这个比例近几年一直在持续上升。谷歌曾透露,截至 2024 年 10 月,公司 大约四分之一的代码由 AI 生成 。到了去年秋天,这一比例已经 提高到 50% 。 谷歌一直在推动员工把 AI 用到编程和其他工作中。CEO 皮查伊周三在博客中披露,谷歌正在转向“真正以智能体为核心的工作流程”,让工程师运行更多自主任务。“最近,一项由智能体和工程师协同完成的复杂代码迁移工作,完成速度比一年前仅靠工程师时快了 6 倍。” 谷歌工程师目前正使用 Gemini 模型生成代码,其中一些工程师还被设定了明确的 AI 使用目标,这些目标将纳入今年的绩效评估。 最近几个月,谷歌 DeepMind 部分员工 已获准使用 Anthropic 的 Claude Code ,这也在员工之间引发了一些紧张情绪。 据IT之家了解,谷歌并不是唯一一家加大 AI 编程力度的科技巨头。 去年 4 月,微软 CEO 萨提亚 · 纳德拉表示,微软部分项目中 已有 20% 到 30% 的代码由 AI 编写 。微软 CTO 凯文 · 斯科特也在同月表示,他相信未来 5 年内,95% 的代码都会由 AI 生成。 Meta 同样在大力推进这个方向。截至 2025 年第四季度,Meta 已经设定目标,要求部分组织中软件工程师提交的代码改动里, 有 55% 应属于“Agent-Assisted” 。文件还说,在 2026 年上半年,Meta 创作组织中 65% 的工程师预计会使用 AI 编写超过 75% 的已提交代码。 本月早些时候,Snap 表示,按照新的运营模式, 至少 65% 的新代码由 AI 生成 。

www.ithome.com · 2026-04-22 14:23:32+08:00 · tech

IT之家 4 月 22 日消息,谷歌昨日(4 月 21 日)发布博文, 宣布升级其自主研究智能体,推出 Deep Research 与 Deep Research Max ,均基于 Gemini 3.1 Pro 模型打造,让智能体从复杂的摘要引擎转变为企业级工作流的基础组件。 IT之家援引博文介绍,Deep Research 智能体适用于交互式用户场景,平衡优化速度和效率;而 Deep Research Max 适合异步后台工作流,如生成详尽的尽职调查报告等,追求极致的全面性与最高质量综合,利用扩展的测试时计算进行迭代推理、搜索与精练。 两个智能体均基于 Gemini 3.1 Pro 打造,核心突破在于扩展数据源与输出形式,可以搜索网络、任意远程 MCP 服务器、文件上传及连接的文件存储。 用户通过 MCP,能安全地将智能体连接至金融或市场数据等专业数据流,让其从网络搜索器转变为能导航任何专业数据库的自主智能体。输出方面,智能体首次能原生生成高质量图表与信息图, 动态可视化复杂数据。 在流程控制与透明度上,新功能包括协作规划、扩展工具集、多模态研究基础以及实时流式输出。用户可在执行前审查、指导并优化智能体生成的研究计划,并组合使用 Google 搜索、远程 MCP 服务器、代码执行等多种工具。 参考 Deep Research Max: a step change for autonomous research agents

www.ithome.com · 2026-04-22 10:32:33+08:00 · tech

IT之家 4 月 22 日消息,在 4 月 20 日的 2026 爱奇艺世界大会上,爱奇艺官方公布了 2026-2027 片单信息。 IT之家注意到,爱奇艺公布了 《灵魂摆渡》首部全 AI 生成电影 ,将于 2026 年上映。 官方介绍显示,这部 AI 电影的编剧依然是《灵魂摆渡》原剧集的编剧小吉祥天,由爱奇艺与长信传媒携手打造。 片单还显示,爱奇艺将出品《 捕风追影 2 》电影,新片的导演和编剧依然是杨子,目前尚不清楚成龙和梁家辉是否会回归。 还有一部 《凡人修仙传之瀚海迷踪》动画电影将于 2027 年上映 ,由动画原班团队打造。

www.ithome.com · 2026-04-22 06:55:44+08:00 · tech

IT之家 4 月 22 日消息,OpenAI 昨日(4 月 21 日)发布博文,宣布推出 AI 生图工具 ChatGPT Images 2.0,基于 GPT Image 2 模型打造, 核心升级在于引入“思考能力”。 IT之家援引博文介绍,用户启用“思考能力”后,该 AI 生图工具可联网检索信息,依据上传文件创建视觉解析内容,并在生成前对图像结构进行推理规划。这项功能目前已向 ChatGPT Plus、Pro、Business 及 Enterprise 订阅用户开放。 在多图生成能力上,Images 2.0 实现重大突破,支持单次提示生成最多 8 张图像。关键在于,系统可在不同场景中保持角色、物体及风格的一致性。OpenAI 表示,这将大幅降低漫画页面、社交媒体系列配图及室内设计方案的创作门槛。 以上图源:OpenAI 图像质量上,新版本支持最高 2K 分辨率,宽高比范围扩展至 3:1 与 1:3,并优化像素艺术、漫画及电影剧照等风格。在多语言支持方面,该工具重点改进中文、日语、韩语、印地语及孟加拉语的文本生成能力。 参考 Introducing ChatGPT Images 2.0

www.ithome.com · 2026-04-21 21:23:27+08:00 · tech

IT之家 4 月 21 日消息,据科技媒体 Wccftech 今天报道,英伟达现已发布 DLSS 4.5 SDK,让开发者能够在游戏中整合动态多帧生成等新技术。 IT之家从报道中了解到,随着 DLSS 4.5 Streamline SDK 发布,开发者现在可以将基于第二代 Transformer AI 模型的各项技术整合进游戏, 涵盖超分辨率、帧生成、光线重构、动态多帧生成等 。 同时,本次 SDK 更新还进一步优化框架,提供统一接入路径, 支持按需选择 ,让开发者能够更快整合进 DLSS 4.5 生态。 英伟达还宣布,《83》《原子之心》等游戏将在未来支持 DLSS 4.5。 总体来看,DLSS 4.5 SDK 发布将进一步降低开发者接入 AI 图形技术门槛,同时推动新一代 PC 游戏提升性能、画质。

www.ithome.com · 2026-04-21 14:33:39+08:00 · tech

IT之家 4 月 21 日消息,在今日的 AI 创新巡展 · 成都站上,字节跳动火山引擎宣布, Seedance 2.0 API 服务现已支持 1080P 全高清视频生成 。 据介绍,该能力为模型原生能力, 可直接在 1080P 分辨率下完成画面构建 ,在更高清晰度下,画面细节密度与光影层次显著提升。 原生 1080P 意味着生成内容可以直接进入下游链路,不再依赖超分处理。 据了解,在真人剧与漫改等影视场景中,人物五官、皮肤质感、骨相轮廓以及道具的材质细节都能得到更精致的还原;在广告与电商营销场景中,商品的色泽、清晰度与质感表达更加到位;在游戏、文旅、品牌营销等更多创意场景中,内容也能更高效地从“生成”走向“可交付”。 为保障安全创作,在全链路风险防控基础上,火山引擎为 Seedance 2.0 构建人像保护及内容创作支持等系统性解决方案,帮助企业和创作者充分释放创作潜能。 IT之家查询获悉,Seedance 2.0 API 服务输出 1080P 视频定价为: 包含视频输入:31 元 / 百万 tokens 不含视频输入:51 元 / 百万 tokens 作为参考,输出 720P 视频定价为: 包含视频输入:28 元 / 百万 tokens 不含视频输入:46 元 / 百万 tokens

www.ithome.com · 2026-04-21 10:46:01+08:00 · tech

IT之家 4 月 21 日消息,科技媒体 Wccftech 昨日(4 月 20 日)发布博文,报道称 AMD 正积极开发其 Multi-Frame Generation(多帧生成,简称 MFG)技术, 已在 FidelityFX SDK(AMD 提供的图形开发工具包)中初步支持。 IT之家注:多帧生成技术是一种通过算法在连续帧之间生成额外帧以提升画面流畅度的图形技术。它允许用户选择不同的生成倍率(如 2x、4x),从而在不大幅增加渲染负载的情况下显著提高帧率,是当前 GPU 厂商竞争的核心技术之一。 该媒体指出在多帧生成方面,AMD 处于追赶状态,AMD 的 FSR 4 目前最高提供 2x 帧生成模式。对比之下,英伟达率先在 RTX 50 系列上实现了高达 4x 的 MFG,其 DLSS 4.5 更支持 6x 模式,并引入了动态帧生成功能。 而英特尔发布了 XeSS 3,为 Arc B 系列和 Arc A 系列 GPU / iGPU 提供最高 4 倍的多帧生成模式。 根据最新披露的 FidelityFX SDK 截图, AMD 也在发力多帧生成领域,新增 IADLX3DFidelityDXFrameGenUpgradeRatioOption 接口 ,让用户选择期望的帧生成倍率来优化性能与画质。 AMD 也在同步研发面向下一代硬件的 FSR Diamond 技术,相关成果有望应用于未来的 PlayStation、Xbox 主机及 RDNA 5 GPU。

www.ithome.com · 2026-04-21 09:56:11+08:00 · tech

IT之家 4 月 21 日消息,人工智能技术的融入正迅速成为现代游戏开发的一部分。近期,《红色沙漠》等游戏被发现残留着开发早期阶段由 AI 生成的美术素材,而这似乎只是人工智能革命席卷游戏行业的开端。 与其他 3A 游戏大厂一样,育碧也在支持运用人工智能来简化游戏开发流程。事实上,游戏媒体 Tech4Gamers 团队发现了育碧的一则技术美术总监招聘信息,这表明该工作室在招聘开发人员时, 已开始要求应聘者具备 ChatGPT 等生成式人工智能模型的相关使用经验。 尽管 AI 能为游戏开发带来诸多便利,但仍有不少人认为,不应借助其削弱游戏创作过程中的原创性与匠心。 育碧安纳西工作室目前正在为一款尚未公布的 3A 项目招募人员。该招聘信息的任职要求部分显示,此项目是一款基于虚幻引擎 5 开发的多人游戏。由于此前已有传闻称育碧正在开发一款全新的多人在线服务射击游戏,因此有理由相信,该团队此次招聘正是为这一项目储备人才,以推进其在线服务游戏战略布局。 在任职要求的后续内容中,育碧明确提及了 Claude、ChatGPT、Copilot 等生成式人工智能模型。该招聘信息显示,应聘的开发人员需能够熟练运用这些模型完成各类工作任务。 能够熟练使用生成式人工智能模型(如 Claude、Copilot、ChatGPT 等) 从这则招聘广告中,尚无法确切得知育碧计划在游戏开发中具体如何运用 ChatGPT 这类工具。 不过,由于该岗位专门招聘技术美术总监,人工智能的应用方向或许是生成概念原画,后续再由人工制作正式美术资源替换,《光与影:33 号远征队》与《红色沙漠》就采用了类似模式。 IT之家注意到,除此之外,育碧另一则提示词专员的招聘信息也列出了相似要求,注明需精通 GPT-4、Gemini、Claude 等模型。总而言之,掌握各类人工智能模型的相关知识,近期似乎已成为这家法国游戏巨头十分看重的技能。 精通多款语言模型(GPT-4、Gemini、Claude、Qwen、SentenceBERT、Llama),并了解其核心差异 当然,结合育碧过往的相关举措,这一情况并不算意外。此前,这家法国游戏大厂曾在名为“Teammates”的可玩研究项目中,展示了搭载人工智能技术的非玩家角色,这也是其布局人工智能领域的举措之一。

www.ithome.com · 2026-04-19 16:16:51+08:00 · tech

IT之家 4 月 19 日消息,据科技媒体 The Decoder 今天报道,谷歌现已推出生成式 UI 标准 A2UI 0.9,允许 AI 智能体构建用户界面元素,可以从现有应用组件中调用资源。 IT之家在此援引 The Decoder,A2UI 0.9 提供共享 Web 核心库、官方 React 渲染器,并针对 Flutter 、 Lit 和 Angular 等常用框架更新渲染器。同时提供全新 Agent SDK,支持通过 Python 安装,为 AI 智能体订立生成式 UI 设计标准。 同时,谷歌未来还将推出 Go、Kotlin 版本的 A2UI,本次更新还引入客户端自定义函数、客户端与服务器数据同步等功能,改善错误处理机制。 谷歌表示,A2UI 生态正在快速发展,目前已支持 AG2、A2A 1.0、json-render 等集成方案。