谷歌DeepMind推出双AI机器人系统:会"思考"的Gemini Robotics 1.5让机器人告别单一任务束缚
2025年9月26日 18:00
谷歌DeepMind推出双AI机器人系统:会"思考"的Gemini Robotics 1.5让机器人告别单一任务束缚AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 26, 202515机器人技术正在迎来一次根本性变革。谷歌DeepMind刚刚发布的Gemini Robotics项目展示了两个协同工作的全新模型,首次实现了能够在行动前进行"思考"的机器人系统。这一突破可能彻底改变当前机器人只能执行特定任务的局限性。生成式AI技术在文本、图像、音频和视频创作领域已经变得司空见惯,而现在同样的技术正在被应用于输出机器人动作指令。DeepMind团队认为,生成式AI对机器人技术具有独特重要性,因为它能够解锁通用功能特性。当前机器人面临的核心问题是过度专业化。每个机器人都需要针对特定任务进行密集训练,在执行其他任务时表现糟糕。谷歌DeepMind机器人部门负责人Carolina Parada指出:"今天的机器人高度定制化且部署困难,通常需要数月时间才能安装一个只能执行单一任务的机器人单元。"生成式系统的基础特性让AI驱动的机器人变得更加通用。它们可以面对全新的环境和工作空间,无需重新编程就能适应。DeepMind当前的机器人技术方法依赖于两个模型的协作:一个负责思考,一个负责执行。这两个新模型分别命名为Gemini Robotics1.5和Gemini Robotics-ER1.5。前者是视觉-语言-动作模型,能够使用视觉和文本数据生成机器人动作指令。后者中的"ER"代表具身推理,这是一个视觉-语言模型,接收视觉和文本输入后生成完成复杂任务所需的步骤。Gemini Robotics-ER1.5是首个具备模拟推理能力的机器人AI系统,类似于现代文本聊天机器人的推理过程。DeepMind称其为"思考"能力,尽管在生成式AI领域这个术语可能并不完全准确。据DeepMind介绍,ER模型在学术和内部基准测试中都取得了顶级成绩,表明它能够对如何与物理空间交互做出准确决策。但它本身不执行任何动作,这就需要Gemini Robotics1.5的配合。以分拣洗衣物为例:当需要机器人将一堆衣物分成白色和彩色两类时,Gemini Robotics-ER1.5会处理这个请求并分析物理环境的图像。这个AI系统还能调用谷歌搜索等工具收集更多数据。然后ER模型生成自然语言指令,为机器人提供完成任务所需遵循的具体步骤。这种双模型架构的创新之处在于将推理和执行分离。推理模型专注于理解任务需求和环境状况,制定详细的行动计划;执行模型则负责将这些计划转化为具体的机器人动作。这种分工协作的方式让机器人系统既具备了复杂的思考能力,又保持了精确的执行效率。从技术发展趋势来看,这一突破可能标志着机器人技术从专用化向通用化的重要转折点。传统机器人需要针对每个新任务进行大量训练和调试,而具备生成式AI能力的机器人理论上可以通过自然语言指令快速适应新的工作场景。当然,这项技术仍处于早期阶段,实际部署中可能面临各种挑战。机器人在复杂真实环境中的表现、安全性保障、成本控制等问题都需要进一步解决。但DeepMind的这一尝试无疑为机器人技术的未来发展指明了一个极具前景的方向。随着AI技术的持续进步,我们可能即将见证机器人从单一任务执行者转变为真正的智能助手的历史性时刻。GeminiRobotics生成式AIDeepMind机器人技术本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/21597滴滴AI出行助手小滴Beta v0.8版本开启公测 MCP服务上线
2025年9月26日 15:00
滴滴AI出行助手小滴Beta v0.8版本开启公测 MCP服务上线AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 26, 202529月26日,滴滴出行宣布开启AI出行助手小滴Beta v0.8版本的公测。这一新功能通过智能理解用户需求,为用户提供定制化的用车方案。用户只需将滴滴App升级至最新版本,在目的地栏搜索AI叫车并输入口令码,即可体验这一服务。小滴支持语音和文字输入,交互操作简单,能够根据用户的详细需求,结合时间、路况等实时信息,整理出最多3个匹配的车辆选项供用户选择。小滴的推出改变了传统的叫车方式,它先听懂用户需求,再基于滴滴丰富的车辆和司机信息,寻找更精准贴近用户期望的方案。公测期间,滴滴鼓励用户尽可能详细地表达自己的需求,以便小滴能持续学习、不断优化。除了个性化打车,小滴还能在更具体和多样的用车场景下为用户提供出行方案,如查询天气、规划出发时间、推荐方便放行李的车型等。此外,为促进大模型应用创新,助力AI开发者生态建设,滴滴还同步上线了MCP服务。AI开发者简单配置后,即可快速接入滴滴出行MCP,让自定义的智能体拥有自主规划出行方案、打车、实时查询订单及自动支付的能力,轻松定制专属智能出行助手。开发者还可将滴滴MCP与其他领域MCP服务组合,探索更多应用场景。目前,滴滴MCP服务支持呼叫特快、特惠、快车、优享、专车和豪华车等车型。滴滴将在确保安全可信的前提下,不断探索MCP技术在更多领域的应用可能性,携手开发者共建开放的AI生态。AI出行助手小滴Beta滴滴出行智能叫车本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/21596OpenAI 最新基准测试显示 GPT-5 在多个行业中逐渐逼近人类专家
2025年9月26日 15:00
OpenAI 最新基准测试显示 GPT-5 在多个行业中逐渐逼近人类专家AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 26, 20255近日,OpenAI 推出了一项新的基准测试,旨在评估其人工智能模型在各行业与人类专业人士的表现差异。这项名为 GDPval 的测试,是 OpenAI 对其人工智能系统在经济价值工作中是否能超越人类的重要探索。根据 OpenAI 的说法,GPT-5模型与 Anthropic 的 Claude Opus4.1模型在某些领域的工作质量已经接近行业专家。不过,OpenAI 也指出,这些模型并不会立即取代人类工作。尽管一些企业高管预测人工智能将在几年内取代人类的工作,但 OpenAI 承认,当前的 GDPval 测试仅涵盖了人类工作中的一小部分任务。因此,这只是评估人工智能进步的一种方式。GDPval 测试涵盖了九个主要行业,这些行业对美国国内生产总值(GDP)贡献最大,包括医疗、金融、制造业和政府等领域。该测试评估了在这些行业中的44种职业表现,从软件工程师到护士、再到记者都有涉及。OpenAI 在初始测试中邀请了专业人士对 AI 生成的报告与其他专业人士的报告进行比较,并选择最佳者。例如,投资银行家被要求创建有关最后一公里配送行业的竞争对手分析报告,并与 AI 生成的报告进行比较。OpenAI 随后对 AI 模型在44个职业中 胜出 的比率进行了统计。据悉,在经过增强计算能力的 GPT-5-high 版本测试中,该模型在与行业专家的比较中表现优于或与之持平的比例为40.6%。而 Anthropic 的 Claude Opus4.1模型在任务中表现优于或持平于行业专家的比例则高达49%。OpenAI 认为 Claude 模型的高分主要得益于其制作美观图形的能力,而非单纯的表现。值得注意的是,大多数工作专业人士的职责远不止提交研究报告,因此,GDPval-v0的测试范围相对有限。OpenAI 表示,未来计划开发更全面的测试,以涵盖更多行业和互动工作流程。尽管如此,公司仍对 GDPval 的进展感到乐观。OpenAI 首席经济学家亚伦查特吉在接受采访时表示,GDPval 的结果表明,在这些职业中,人们可以利用人工智能模型将时间花在更有意义的任务上。随着模型能力的提升,专业人士将能够利用这些工具,减轻部分工作负担,从而专注于更高价值的工作。博客:https://openai.com/index/gdpval/划重点: OpenAI 发布的新基准测试 GDPval 评估 AI 模型在多个行业的表现,与人类专家的能力逐渐接近。 GPT-5模型在44种职业中有40.6% 的任务表现优于或持平于行业专家,而 Claude Opus4.1则为49%。 OpenAI 计划未来推出更全面的测试,以更准确评估 AI 在真实工作中的能力和表现。AI新词GPT-5OpenAIGDPval本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/21594蚂蚁数科发布新隐私保护AI算法,推理速度提升超100倍
2025年9月26日 15:00
蚂蚁数科发布新隐私保护AI算法,推理速度提升超100倍AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 26, 20255近日,蚂蚁数科在全球信息安全领域引发关注,凭借其新推出的隐私保护AI训练框架Gibbon,再次展示了其在隐私计算技术方面的领先地位。该框架的推出,标志着在跨机构联合建模中,解决数据隐私与高效计算之间的矛盾取得了重大进展。此次蚂蚁数科的研究成果已被国际知名会议 ACM CCS 和 IEEE TDSC 相继收录,表明其技术的前沿性与实用性。其中,Gibbon 框架的创新性安全两方训练方式,使得传统的梯度提升决策树(GBDT)模型的训练速度提升了2到4倍,这一成果在安全性上也超越了当前主流的多方安全计算(MPC)技术。图源备注:图片由AI生成,图片授权服务商Midjourney在推理阶段,蚂蚁数科还推出了基于同态查找表的隐私保护决策图推理技术,进一步推动了 GBDT、决策树等模型的隐私保护能力。该技术实现了推理效率提升2到3个数量级,极大增强了在数据隐私保护前提下的计算效率。在当今数据安全面临巨大挑战的背景下,蚂蚁数科的这一系列创新成果,标志着其在隐私保护人工智能技术上的持续突破。其应用场景覆盖金融、营销等多个行业,为各类企业提供高安全、高性能的隐私计算解决方案。不仅如此,蚂蚁数科还构建了一个多元化的隐私计算产品矩阵,包括可信数据流通平台 FAIR、隐私计算解决方案摩斯(Morse)等,为各行各业的数据协作提供了全方位的支持。随着隐私保护技术的不断演进,蚂蚁数科无疑将在未来的隐私计算领域继续引领潮流。隐私保护AI训练框架Gibbon蚂蚁数科隐私计算技术本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/21593