移动端背景

"如果你不冒险去做你害怕的事情,你就永远不会成功。"

——埃隆·马斯克

Claude Code正式推出 Routines:云端自动跑 Mac关了也不耽误干活
2026年4月15日 09:00

Claude Code正式推出 Routines:云端自动跑 Mac关了也不耽误干活AIbase基地发布于AI新闻资讯·3分钟阅读·Apr 15, 202610AIbase 报道 | 2026 年 4 月 15 日睡觉的时候让 AI 替你修 bug、评审 PR、清理 backlog这件事现在不用再自己折腾 cron 和服务器了。昨天(4 月 14 日),Anthropic 在 Claude Code 里上线了一个新功能Routines,目前以研究预览(research preview)形式开放。一句话概括:把提示词、代码仓库、连接器打成一个包,存下来,Claude 就能按时间表、API 调用或 GitHub 事件自己跑起来,全程在 Anthropic 自家云上执行,本地电脑可以直接关机。它到底是个啥过去开发者想让 Claude Code 定时干活,基本都得自己搭一套:写 cron、租服务器、配 MCP server、再把一堆东西串起来。Anthropic 在官方博客里承认,这一步门槛确实劝退了不少人。开发者原本就在用 Claude Code 来自动化软件开发流程,但在此之前,他们需要自己管理 cron 任务、基础设施以及 MCP 服务器之类的额外工具。Routines 就是把这套东西全打包了。配置一次,你得到的是一个"自带仓库权限和连接器的 Claude 会话模板",它知道去哪个 repo、用哪些工具、要完成什么目标。三种触发方式,基本覆盖了常见的自动化场景:按时间表跑。小时、每晚、每周都行,CLI 里还能写自定义 cron(最小间隔 1 小时)。官方举的例子很直白每晚凌晨 2 点从 Linear 拉一个优先级最高的 bug,尝试修复,然后开一个 draft PR。你第二天上班直接 review 就行。API 调用触发。每个 Routine 有自己的独立端点和鉴权 token,POST 一条消息过去,返回一个 session URL。Datadog 告警、CI/CD hook、内部面板,任何能发 HTTP 请求的地方都可以直接把 Claude 接进去。GitHub 事件触发。装上 Claude GitHub App 之后,pull_request、push、issue、check run 这些事件都能当触发器,而且可以按作者、标签、分支、draft 状态做过滤。比较实用的玩法是让它盯着某个敏感目录请标记所有涉及 /auth-provider 模块的 PR。该模块的任何改动都需要总结并发布到 #auth-changes。每个匹配的 PR 会拿到独立 session,后续的评论和 CI 失败它也会继续跟进。谁能用、跑几次研究预览阶段只对 Pro、Max、Team、Enterprise 订阅开放,而且每天的次数有硬上限:Pro 每天 5 次,Max 每天 15 次,Team 和 Enterprise 每天 25 次,超出部分走额外用量计费。所有 Routine 运行和普通交互会话共用订阅配额。GitHub 触发还有一层小时级的频控,超出窗口的事件会被直接丢弃,所以如果仓库特别活跃,最好提前把过滤器设好,别让它把次数白白烧在不相关的 PR 上。安全层面有个默认设置值得注意:Claude 默认只能推到claude/前缀的分支,不会直接动 main。这是挺克制的一道护栏,除非你下游 review 流程很完善,不然建议保留。入口在claude.ai/code/routines,也可以在 Claude Code CLI 里敲/schedule。早期用户都在拿它干什么Anthropic 官方博客和早期用户反馈已经跑出了几个比较成型的模式:夜间 backlog 清理:定时拉新 issue,打标签、分责任人,第二天早上往 Slack 推个汇总,团队上班直接看队列。告警 triage:监控系统打 Routine 的 API 端点,Claude 拉 stack trace、关联最近提交,把一个候选修复的 draft PR 先开好,on-call 打开页面的时候已经有东西可以看了。定制化代码评审:PR 一开就触发,按团队自己的 checklist 留 inline 评论,把安全、性能、风格这些机械检查先过一遍,人类 reviewer 专心看设计。部署验证:CD pipeline 部署完调 Routine,跑 smoke test、扫日志找回归,把 go/no-go 结论直接发到发布频道。文档漂移修正:每周扫一次最近合并的 PR,找出引用了已变更 API 的文档,自动开 update PR。跨语言 SDK 同步:Python SDK 合并一个 PR,Routine 自动把改动移植到 Go SDK,开一个对应的 PR,让两个库保持步调一致。最后一类其实挺能说明问题用过多 SDK 的团队都知道这种同步活有多耗人。社区反应官方推文发出后,开发者社区的反应比较一致:终于不用再把 Mac 整夜开着了。Hacker News 上讨论帖很快冲到首页,几个焦点问题也浮出来:token 消耗怎么控、幂等性怎么保证(同一个事件反复触发会不会闹出乱子)、以及和 OpenClaw 这类多代理框架的定位差异。有开发者已经排好了自己的第一批 Routine:一个盯 PR 评审,一个做 issue triage,一个部署后自动 smoke test。也有非工程背景的用户说,这是第一次觉得"让 AI 替自己管日常杂活"这件事是真能落地的。一点观察Routines 本身没什么惊艳的新模型能力,但它补齐的是另一块把 Claude Code 从"打开终端才能用的工具"变成了一个持续在线的后台工作者。这和 Anthropic 最近一系列动作(Claude Code 桌面端重设计、并行会话侧边栏、Cowork GA)是一条线:从实时协作往可调度、可编排的方向推。当然,研究预览阶段该有的不确定性都有。/fire 端点在 experimental-cc-routine-2026-04-01 beta header 下发布,请求和响应格式、速率限制、token 语义都可能在研究预览期间变化。官方也留了话说 webhook 触发源后续会从 GitHub 扩展到更多事件源,但没给时间表。对已经在用 Claude Code 的团队,这个功能值得今天就去试试;对还在观望的人,至少它让"AI 作为持续运行的团队成员"这个说法,离落地近了一大步。AI新词ClaudeCodeRoutinesAnthropic本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/27115

MiniMax Agent 桌面端大升级:上线 Pocket 功能,跨平台接管飞书微信
2026年4月14日 18:00

MiniMax Agent 桌面端大升级:上线 Pocket 功能,跨平台接管飞书微信AIbase基地发布于AI新闻资讯·1分钟阅读·Apr 14, 20268据报道,大模型新锐巨头MiniMax发布了 MiniMax Agent 桌面端两项重磅更新:Pocket 功能(Beta 版)正式上线,同时解锁了备受期待的Computer Use能力。核心黑科技:Pocket 跨软件随身带此次更新的核心亮点是名为Pocket(口袋)的功能,它打破了 AI 与传统办公软件之间的围墙:主流 IM 接入:支持深度接入飞书、微信等主流通讯软件,用户可以在熟悉的聊天界面直接调动 Agent。随身智能体:通过 Pocket,Agent 不再局限于桌面端的方寸之间,而是可以像装进兜里一样,在不同移动终端和办公协同软件中同步流转。交互革命:Computer Use 让 Agent 学会用电脑除了 Pocket,本次更新还上线了Computer Use功能,标志着 MiniMax Agent 进化到了自动驾驶的新阶段:拟人操作:Agent 现在可以像真人一样识别并操作电脑软件,从点击图标到跨应用处理任务,实现了从口头指令到动手干活的转变。重塑工作流:结合此前上线的 AI-native Workspace,Agent 能够自动化处理从文件整理到复杂办公流程的闭环任务。战略进阶:对标顶尖,加速生态构建MiniMax近期在 Agent 赛道的动作极其密集,显示了其打造国产 AI 生态底座的野心:模型对标:今年 2 月上线的MiniMax M2.5旗舰编程模型,已明确对标Claude Opus 4.6,为 Agent 提供了更强大的底层逻辑。工具开源:近期发布的MMX-CLI命令行工具,进一步降低了开发者构建个性化 Agent 的门槛。商业闭环:随着Remix Marketplace交易平台的推出,MiniMax 正在构建一个从开发、分发到交易的完整 AI 智能体产业链。行业视角:Agent 成为新一代个人入口MiniMax的更新方向揭示了 2026 年 AI 竞争的下半场趋势:不再仅仅拼参数规模,而是拼场景渗透。当 Agent 能够无缝接入微信、飞书并接管电脑操作,它就从一个聊天机器人变成了真正具象化的、能够处理现实劳动的数字员工。结语:让 AI 触手可及当MiniMax Agent能够住进你的飞书和微信,AI 的价值才真正从算力中心沉降到了指尖。这次更新不仅是功能的叠加,更是对未来人机协作模式的一次大胆预演。MiniMaxPocketAI新词ComputerUse本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/27114

谷歌 AI 研究推出 Vantage:基于大语言模型的协作与创造力测评新方法
2026年4月14日 18:00

谷歌 AI 研究推出 Vantage:基于大语言模型的协作与创造力测评新方法AIbase基地发布于AI新闻资讯·1分钟阅读·Apr 14, 20265在教育领域,传统的标准化测试可以评估学生是否掌握微积分或能够理解文本,但却难以测量学生在团队中解决分歧、在压力下产生创新想法或批判性分析论点的能力。这些被称为 持久技能 的能力 协作、创造力和批判性思维 长期以来都缺乏有效、可扩展的测量工具。谷歌研究团队近日提出了一种新方法,名为 Vantage,这是一种利用大语言模型(LLM)模拟真实群体互动并准确评分的技术。研究团队发现,评估持久技能的挑战在于生态有效性与心理测量学严谨性的矛盾。评估需要在真实世界情境中进行,同时又要具备可比性与可重复性。以往的一些尝试,例如 PISA2015的协作问题解决评估,采用多项选择题与脚本化的模拟队友互动,虽然控制了变量,却失去了真实感。谷歌团队认为,LLM 能够在这两方面取得平衡。Vantage 的核心是 执行 LLM 架构,它利用单一的 LLM 生成所有 AI 参与者的回应。这种方法的优势在于,它可以协调对话并根据预设的教育标准主动引导对话。例如,针对冲突解决技能,执行 LLM 可以让 AI 角色主动制造分歧,以此测试人类参与者的反应。研究显示,与不协调的独立代理相比,执行 LLM 的对话在两个协作子技能上表现更好,数据表明,执行 LLM 的表现显著提升了关键行为的证据率。研究团队招募了188名18至25岁的参与者,通过与 AI 角色进行30分钟的协作任务,收集了373份对话记录。对话的评分由纽约大学的两位人类评审员和 AI 评估工具共同完成,结果显示 AI 评分与人类专家的评分一致性良好。尤其在创造力和批判性思维方面,执行 LLM 的表现同样优于独立代理,为未来的教育评估提供了新思路。划重点: Vantage 方法结合了大语言模型,能够模拟真实的团队互动并准确评分持久技能。 执行 LLM 架构通过协调多个 AI 角色,能够主动引导对话,提升关键行为的评估效果。 研究表明,AI 评分与人类专家评分一致性良好,为教育测评带来了新的可能性。持久技能大语言模型Vantage教育评估本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/27113

OpenAI 内部信炮轰 Anthropic:虚增 80 亿,营收未超我方
2026年4月14日 18:00

OpenAI 内部信炮轰 Anthropic:虚增 80 亿,营收未超我方AIbase基地发布于AI新闻资讯·1分钟阅读·Apr 14, 202621据Readhub报道,OpenAI首席营收官德尼丝德雷塞尔的一份四页内部备忘录曝光。信中言辞犀利地质疑竞争对手Anthropic近期发布的营收数据严重注水,并指责其产品力无法支撑平台级竞争。核心争议:300 亿背后的总额法财技一周前,Anthropic官宣其年化收入达到 300 亿美元,一举反超OpenAI。但这份备忘录指出了其中的水分:统计差异:OpenAI指控Anthropic采用总额法处理云服务商的收入分成,虚增了80 亿美元收入。真实排名:若按上市公司通用的净额法计算,Anthropic真实年化收入约为220 亿美元,并未超过OpenAI的250 亿美元。算力瓶颈:备忘录揭露Anthropic未能获取足够算力,导致其旗舰模型Claude的用户体验在实际应用中并不理想。战略博弈:编程利器 vs 企业全能系统除了财务质疑,OpenAI还对两者的发展路径进行了降维打击:产品偏科:批评Anthropic过于专注编程场景,虽然技术深度高,但难以赢下综合性的平台战争。系统构建:OpenAI宣称自己正构建一整套企业 AI 系统,致力于民主化 AI,而非单一的工具。人才并购:就在同一天,OpenAI宣布收购 AI 财务应用公司Hiro Finance。此举被视为针对性的补课,通过吸纳金融人才来强化其在生活与专业场景的感知力,对抗Anthropic的垂直渗透。行业视角:8520 亿美金估值的焦虑此次互撕背后,是资本市场对 AI 泡沫的警惕:估值倒挂:尽管OpenAI的估值已冲上 8520 亿美元,但投资者对其战略转向及收入真实性的质疑也在增加。市场风向:相比之下,Anthropic的股份在二级市场遭疯抢,而OpenAI的股份却出现无人问津的尴尬局面,这或许正是此次内部信言辞如此激进的深层原因。结语:数据竞争掩盖下的模型危机当OpenAI选择通过曝光内部信的方式来打击对手的财信度,反映出 AI 竞赛已进入刺刀见红的阶段。对于用户而言,比起谁的年化收入更高,大家更关心的或许是:在算力紧缺的当下,谁能第一个做出真正不降智、不注水的 AGI。OpenAIAnthropic营收数据AI新词本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/27111