移动端背景

"如果你不冒险去做你害怕的事情,你就永远不会成功。"

——埃隆·马斯克

微软推出氛围办公,AI助手深度融入Office,效率革命还是隐患?
2025年9月30日 12:00

微软推出氛围办公,AI助手深度融入Office,效率革命还是隐患?AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 30, 202513微软近日宣布推出其全新的办公理念Vibe Working(氛围办公),旨在通过更加对话式、由AI驱动的方式,彻底革新用户在Excel、Word和PowerPoint中的工作模式。这一概念借鉴了软件开发领域的氛围编码,标志着微软正在将AI助手从单纯的工具升级为自主协同的工作伙伴。氛围办公的核心是两大新功能:代理模式(Agent Mode)和Office 代理(Office Agent)。这些功能分别基于OpenAI和Anthropic的最新模型,旨在实现任务的自动化和复杂工作流的简化。代理模式:Excel与Word的自主进化代理模式现已集成到Excel和Word中,PowerPoint的支持也在计划中。在Excel中,该模式使用一套复杂的**规划-执行-检查**循环,能够自主分析数据、构建财务模型、生成图表,并对结果进行审查。特别值得一提的是,它能在每次操作前运行轻量级测试,以发现那些隐藏在看似正确公式下的错误。尽管在SpreadsheetBench基准测试中,代理模式在912项任务中的准确率为57.2%,尚未达到人类71.3%的水平,但它已显著领先于其他AI系统,如Shortcut.ai和ChatGPT Agent。微软强调,所有计算过程对用户都是透明的,用户可以随时追踪并验证每一个步骤。在Word中,代理模式则支持**Vibe Writing**,让用户通过更具交互性的对话方式起草、完善和查询文档内容,甚至可以从邮件等外部来源汇总信息。Office 代理:Copilot的多能系统由Anthropic的Claude模型驱动的Office代理,在Copilot聊天中以独立的多代理系统运行。它包含多个分工明确的代理,分别负责代码、财务、搜索等不同任务。这使得Office代理能够从头开始创建完整的PowerPoint演示文稿和Word文档。它能自主进行网页搜索、分析来源并组织输出,甚至能自动为文档生成符合主题的视觉效果和图表,超越了传统的静态模板。此外,Office代理采用了一种名为**按钮驱动开发(TDD)**的独特理念,通过可重复使用的风格蓝图来保证内容和设计的一致性,而非简单生成可能导致混乱的代码。可用性与前景目前,这些新功能已通过Frontier程序向Microsoft365Copilot和个人版/家庭版订阅用户开放。Excel的代理模式已在网页端可用,Office代理也已向美国用户提供。微软表示,未来计划将氛围办公扩展至更多Copilot功能,但尚未公布具体时间表。然而,氛围办公的流行也伴随着潜在的风险。尽管一些人认为这能大幅提高生产力,但有开发者警告称,这种由AI主导的工作流可能会引入难以察觉的错误,给用户带来新的挑战。VibeWorkingAI驱动OfficeAgent代理模式本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/21671

OpenAI兵分两路:推出类TikTok应用Sora2,并在ChatGPT中整合即时购物功能
2025年9月30日 12:00

OpenAI兵分两路:推出类TikTok应用Sora2,并在ChatGPT中整合即时购物功能AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 30, 202512OpenAI正在加速从一家技术提供商向应用平台服务商转型。据《连线》杂志报道,该公司正准备发布一款独立的视频社交应用Sora2,并已在ChatGPT中集成了与Etsy和Shopify合作的即时购物功能,全面布局消费端市场。Sora2:一个纯AI生成的TikTok据内部消息,OpenAI即将推出的Sora2应用在设计上与TikTok高度相似,采用垂直视频流和滑动浏览的交互方式。然而,其核心差异在于所有内容均由AI生成,且用户无法上传外部视频或照片。该应用允许用户生成最长10秒的视频片段,并提供点赞、评论和再创作等社交功能。OpenAI希望通过这款应用,让公众直观体验AI视频的巨大潜力。此举被视为OpenAI在TikTok美国业务前景不明朗之际的独特机遇,使其直接与Meta和谷歌等科技巨头展开竞争。为了解决肖像权问题,应用内置了身份验证功能,允许用户授权使用自己的肖像进行创作,并能收到相关通知。即时购物:让对话直接转化为消费在另一条战线上,OpenAI的商业化落地更为直接。通过与Etsy和Shopify的合作,ChatGPT的用户现已可以在对话中直接购买商品,无需跳转至外部网站。这项即时购物功能由OpenAI与支付公司Stripe合作开发,旨在将ChatGPT庞大的对话流量转化为实际商业交易。OpenAI产品负责人Michelle Fradin表示,公司的愿景是让ChatGPT不仅提供信息,更能帮助用户在现实世界中完成事务。这一功能目前仅支持美国市场的单件商品购买,未来计划扩展至多商品购物车并覆盖更多地区。市场对这一合作反应积极,消息公布后,Etsy和Shopify的股价均大幅上涨。版权争议:OpenAI面临的最大挑战尽管前景广阔,但OpenAI的激进策略并非没有阻力。其Sora2的版权处理方式默认使用版权内容,除非权利方主动选择退出引发了内容创作者和影视公司的强烈担忧。OpenAI已告知各大影视公司其选择退出流程,但拒绝接受整包式的版权排除请求,要求权利方逐一举报侵权内容。此举正值AI公司与好莱坞关系紧张之际,迪士尼等巨头已就类似问题提起诉讼。OpenAI的版权策略无疑将使其成为新一轮法律和舆论风暴的中心,预示着AI与知识产权之间的博弈将愈发激烈。AI新词Sora2ChatGPTEtsy本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/21670

DeepSeek爆红全球:量化对冲基金孵化的技术黑马如何撼动美国AI霸权
2025年9月30日 12:00

DeepSeek爆红全球:量化对冲基金孵化的技术黑马如何撼动美国AI霸权AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 30, 20254一家来自中国的AI实验室DeepSeek本周突然闯入全球视野,其聊天机器人应用登顶苹果App Store和Google Play下载榜首。这家公司采用计算高效技术训练的AI模型,引发华尔街分析师和科技界对美国能否保持AI领先地位以及AI芯片需求可持续性的质疑。DeepSeek的背后是中国量化对冲基金幻方量化(High-Flyer Capital Management)。该基金利用AI技术辅助交易决策,由AI爱好者梁文锋于 2015 年联合创立。据报道,梁文锋在浙江大学就读期间开始涉足交易领域, 2019 年将幻方转型为专注开发和部署AI算法的对冲基金。2023 年,幻方启动DeepSeek项目,作为独立于金融业务的AI工具研究实验室。随后在幻方的投资支持下,该实验室分拆为独立公司DeepSeek。从创立之初,DeepSeek就自建数据中心集群用于模型训练。但与其他中国AI公司一样,DeepSeek受到美国硬件出口禁令影响。训练最近的模型时,公司被迫使用英伟达H800 芯片,这是性能弱于美国公司可获得的H100 芯片的降级版本。据了解,DeepSeek技术团队年龄结构偏年轻,公司积极从中国顶尖大学招募AI领域博士研究人员。《纽约时报》报道称,DeepSeek还雇用没有计算机科学背景的人员,帮助技术团队更好理解广泛的学科领域。DeepSeek于 2023 年 11 月发布首批模型DeepSeek Coder、DeepSeek LLM和DeepSeek Chat。直到去年春季发布新一代DeepSeek-V2 系列模型时,AI行业才开始真正关注这家公司。DeepSeek-V2 是一个通用文本和图像分析系统,在多项AI基准测试中表现出色,运行成本远低于当时的同类模型。这迫使字节跳动和阿里巴巴等国内竞争对手削减部分模型的使用价格,甚至将某些模型完全免费开放。2024 年 12 月发布的DeepSeek-V3 进一步提升了该公司的知名度。根据内部基准测试,DeepSeek V3 的性能超越了Meta的Llama等可下载开源模型,以及OpenAI GPT-4o等仅能通过API访问的封闭模型。同样令人印象深刻的是DeepSeek的R1 推理模型。该模型于今年 1 月发布,DeepSeek声称其在关键基准测试中的表现与OpenAI的o1 模型相当。作为推理模型,R1 能够有效地自我验证,帮助避免一些常见错误。推理模型通常需要多花几秒到几分钟时间才能得出解决方案,但优势是在物理、科学和数学等领域更加可靠。不过DeepSeek的模型也存在局限性。作为中国开发的AI系统,这些模型需要接受中国互联网监管机构的基准测试,确保响应"体现社会主义核心价值观"。在DeepSeek聊天应用中,R1 不会回答关于天安门广场或台湾自治等敏感问题。3 月份DeepSeek访问量超过 1650 万次。Similarweb编辑David Carr告诉TechCrunch:" 3 月份DeepSeek排名第二,尽管每日访问量比 2 月下降了25%。"但这仍远低于ChatGPT,后者 3 月的每周活跃用户超过 5 亿。5 月,DeepSeek在开发者平台Hugging Face上发布了R1 推理模型的更新版本。 9 月,公司推出名为V3.2-exp的实验模型,旨在大幅降低长上下文操作中的推理成本。如果说DeepSeek有商业模式,目前尚不清楚具体是什么。该公司产品和服务定价远低于市场价格,部分服务甚至免费提供。尽管风投机构兴趣浓厚,但公司并未接受外部投资。DeepSeek声称效率突破使其能够保持极端成本竞争力,但一些专家对公司提供的数据持怀疑态度。无论如何,开发者已经广泛采用DeepSeek的模型。这些模型虽非传统意义上的开源,但采用宽松许可证允许商业使用。Hugging Face首席执行官Clem Delangue表示,该平台上的开发者已创建超过 500 个R1 衍生模型,总下载量达 250 万次。DeepSeek对更大更成熟竞争对手的成功被描述为"颠覆AI行业"和"过度炒作"。该公司的成功至少部分导致英伟达股价 1 月份下跌18%,并引发OpenAI首席执行官Sam Altman的公开回应。 3 月,据路透社报道,美国商务部各局通知员工DeepSeek将在政府设备上被禁用。微软宣布在其Azure AI Foundry服务上提供DeepSeek。在第一季度财报电话会议上被问及DeepSeek对Meta AI支出的影响时,首席执行官扎克伯格表示AI基础设施支出将继续是Meta的"战略优势"。 3 月,OpenAI称DeepSeek"受国家补贴"且"受国家控制",建议美国政府考虑禁止DeepSeek模型。英伟达第四季度财报电话会议上,首席执行官黄仁勋强调了DeepSeek的"卓越创新",表示该公司及其他推理模型对英伟达有利,因为它们需要更多计算资源。与此同时,一些公司和国家正在禁用DeepSeek,包括韩国。纽约州也禁止在政府设备上使用DeepSeek。 5 月,微软副董事长兼总裁Brad Smith在参议院听证会上表示,出于数据安全和宣传担忧,微软员工不允许使用DeepSeek。至于DeepSeek的未来走向尚不明朗。改进模型是必然的,但美国政府似乎对其认为的有害外国影响越来越警惕。 3 月,《华尔街日报》报道称美国可能会在政府设备上禁用DeepSeek。本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/21669

OpenAI 推出家长控制功能,强化 ChatGPT 安全性
2025年9月30日 12:00

OpenAI 推出家长控制功能,强化 ChatGPT 安全性AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 30, 20259近日,OpenAI 宣布在其 ChatGPT 平台上测试一种新的安全路由系统,并正式推出家长控制功能。这项新举措旨在应对此前 ChatGPT 在处理用户妄想和引导有害对话方面存在的漏洞。此安全系统的引入,引发了用户之间的广泛讨论和不同反响。新安全路由系统的核心在于检测情感敏感性对话,并在聊天过程中自动切换到 OpenAI 认为最适合执行安全任务的 GPT-5模型。与之前的模型不同,GPT-5配备了一项名为 安全补全 的新功能,能够在处理敏感话题时,给出安全的回答,而不是简单地拒绝回应。这一变化旨在减少用户因模型过于迎合而引发的 AI 妄想 现象。尽管许多专家和用户对这一安全措施表示支持,但也有一些用户对此表示不满,认为 OpenAI 的做法像是在把成年人视为儿童。OpenAI 方面承认,新的路由机制可能会导致部分用户的不适应,但他们认为这是提升安全保护的重要步骤,并为自己留有120天的改进时间。ChatGPT 的应用负责人 Nick Turley 在社交媒体上表示,模型切换是临时的,用户随时可以查询当前激活的模型。与此同时,家长控制功能的推出同样引发了不同的反响。一些家长对能够监控子女使用 AI 的方式表示赞赏,但也有人担心这可能会导致 OpenAI 对成年人采取类似的限制措施。家长控制功能允许父母定制青少年的使用体验,例如设置静默时段、关闭语音模式和记忆、删除图像生成等。同时,青少年账户还将享有额外的内容保护措施,以减少暴力和极端内容,并检测用户是否有自残的倾向。OpenAI 在博客中指出,如果检测到潜在的伤害,专业团队会立即进行审核,并通过电邮、短信和推送通知家长,除非他们选择不接收这些通知。此外,OpenAI 也在探索如何在无法联系到家长的情况下,及时联系警方或应急服务。划重点: OpenAI 在 ChatGPT 中引入新安全路由系统,提升对敏感话题的处理能力。 家长控制功能让父母能够定制青少年的 AI 使用体验,增加监管。 系统检测到潜在危害时,会及时通知家长,并探索与警方的联系机制。AI新词OpenAIChatGPTGPT-5本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/21668

百度地图升级小度想想 2.0:出行智能助手全面进化
2025年9月30日 12:00

百度地图升级小度想想 2.0:出行智能助手全面进化AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 30, 202514在海南海口举办的第七届世界新能源汽车大会上,百度地图正式发布了全新升级版的出行智能体 小度想想 2.0。这一版本被称为行业首个深度融合的端到端语音语言大模型,为用户提供更为智能、个性化的出行服务。小度想想 2.0 的核心优势主要体现在三个方面。首先,百度独家引入了地图出行知识库以及实时搜索数据,极大提升了对复杂出行意图的理解与推理能力。无论用户如何提出需求,智能助手都能迅速响应,给出精准的导航和建议。其次,跨端记忆体的构建让用户在不同设备间的使用体验更为流畅。无论是在手机上搜索目的地,还是在车载系统中直接发起导航,小度想想 2.0 都能无缝衔接,让服务在手机、车机等多个场景中保持一致。例如,用户在手机上搜索了一家餐厅后,可以直接在车机上通过语音指令要求导航,系统会快速识别并启动导航,无需重复输入。最后,智能助手具备了即时、近期及长期记忆能力。用户的习惯和偏好将被智能地记录和分析,从而提供个性化的推荐服务。比如,用户可以直接说 带我去上周那家餐厅,小度想想便能快速调用最近的出行轨迹;而当用户要求推荐一家评分较高的餐厅时,助手将依据用户的长期偏好进行智能匹配。百度地图的小度想想 2.0 不仅增强了出行服务的智能化水平,更在用户体验上实现了质的飞跃。对于智能汽车用户来说,这一全新的出行助手将大大提升驾驶和出行的便捷性。小度想想2.0百度地图出行智能体端到端语音语言大模型本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/21667

前雅虎 CEO 关闭 Sunshine,转向新成立 AI 公司 Dazzle
2025年9月30日 12:00

前雅虎 CEO 关闭 Sunshine,转向新成立 AI 公司 DazzleAIbase基地发布于AI新闻资讯·1分钟阅读·Sep 30, 20258前雅虎 CEO 马丽莎梅耶尔(Marissa Mayer)近日做出了一个重大决策,她决定关闭自己创办的消费软件公司 Sunshine,并将其资产出售给新成立的 AI 创业公司 Dazzle。Dazzle 的目标是开发智能个人助理,而 Sunshine 的全体员工将会转到这家公司继续工作。据《连线》杂志引用的匿名消息人士透露,Sunshine 的主要投资人,包括 Norwest Venture Partners、Felicis Partners 和 SV Angel,均已批准此次资产交易。Sunshine 成立于2018年,推出了首款产品 基于订阅的联系人管理应用 Sunshine Contacts。然而,由于隐私问题,该应用反响不佳,市场表现也不尽如人意。尽管2024年 Sunshine 推出了集成 AI 功能的新活动管理和照片分享应用,但仍未能在市场上获得认可,相关应用在 Google Play 商店的下载量也仅刚过千次。Sunshine 在2020年曾融资约2000万美元,但据梅耶尔本人透露,该公司的运营主要依靠自有资金。随着此次资产出售和团队整合,Sunshine 将正式退出市场,新的 AI 公司 Dazzle 将接手其人才和业务,进入智能助手的全新阶段。梅耶尔的这项决策不仅标志着 Sunshine 的结束,也为 Dazzle 的未来发展奠定了基础。面对日益竞争激烈的 AI 市场,Dazzle 寄希望于将原有的技术和团队整合,以期在智能助手领域取得突破性进展。随着 AI 技术的迅速发展,Dazzle 的前景引发了外界的广泛关注和期待。划重点: 马丽莎梅耶尔关闭 Sunshine 公司,资产转移至新创办的 AI 公司 Dazzle。 Dazzle 计划开发智能个人助理,原 Sunshine 员工将加入新公司。 Sunshine 曾推出数款产品,但因隐私问题未能获得市场认可。AI新词SunshineDazzleMarissaMayer本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/21666

Claude Code 2.0震撼升级:检查点+VS Code插件,编程效率飙升3倍
2025年9月30日 09:00

Claude Code 2.0震撼升级:检查点+VS Code插件,编程效率飙升3倍AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 30, 202521.7k在AI辅助开发工具竞争日益白热化的当下,Anthropic于9月29日正式发布Claude Code的重大版本更新(v2.0),并同步推出Claude Sonnet4.5模型。Claude Code多项升级重塑AI编程生态这一波升级聚焦自主性和集成性,旨在让AI从单纯的代码助手演变为可靠的编程伙伴。据官方公告,Claude Code现已支持更长的复杂任务处理,并在终端与IDE环境中实现无缝协作。该更新迅速在开发者社区引发热议,被视为对OpenAI Codex等竞品的直接回应。Sonnet4.5模型:编码与代理构建的巅峰之作Claude Sonnet4.5被定位为全球最佳编码模型,在OSWorld基准测试中得分高达61.4%,较前代Sonnet4提升近20个百分点。该模型在真实计算机任务、推理和数学问题上表现出色,尤其擅长构建复杂代理系统。它能自主运行超过30小时的连续编码任务,而不会因上下文丢失中断工作流。此外,Sonnet4.5强化了工具协调能力,包括代码执行、文件创建(如电子表格、幻灯片和文档)和可视化支持。这些功能直接嵌入Claude聊天界面中,用户无需切换工具即可完成数据分析或原型构建。定价保持不变,每百万token输入3美元、输出15美元,确保高性能不增加额外负担。Claude Code v2.0:终端与IDE的双重革新本次升级的核心在于Claude Code的界面与功能优化。首先,终端界面(CLI)迎来全面重设计,采用更流畅的UI,支持并行进程和实时反馈。开发者反馈显示,其响应速度提升约3倍,减少了以往的卡顿问题。其次,原生VS Code扩展正式进入beta测试阶段。这一插件将Claude Code集成到IDE侧边栏中,提供内联差异预览(inline diffs)和图形化交互。用户可实时查看AI修改的代码变更,支持一键回滚,极大提升了协作效率。该扩展目前仅限VS Code使用,Cursor等第三方IDE需等待后续兼容。检查点机制:自主操作的安全网Claude Code引入革命性的检查点(checkpointing)功能,允许AI在长任务中自动保存状态。用户可随时回滚到上一个检查点,恢复代码或对话,而不影响手动编辑或命令行操作。这一特性结合版本控制工具(如Git),适用于大型项目开发,避免了AI失控风险。此外,Tab to Think快捷键优化了思考模式,用户只需按Tab即可触发AI的深度推理过程。新吉祥物Clawd(一只可爱螃蟹)则为界面增添趣味性,提升用户粘性。API与生态扩展:开发者工具箱升级为支持企业级应用,Anthropic同步更新Claude API,新增上下文编辑(自动清理过时信息)和内存工具(存储超出窗口限制的数据)。Claude Agent SDK(前身为Claude Code SDK)现开放给团队用户,提供核心工具和权限框架,便于自定义代理体验。GitHub Copilot已将Sonnet4.5纳入公测,支持Pro及以上计划用户在聊天、编辑和代理模式中使用。浏览器扩展Claude for Chrome也扩展至Max订阅者,进一步将AI能力带入日常工作流。安全与合规:ASL-3级保障所有升级均在AI Safety Level3(ASL-3)框架下开发,强化了对提示注入的防御,减少幻觉和迎合行为。企业用户可通过Compliance API集成数据保留和问题标记功能,确保合规性。展望:AI编程新时代的加速器Claude Code的此次迭代标志着AI从辅助工具向自主代理的跃进。开发者可立即在Claude.ai或API中体验这些功能,付费计划用户优先访问。Anthropic表示,后续将聚焦更长的自主任务和多模态集成。AIbase将持续追踪这一领域的动态,敬请关注。AI新词ClaudeCodeAnthropic编程伙伴本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/21661

DeepSeek发布V3.2-exp模型,开创性稀疏注意力机制 将API 成本降低一半
2025年9月30日 09:00

DeepSeek发布V3.2-exp模型,开创性稀疏注意力机制 将API 成本降低一半AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 30, 202521.7k人工智能公司DeepSeek的研究团队周一宣布,他们发布了一款名为V3.2-exp的新实验模型,旨在通过创新的稀疏注意力机制,大幅降低长上下文操作的推理成本。这一里程碑式的进展在Hugging Face和GitHub上同步发布,并附有详细的学术论文。该模型的核心在于其独特的DeepSeek稀疏注意力机制。这一复杂系统由两部分组成:首先,一个名为闪电索引器的模块会对上下文窗口中的特定摘录进行优先级排序;其次,一个独立的细粒度标记选择系统会从这些优先摘录中挑选出关键标记,加载到有限的注意力窗口中。这些机制的结合使得稀疏注意力模型能够以较低的服务器负载高效处理长上下文片段。在初步测试中,新模型展现出显著优势。DeepSeek报告称,在长上下文操作中,简单的API调用成本可降低多达一半。尽管仍需更多第三方测试来验证这些结论,但由于该模型是开放权重并在Hugging Face上免费提供,其真实性能将很快得到行业验证。DeepSeek的这项突破是近期一系列旨在解决AI推理成本问题的创新之一。推理成本指的是运行已训练AI模型的服务器费用,而非训练费用。与专注于降低训练成本的R1模型不同,此次新模型着重于提高基础Transformer架构的运行效率,为AI应用的普及提供了更经济的解决方案。DeepSeek在今年的AI热潮中备受瞩目。其早前发布的R1模型以低成本强化学习训练方法引发关注,而此次的稀疏注意力方法虽然可能不会像R1那样引发轰动,但它为全球AI供应商提供了宝贵的经验,有助于共同降低AI服务的运营成本。AI新词DeepSeekV3.2-exp稀疏注意力本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/21660

Anthropic放大招!Claude Sonnet4.5碾压GPT-5,编码界新王者诞生
2025年9月30日 09:00

Anthropic放大招!Claude Sonnet4.5碾压GPT-5,编码界新王者诞生AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 30, 20254Anthropic最新发布了Claude Sonnet4.5模型,这款备受期待的AI模型于9月29日正式亮相,被誉为世界上最佳编码模型,标志着AI在复杂任务处理和自主代理领域的重大突破。以下是基于最新数据的专业剖析。模型发布与核心亮点Anthropic宣布Claude Sonnet4.5现已全球可用,支持Claude.ai网页、iOS和Android应用,以及API接口。该模型在编码基准测试SWE-bench Verified上取得领先成绩,实测可维持30小时以上的自主工作时长,远超前代Claude Opus4的7小时上限。这意味着AI不再局限于简单原型生成,而是能处理跨代码库的复杂、多步骤任务,实现生产就绪级应用开发。在实际表现上,Claude Sonnet4.5的代码编辑准确率从前代的9%错误率提升至0%,工具使用成功率更高,同时成本更低。它在OSWorld基准(测试真实计算机任务)中得分达61.4%,较四个月前的Sonnet4提升19.2%。此外,该模型在金融、法律、医学和STEM领域的专业知识与推理能力也显著增强,超越Opus4.1。技术升级与生态集成此次发布伴随多项产品优化,进一步强化Claude生态的实用性。在Claude Code中,新引入检查点功能,用户可随时保存进度并回滚状态,避免开发中断。同时,API新增上下文编辑和内存工具,支持代理运行更长时序任务;Claude应用内直接集成代码执行和文件生成(如表格、幻灯片),简化工作流。Anthropic还推出Claude Agent SDK,开发者可利用自然语言构建自定义AI代理,管理内存、权限并协调子代理。该SDK与Claude for Chrome扩展无缝对接,后者已向Max订阅用户开放,支持浏览器内代理操作。此外,GitHub Copilot、Replit Agent和Amazon Bedrock等平台已快速集成Sonnet4.5,提升多步骤推理和代码理解能力。定价方面,Claude Sonnet4.5保持与Sonnet4一致:输入3美元/百万tokens,输出15美元/百万tokens。这不仅降低了企业部署门槛,还体现了Anthropic在AI经济中的基础设施定位。安全与对齐创新Anthropic强调,Claude Sonnet4.5是其最对齐的前沿模型。通过广泛的安全训练,该模型显著降低奉承(sycophancy)、欺骗、权力寻求和鼓励妄想等风险行为,并提升对提示注入攻击的防御能力。外部专家评估显示,它在多领域表现出更可靠的道德决策,适用于高风险企业场景。行业影响与未来展望Claude Sonnet4.5的发布正值AI代理浪潮兴起之际。它不仅挑战OpenAI的GPT-5和Google的Gemini2.5Pro在编码领域的霸主地位,还为软件开发、自动化工作流注入新活力。专家预测,这将加速AI作为同事的范式转变,推动从原型迭代到自主维护的跃进。Anthropic建议所有用户立即升级至Sonnet4.5,以解锁这些潜力。AIbase观点:在AI竞争白热化的2025年,Claude Sonnet4.5证明了专注实用的价值。它不是简单的参数堆砌,而是对真实世界需求的精准响应。开发者与企业应密切关注后续生态扩展,这或将成为代理AI商业化的关键节点。ClaudeSonnet4.5AI模型编码基准测试Anthropic本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/21659

ChatGPT 聊天即买!AI 革命电商:一键下单,告别浏览器跳转
2025年9月30日 09:00

ChatGPT 聊天即买!AI 革命电商:一键下单,告别浏览器跳转AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 30, 20255作为全球领先的 AI 应用,ChatGPT 已帮助数百万用户发现理想购物选择,如今,它将进一步简化整个购买流程。OpenAI 近日宣布推出即时结账(Instant Checkout)功能,用户可在聊天界面直接完成单件商品购买,无需跳转链接或浏览器。这一创新标志着 AI 代理商务时代的到来,将彻底重塑在线购物体验。即时结账功能详解即时结账由 OpenAI 与支付巨头 Stripe 合作开发的代理商务协议(Agentic Commerce Protocol)驱动。该协议是一种开放标准,允许 AI 代理、用户和商家无缝协作完成交易。它确保了交易的安全性、简易性和兼容性,支持多种支付方式,包括 Apple Pay、Google Pay、Stripe 或直接输入信用卡信息。目前,该功能仅针对美国用户开放,适用于 ChatGPT 的免费、Plus 和 Pro 订阅计划,且初始仅支持单件商品购买。未来,将扩展至多件购物车和国际市场。用户只需在 ChatGPT 中输入如为咖啡爱好者推荐50美元以内的礼物或适合我的150美元以内登山靴等查询,AI 即可推荐匹配商品,并直接提供购买按钮。确认运费和支付信息后,一键即可完成交易。ChatGPT 充当数字私人购物顾问,安全传递用户信息至商家后台,而商家则按常规流程处理订单、支付、物流和客服。首发平台与商家支持即时结账首发支持美国 Etsy 卖家,用户可直接从这些手工与独特商品平台购买。随后,将接入超过百万家 Shopify 商家,包括知名品牌如 Glossier、SKIMS、Spanx 和 Vuori 等。这一扩展将为这些商家开辟全新销售渠道,尤其是在 ChatGPT 每周活跃用户已超7亿的庞大生态中。OpenAI 强调,商品推荐基于相关性、可用性、价格和质量等因素,而非广告赞助,以优化用户体验。Etsy 和 Shopify 均表示,此功能将带来无缝商务机会。商家需支付少量完成交易费用,但无需额外硬件或复杂集成若已使用 Stripe 处理支付,仅需一行代码即可启用。代理商务协议开源,助力行业生态为加速创新,OpenAI 已将代理商务协议开源,供更多商家和开发者免费采用。该协议不仅限于电商,还可扩展至其他支付场景,如服务订阅或虚拟商品交易。它基于 Stripe15年支付基础设施经验,确保跨 AI 平台兼容,并支持非 Stripe 支付提供商集成。这将降低开发者门槛,推动代理商务从概念走向现实。电商格局重塑的深远影响这一发布直接挑战传统电商模式,如 Google 搜索后的跳转购物。OpenAI 商务负责人表示,购物相关查询占用户互动的巨大比例,即时结账将使 ChatGPT 更实用,帮助用户高效完成现实世界任务。对于商家而言,它意味着触达海量 AI 用户群,而 OpenAI 则通过交易分成获得新营收来源。随着 AI 深度嵌入日常生活,即时结账或将成为电商标杆。ChatGPT即时结账OpenAIStripe本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/21658

OpenAI 重磅任命!前谷歌高管 Kim Kyounghoon 担任韩国业务负责人
2025年9月29日 21:00

OpenAI 重磅任命!前谷歌高管 Kim Kyounghoon 担任韩国业务负责人AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 29, 20251近日,OpenAI 正式宣布,前谷歌韩国区总监 Kim Kyounghoon 将担任其在韩国业务的新负责人。Kim Kyounghoon 拥有超过20年的全球 IT 和咨询行业经验,他的加入无疑为 OpenAI 在韩国的业务拓展注入了新的动力。Kim Kyounghoon 在谷歌的任职期间,曾负责推动多个重要项目的落地,深谙科技行业的复杂性与市场需求。他的丰富经验将帮助 OpenAI 更好地理解和满足韩国市场的特定需求,提升品牌在当地的影响力和认可度。随着韩国对人工智能技术的日益重视,OpenAI 此次任命也是为了更有效地把握这一市场的机遇。OpenAI 的发言人在声明中表示,Kim 的到来将是推动 OpenAI 在亚太地区进一步发展的关键一步。随着 AI 技术的快速发展,尤其是在自然语言处理和机器学习领域,Kim Kyounghoon 的丰富背景使他成为引领这一转型的理想人选。他不仅了解韩国市场的动态,也具备了全球视野,将有助于 OpenAI 在不同文化和商业环境中游刃有余。OpenAI 近年来在全球范围内不断扩大其业务版图,尤其是在韩国市场上,已经显示出强大的潜力。Kim 的任命预计将促进 OpenAI 与当地企业、学术机构的合作,进一步推动 AI 技术的创新与应用。同时,他的加入也标志着 OpenAI 在人才引进上的战略性布局,致力于在竞争激烈的市场中保持领先地位。Kim Kyounghoon 的加入不仅仅是个人的职业发展,更是 OpenAI 在全球扩展战略中迈出的重要一步。未来,OpenAI 将如何在他的领导下,更加深入地扎根于韩国市场,值得我们拭目以待。OpenAIKimKyounghoon人工智能亚太地区本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/21657

谷歌推出神经操作系统原型:界面实时生成优化人机交互
2025年9月29日 18:00

谷歌推出神经操作系统原型:界面实时生成优化人机交互AIbase基地发布于AI新闻资讯·1分钟阅读·Sep 29, 20255近日,谷歌展示了一种名为 神经操作系统 的新型原型,该系统以其独特的界面生成方式引发了广泛关注。与传统的操作系统不同,谷歌的神经操作系统并不是通过程序员提前设计的界面,而是利用 Gemini2.5Flash-Lite 这一大型语言模型,实时根据用户的需求生成动态界面。这一前沿技术预示着人机交互的未来将变得更加智能和灵活。传统操作系统中的每一个按钮和菜单都是由开发者事先编写和设计的,用户的每一次点击和操作都是对预设功能的调用。而在谷歌的神经操作系统中,用户的每一次互动都被视为生成新界面的指令。简而言之,用户不再是在一个固定的界面中寻找功能,而是如同在一座不断变化的城市中,每一步都会有新的景象展现。为了实现这一创新,谷歌研究团队设计了一套精巧的机制,将给模型的指令分为 界面构成 和 界面互动 两部分。界面构成 定义了整个系统的基本外观,而 界面互动 则记录用户的每一次操作,并以 JSON 格式发送给模型。模型根据这些信息生成新的界面,确保用户体验的一致性和连贯性。此外,谷歌的系统具备快速响应的能力,采用流式传输技术使得用户界面几乎瞬间生成,避免了用户在等待过程中的不适感。更重要的是,系统可以通过 生成式界面图 来缓存已经生成的界面,这样用户在再次访问同一位置时,可以直接调用缓存,提升了系统的稳定性和用户的操作流畅性。值得一提的是,学术界也在进行类似的研究。一个名为 NeuralOS 的项目,通过预测屏幕图像生成实时界面,展现了神经网络在操作系统模拟中的潜力。虽然目前谷歌的神经操作系统仍处于原型阶段,但其背后的技术理念已显示出广泛的应用前景。通过实时生成的界面,用户的操作将更加便捷,从而提升整体的使用体验。论文:https://arxiv.org/abs/2507.08800划重点: 谷歌神经操作系统通过 Gemini 模型实现实时界面生成,改变传统交互模式。 系统根据用户操作生成动态界面,提升响应速度和用户体验的一致性。 学术界类似研究如 NeuralOS 展现了神经网络在操作系统领域的潜力。神经操作系统Gemini2.5Flash-LiteAI新词谷歌本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/21656