ChaoFanOnline

100 亿次下载破纪录：工信部亮出开源半年报，OpenHarmony设备已超13. 5 亿台

2026年7月20日 18:00

100 亿次下载破纪录：工信部亮出开源半年报，OpenHarmony设备已超13. 5 亿台AIbase基地发布于AI新闻资讯·1分钟阅读·Jul 20, 20269一份来自国新办发布会的半年报，把中国开源生态的体重直接量了出来。7月20日上午10时，国务院新闻办公室举行新闻发布会，工业和信息化部总工程师王卫明、运行监测协调局局长陶青、信息通信管理局局长谢存一并出席，介绍2026年上半年工业和信息化发展情况并答记者问。在这场发布会上，陶青给出的一组数字，让外界第一次看清了基础软件、工业软件与开源生态同时发力的现实轮廓。先是一张稳稳的基本盘。今年1到5月，我国软件业务收入超过6.2万亿元，同比增长10.3%，延续了稳健增长的态势。在这张盘面之下，软件业今年主要呈现出四条清晰的发展脉络。第一条脉络是基础软件加速成势。操作系统、数据库等基础软件持续突破，一批创新成果陆续冒头，开源鸿蒙操作系统已经全面覆盖手机、电脑、汽车、家电等终端设备，生态设备累计超过13.5亿台，电鸿、仪鸿等基于开源鸿蒙的行业发行版超过100款。一个原本从零起步的国产开源系统，如今悄悄长进了亿万级设备的身体里。第二条脉络是工业软件广泛应用。工业软件已经形成覆盖重点行业的产品体系，在关键领域加速部署、持续迭代，为千行百业的数字化转型注入动力。截至今年6月底，重点工业企业数字化研发设计工具普及率达到86.3%，关键工序数控化率达到69.5%，两张渗透率同时站在了高位。第三条脉络是人工智能全面赋能。主管部门引导软件企业抓住AI带来的产业变革机遇，加快使用代码大模型、智能编程工具等提升研发生产效率，让产品功能更丰富、交互体验更自然、内容创作更高效，智能测试、智能运维等创新应用也在加速落地。第四条脉络，也是这场发布会最具分量的一笔开源生态加速壮大。全国性开源基金会已吸纳50余个开源项目进入孵化阶段，国家级人工智能开源社区汇聚用户1100余万、托管模型超过7万个，覆盖基础软件、大模型及应用的全栈开源方案正在加速构建。最为醒目的是，我国人工智能开源大模型的全球累计下载量已突破100亿次。从一行行开源代码到百亿次被全球开发者拉取，中国大模型的影响力第一次以如此具象的刻度被摆在台面上。陶青在会上还勾勒了下一步的落子方向。工信部将按照国家软件发展战略部署，持续增强关键软件产品与服务的供给能力，加快出台人工智能+软件行动方案，推动软件开发向智能化转型、软件产品及服务向智能化升级，并培育智能体软件这一新业态。与此同时，开源基础设施在项目孵化、供应链安全治理、新兴场景探索、海外市场落地等方面的能力会被持续抬升，国家级人工智能开源社区将被加速推向外延，成长为新兴技术的创新策源地与软硬产品落地的重要场景。当100亿次下载与13.5亿台设备同时成为基线，中国开源这盘棋，显然才刚刚进入中盘。开源生态基础软件工业软件国新办发布会本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源：AIBase 来源：https://www.aibase.com/zh/news/29725

首包延迟300ms、支持20种方言:通义千问Qwen-Audio-3.0-TTS正式开放

2026年7月20日 18:00

首包延迟300ms、支持20种方言:通义千问Qwen-Audio-3.0-TTS正式开放AIbase基地发布于AI新闻资讯·1分钟阅读·Jul 20, 202614近日，阿里通义千问团队正式发布新一代实时语音合成模型Qwen-Audio-3.0-TTS，推动语音合成从能说话迈向会表达。其Plus版本已在全球权威榜单Artificial Analysis的Speech Arena中斩获全球第一，综合表现超越Gemini3.1TTS、ElevenLabs v3等主流模型。本次发布包含双版本:Flash版主打实时交互，首包延迟约300ms，适配智能助手等低延时场景;Plus版聚焦高质量生成，自然度与音色还原度更优。核心能力实现四大突破:一是多语种与方言覆盖升级，支持16种语言，Plus版在全部16种语言上的平均说话人相似度达82.75，位列行业第一;同时支持20种中文方言，避免方言特色弱化问题，更贴近母语者表达。二是支持Free-style自然语言指令，无需专业标注，用温柔客服语气带货主播风格等自然语言即可精准生成对应语音。三是细粒度标签控制，支持[gasp]、[angry]等结构化标签，可精确调控呼吸、笑声等非语言细节，适配游戏、有声书等场景。四是复杂声学鲁棒性强，即便参考音频存在高噪声、高混响，也能自动过滤杂音、保留音色，合成质量稳定。配套精品音色库覆盖指令、方言、小语种等多类音色，支持48K高清音频输出（预计7月24日开放），单次合成最长支持3分钟长文本。目前模型已在阿里云百炼平台全面开放，开发者可接入体验，共同探索语音交互新可能。Qwen-Audio-3.0-TTS阿里通义千问语音合成SpeechArena本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源：AIBase 来源：https://www.aibase.com/zh/news/29724

一行GitHub代码出卖了AMD：Anthropic被曝成其新客户，算力去英伟达化加速

2026年7月20日 18:00

一行GitHub代码出卖了AMD：Anthropic被曝成其新客户，算力去英伟达化加速AIbase基地发布于AI新闻资讯·1分钟阅读·Jul 20, 202625一行原本不该暴露商业机密的公开代码，把Anthropic的下一手芯片布局捅了出来。据芯片行业分析机构SemiAnalysis解读，AMD AI业务高级总监在GitHub上公开发布的代码里，明确留下了Anthropic将作为AMD客户的痕迹。这桩非官方、非媒体报道的泄露，指向一个清晰的信号：Anthropic正在主动拓宽芯片来源，把算力供应商从单一名单里解放出来。周一，SemiAnalysis在社交平台X上抛出分析帖，结论正来自对AMD那位高级总监公开代码的专业拆解代码内容直接涉及Anthropic作为AMD客户的相关信息。该机构表示，后续还会进一步解释代码细节与背后背景。若这一判断属实，AMD将拿下一块此前由英伟达与谷歌牢牢把持的高端AI训练市场的新阵地，而Anthropic的算力基础设施，也由此向多元化方向再踩一脚油门。这次信息的流出路径颇为特殊。它没有走官方公告，也不是记者挖到的猛料，而是源于AMD内部高管亲手推到GitHub上的代码。SemiAnalysis把这堆代码读出了名堂，再搬到X平台上公开结论。在科技行业，这种靠公开代码库意外泄密的戏码并不鲜见GitHub天然可被检索，而发布者又是AMD AI业务的高级总监，两相结合之下，信息的可信度反倒不低。SemiAnalysis在帖文中承诺，会继续把代码逻辑一层层拆开，给市场一份更完整的解读。事实上，在AMD这条线曝光之前，Anthropic的算力采购早已不是独木桥。谷歌的TPU（张量处理器）是其重要算力来源之一，这与谷歌对Anthropic的战略投资密不可分；此外，三星也已经被纳入它的供应商体系。既有的布局说明，Anthropic从一开始就不是单点押注，而是在刻意织一张多元化的供应商矩阵，AMD的加入，只会让这张网在英伟达GPU之外，再多出一块高性能算力的选择。对Anthropic而言，把AMD拉进阵营有多重战略分量。随着模型训练与推理规模持续膨胀，单一芯片供应商带来的供应链风险、被压制的议价能力，以及技术路径被锁死的后患，都日益刺眼。同时拥抱谷歌TPU、三星与AMD，它得以在成本控制、供应稳定和技術灵活性之间，重新寻找更优的平衡点。对AMD来说，拿下Anthropic则是一次标杆性的胜利这家公司近年来持续重注数据中心AI芯片，其MI系列GPU被视作英伟达H系列产品的主要竞争对手之一；一旦Anthropic正式入账，AMD不仅能在顶级AI实验室的客户群里刷出更强的存在感，也为数据中心AI芯片业务带来实实在在的增量收入。Anthropic的这一步，折射的是整个行业的系统性转向。当OpenAI、谷歌DeepMind、Meta AI等头部机构对算力的渴求节节攀升，AI公司正在不约而同地评估并拓展芯片供应来源，只为避开把鸡蛋放进同一个篮子里的风险。这种集体转身，客观上为AMD、英特尔等英伟达的追赶者，撬开了一道进入核心AI客户供应链的缝隙。AI新词AnthropicAMD芯片本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源：AIBase 来源：https://www.aibase.com/zh/news/29722

腾讯WorkBuddy6月访问量超2000万，领跑AI办公智能体市场

2026年7月20日 18:00

腾讯WorkBuddy6月访问量超2000万，领跑AI办公智能体市场AIbase基地发布于AI新闻资讯·1分钟阅读·Jul 20, 202633最新发布的《2026年Q2中国办公智能体平台市场洞察报告》显示，腾讯WorkBuddy在国内PC端AI原生办公智能体市场保持领先，2026年6月单月访问量达到2097万次，超过第二、第三名总和。报告显示，6月中国PC端AI原生办公智能体市场总访问量突破6000万次，行业规模持续扩大。腾讯旗下AI编程智能体CodeBuddy也保持头部位置。作为AI效率办公智能体，WorkBuddy支持用户通过自然语言指令完成任务规划、文件处理和结果交付，可在PC、微信小程序、App等多端使用。自2026年3月发布以来，WorkBuddy持续升级，已接入混元、DeepSeek、智谱GLM、Kimi等主流大模型，并上线技能中心、专家模式、自动化任务、资料库等功能，同时支持微信、企业微信等渠道连接，并通过中国信通院可信认证。随着AI智能体逐渐从内容生成走向任务执行，办公领域成为大模型落地的重要场景。WorkBuddy的增长也体现出市场对AI原生生产力工具需求的快速提升。本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源：AIBase 来源：https://www.aibase.com/zh/news/29721

打破 15 秒魔咒：智象未来发布全球首个无限时长创作智能体vivago R1，商业可用率拉到85%

2026年7月20日 15:00

打破 15 秒魔咒：智象未来发布全球首个无限时长创作智能体vivago R1，商业可用率拉到85%AIbase基地发布于AI新闻资讯·1分钟阅读·Jul 20, 202662026盛夏的黄浦江畔，世界人工智能大会如期拉开帷幕，智象未来（HiDream.ai）在这场聚光灯下把一枚重磅新品推到了台前全球首个无限时长内容创作多模态智能体vivago R1。一同落地的，还有它与中科类脑等机构组建的一带一路Token出海联盟，以及与飞捷科思等发起的物理智能创新联合体倡议。这家公司试图用技术创新与生态协同双轮，把AI从工具推向能并肩工作的智能伙伴。在大会期间由中国信息通信研究院主办的论坛上，智象未来创始人兼CEO梅涛以《迈向世界模型:原生全模态推动智能体能力跃迁》为题发表主旨演讲，系统梳理了大模型与智能体双向并进、走向世界模型的态势。他的判断很清晰:顶级模型的智能水平已经迈入人类天才区，但从基础大模型到真实场景之间，仍横着落地难、适配弱、不可控的产业鸿沟。智能体天生带着自主记忆、逻辑规划、工具调度和多端协作的本事，恰好能把基础模型的生成与推理优势，翻译成标准化、可验证、可交付的产业能力。基础模型叠加智能体，正成为AI赋能千行百业的核心范式。梅涛进一步点破了一个现实困境:在复杂任务面前，单个智能体存在明显的能力天花板，跨链路、高精度的创作任务它独木难支，唯有让多个智能体像专业团队那样分工协作，才能啃下真正的产业硬骨头。而要让这支智能体集群稳定、高效、有序地运转，一套名为AgentOS的智能体操作系统是绕不开的地基。为此，智象自研了HD-AgentOS，用资源层、系统层、能力层三层耦合架构撑起整套产业落地体系:资源层提供智能体可调用的基础资源与原子能力，是执行的底座;系统层包揽全流程运维、风控、监控与安全治理;能力层则把模型、工具、知识和流程封装成领域技能。有了这套操作系统，多智能体协作便能突破单打独斗的局限，组建成一支可感知、会推理、可执行、能进化的专业团队。vivago R1正是架在这套核心技术之上的产物，也是全球首个具备无限时长视频生成与编辑能力的多模态创作智能体。它的出现，标志着AI在创意生产领域的一次范式转移从只会辅助生成单点素材，进化为能够自主规划、调度并完成长链路创作的智能搭子。智象把它的核心优势概括为长、长、稳三个字，精准对准行业长期存在的时长受限、逻辑混乱、效果不稳三道痛点。第一处长，是无限时长、全场景无限制适配。当下主流AI视频产品大多被锁在15到30秒的短镜头里，根本喂不饱长周期商业创作。vivago R1直接掀翻了这道时长壁垒，支持任意时长的视频连续、连贯生成，从短剧、专题片、品牌宣传片到影视成片，全品类长周期创作场景都能接住，把行业长视频创作的空白补上了。第二处长，是长任务思考，保障创作逻辑连贯统一。长视频从来不是短镜头的简单拼接，它需要完整的叙事逻辑、统一的画面风格、稳定的人物IP与场景设定。vivago R1具备长任务思考能力，能自主完成精细化逻辑构思、镜头排布与风格校准，把画面跳变、人设崩塌、叙事断层、风格割裂这些老毛病一一按住。第三处的稳，是高稳定生成，赋能商业规模化交付。传统大模型带着概率性输出偏差，成片可用率低，企业调试成本居高不下;依托AgentOS的全流程调度与治理，vivago R1把创作全链路变成可控可校准，将内容有效可用成功率提升到85%，远高于行业平均，反复修改调试的时间与人力被大幅砍掉，生成内容能直接走进商业制作、品牌传播与市场化交付。这种能力在社媒创作、商业营销这类持续性长链路场景里尤其见功力。一个看似简单的分镜生成，既要依据剧本画出画面，又要吃透镜头语言、叙事节奏、情绪表达，甚至要分清短视频vlog、短剧、商品素材短片对分镜的差异化要求这种深度的行业理解，绝不是直接调一个大模型API就能交差的。vivago R1用多智能体协同机制，把理解任务、构思故事线、创作分镜脚本、生成核心素材、生成超长视频这条完整链路做了原子化封装与专业化调度，让叙事、镜头、角色、风格、声音和审美有机统一，真正完成了从单点工具到全链路创作系统的跨越。产品之外，智象在WAIC期间还落下了两步生态大棋。它与飞捷科思等创新企业和顶尖科研机构共同发起物理智能创新联合体倡议，意在聚拢产学研多方力量，共筑原生全模态世界模型的产业协同新格局。与此同时，智象与中科类脑等机构达成战略合作，签约组建一带一路Token出海联盟，以Token无国界、AI无孤岛为核心理念，推动中国原生全模态AI能力跨越山海，连接全球智能新基建，助力和共建一带一路国家和地区的智能化升级与数字生态互联。行业的竞争维度早已全面升维。过去那场单一的大模型参数竞赛正逐步归于理性，取而代之的是基础模型加智能体系统的全方位生态较量。智象打造的1+1+3商业模式，正是对这道新命题的回应在底座模型上保持全球领先竞争力，在用户最渴求智能释放的垂直赛道里扎到最深。从vivago R1的发布到双联盟布局，智象以多点突破的方式，在这场规模空前的WAIC上集中展示了最新成果，也为AI从工具演进为智能伙伴探了一次路。接下来，它要持续推动多模态技术向原生全模态、向世界模型深度进阶，用硬核创新与全球化协同，把人工智能产业推入规模化、商业化的新时段。AI新词vivagoR1智象未来多模态智能体本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源：AIBase 来源：https://www.aibase.com/zh/news/29720

Hugging Face披露AI智能体攻击事件，采用GLM5.2完成日志取证分析

2026年7月20日 15:00

Hugging Face披露AI智能体攻击事件，采用GLM5.2完成日志取证分析AIbase基地发布于AI新闻资讯·1分钟阅读·Jul 20, 202615全球最大的AI开源社区Hugging Face近日披露，其服务器遭遇黑客AI智能体攻击。事件发生后，安全团队首先尝试调用一家美国商业前沿大模型API，对超过1.7万条与攻击相关的日志进行分析，但由于模型未能准确区分事件响应人员与攻击者，其安全防护机制误判相关请求并拒绝提供分析支持。随后，Hugging Face在自有基础设施上部署中国开源模型GLM5.2，对海量安全日志展开取证分析，并顺利完成事件调查工作。此次事件反映出，随着AI智能体逐渐参与网络攻击，安全分析对大模型的理解能力、推理能力以及部署方式提出了更高要求。相比依赖云端商业API，本地部署的开源模型能够在数据安全、权限控制和任务定制方面提供更高灵活性，也避免了因平台安全策略导致的分析中断。AI智能体HuggingFaceGLM5.2开源模型本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源：AIBase 来源：https://www.aibase.com/zh/news/29719

8800 万美元加注开源：Ollama跑进85%财富 500 强，喊出"全体上车"

2026年7月20日 15:00

8800 万美元加注开源：Ollama跑进85%财富 500 强，喊出"全体上车"AIbase基地发布于AI新闻资讯·1分钟阅读·Jul 20, 202611一条命令就能在本地拉起开源大模型，这个让无数开发者摆脱API密钥和天价账单的工具，刚刚拿到了通往下一程的燃料。 7 月 9 日，Ollama在官方博客中宣布完成 8800 万美元融资，投资方阵容横跨顶级风投与开源世界的老将：Benchmark的Peter Fenton、Theory Ventures的Tomasz Tunguz、8VC的Alex Kolicich共同领投，Docker创始人Solomon Hykes、ClickHouse CEO Aaron Katz、GIMP联合创建者兼Cockroach Labs联合创始人Spencer Kimball、Amp CEO Quinn Slack、思科董事会成员Marianna Tessel、Twitter前工程主管Michael Montano，以及Y Combinator、Garage Capital、Pace Capital、49 Palms、GTMFund等一众天使跟投。这家公司的创始人杰夫与迈克尔，十年前就在做同样的事。两人在大学相识，创办了让Docker运行变得极简的Kitematic， 2015 年被Docker收购，他们的工作成果后来化为 2016 年推出的Docker Desktop，如今被全球超过一千万开发者使用。十年之后，他们把那套让复杂技术变得人人可用的执念，又押到了AI上Ollama的目标，是让开发者以最轻松的方式启动并运行开源模型。出乎他们最疯狂的想象，这个平台已经服务了 890 万开发者，并且被85%的《财富》 500 强企业采用。在Ollama的叙述里，开源模型正在为AI开启一次个人电脑式的时刻：当年PC把算力从大型机机房搬上每个人的桌面，供人拥有、定制和构建，如今开源模型正做着同样的事。几年前，强大而免费的开源模型已经出现，但要让它们真正跑起来却障碍重重，能力明明在场，却像被锁在门后，开发者无法像调用专有模型API那样顺手使用。Ollama给出的解法是一款可下载到电脑上的应用，一条命令就能启动最新开源模型，再通过简单的API在其上构建，把运行开源模型变得和运行任何普通软件一样简单不需要权限，不需要API密钥，也不需要昂贵的服务器硬件。你的模型，你的机器，你的数据。它围绕三条原则搭建产品：所有权、可负担性与隐私。所有权意味着开源模型归使用者所有，可以随时保留、定制和优化，永远不会被锁死在某一款自己智能体或应用所依赖的模型之外；可负担性来自模型跑在自己的硬件上，不再有失控的按token计费账单，实验、迭代和发布都不必担心每一条提示词都在加价；隐私则让数据永远不必离开本地机器，即便真的需要上云扩展，也能把同一份信任一并带过去。开源模型早已不是实验室里的玩具。Ollama云成了访问最强大开源模型最便捷的一站，GLM、Nemotron、DeepSeek、Kimi、MiniMax等都在其中，而它的token用量平均每月增长超过一倍。最初只是个人电脑上第一次跑通模型的乐趣，如今已经扩张成去啃那些曾经专属于闭源模型的硬骨头。这笔 8800 万美元，被Ollama定位成推动生态前进的燃料。它正处在开源模型生态的核心位置，资金将投向三件事：无缝的混合推理、在新开源模型发布当天就提供支持，以及一个能让任何开发者及其团队用上最强大模型、却不牺牲所有权与隐私的云服务。杰夫与迈克尔在结尾写道，他们曾站在类似变革的开端，押注开放与易用终将胜出，如今再次倾尽所有。当85%的财富 500 强已经悄悄把开源模型搬进内部系统，这趟开源列车的下一节车厢，显然还空着不少座位。Ollama开源大模型AI新词融资本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源：AIBase 来源：https://www.aibase.com/zh/news/29718

DeepSeek V4正式版实测曝光，或于下周一发布剑指Kimi K3

2026年7月20日 15:00

DeepSeek V4正式版实测曝光，或于下周一发布剑指Kimi K3AIbase基地发布于AI新闻资讯·1分钟阅读·Jul 20, 2026230在全球AI圈目光聚焦于Kimi K3热度之际，国产大模型厂商DeepSeek传来新动向。近日，DeepSeek V4正式版的测试视频与实机演示在社交平台悄然曝光，多方消息指出，该模型有望最早于下周一（7月下旬首个周一）正式发布，时间点恰好承接K3刷屏之后，引发行业高度关注。据流出的测试信息与海外博主反馈，DeepSeek V4正式版在多项核心指标上表现惊艳。实测性能初步达到Claude Opus4.8的水平，尤其在3D方向的生成能力上远超Opus4.8，代理（Agent）行为表现与编码稳健性亦有显著提升。更有激进观点称，在特定测试(如游戏代码生成)中，V4正式版已压过Fable5与GPT-5.6一头。一位博主展示的《鱿鱼游戏》小游戏编码测试中，V4生成3000行代码总成本仅0.12美元，凸显了其令人难以置信的性价比优势。除了硬性能的提升，V4在交互体验上也迎来微调。测试者注意到其思维链（CoT）风格更加接近Claude，不再堆砌代码墙，而是以编写核心功能、编写主要场景代码等总结性步骤呈现，可读性大幅增强。有分析认为，V4可能提炼了Fable的编码风格，输出观感更为简洁。回顾DeepSeek过往节奏，其一贯以闷头干活、价格屠夫的策略突围。若V4真能以低一个量级的价格逼近当前顶流模型水准，势必将掀起继V3之后的DeepSeek时刻2.0。目前官方曾预告为7月中旬发布，下周一的时间线合乎预期，最终定档尚需等待官方官宣。DeepSeekV4AI新词KimiK3ClaudeOpus4.8本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源：AIBase 来源：https://www.aibase.com/zh/news/29717

字节跳动发布Seed Audio 1.0：音频生成从会说迈向会创作

2026年7月20日 15:00

字节跳动发布Seed Audio 1.0：音频生成从会说迈向会创作AIbase基地发布于AI新闻资讯·1分钟阅读·Jul 20, 202614近日，字节跳动正式推出音频创作模型Seed Audio1.0，标志着AI音频生成技术从单一语音合成阶段，迈入完整声音场景创作的崭新阶段。该模型目前已上线火山方舟体验中心，向创作者开放测试。长期以来，影视级音频内容生产依赖多模型分别生成人声、音效与环境声，再通过人工繁琐拼接与混音，流程冗长且难以保证整体叙事一致性。Seed Audio1.0的核心突破在于，它并非简单拼接素材，而是在统一框架下联合建模多种音频要素，端到端生成可服务于叙事的完整声音作品。据官方介绍，Seed Audio1.0具备三大核心能力。首先是精准的时空编排，支持以100毫秒的精度按时间线控制对白、音效的入场时机，完美适配视频配音与广告制作。其次是稳定的音色演绎，支持零样本生成与长音频延展，在保持角色音色一致性的同时，能自然呈现愤怒、喜悦等不同情绪，甚至允许同一音色演绎多个角色。第三是地道的多语种支持，覆盖包括中文、英语、日语在内的20余种语言，确保声音在不同语种下都能符合本土的表达节奏与重音习惯。评测数据显示，该模型在九大类常见创作场景中的音频可用率已超过90%，多语言生成的自然度MOS评分普遍达到4分以上（优秀水平）。从会说到会创作，Seed Audio1.0的发布降低了高质量音频内容的制作门槛。未来，团队计划进一步融合视频参考等多模态输入，并探索可控翻译技术，持续优化长音频与分轨生成能力，助力创作者将脑海中的声音构想高效转化为可听见的作品。项目主页:https://seed.bytedance.com/seedaudio1_0体验入口:火山方舟体验中心 - 登录 - 选择语音模型 -语音合成-Doubao-音频生成-1.0SeedAudio1.0字节跳动AI音频生成火山方舟本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源：AIBase 来源：https://www.aibase.com/zh/news/29716

喊出"再来两周"的用户赢了：腾讯混元Hy3 限免延长到 8 月 5 日，295B MoE模型白嫖期续命

2026年7月20日 12:00

喊出"再来两周"的用户赢了：腾讯混元Hy3 限免延长到 8 月 5 日，295B MoE模型白嫖期续命AIbase基地发布于AI新闻资讯·1分钟阅读·Jul 20, 202621一款刚开源不到半个月的大模型，靠着用户一句"再来两周"的呼声，硬是把免费期从两周拉长到了近一个月。7月20日，腾讯公关总监张军在微博上透露，混元大模型Hy3的两周限免活动临近收官时，公司收到了大量用户希望延期的强烈反馈，为此腾讯决定，针对WorkBuddy和CodeBuddy用户，把Hy3的限时免费活动延长至8月5日。这场限免的主角Hy3，是腾讯在7月6日刚刚开源发布的新一代模型。它最鲜明的身份，是一个快慢思考融合的模型既能快速给出直觉式回应，也能沉下来做深度推理，两种节奏被揉进了同一套架构里。技术底座上，Hy3采用MoE（混合专家）架构，总参数规模达到295B，激活参数则为21B，相当于每次推理只点亮其中一小部分专家，用相对克制的算力开销撬动庞大的知识容量;它最大支持256K的上下文长度，足以一口气吞下长篇文档或整段代码库而不丢失前情。据腾讯方面介绍，Hy3在preview版本的基础上，进一步提升了后训练数据的质量与多样性，并扩大了强化学习阶段的算力规模，最终在推理、智能体、长上下文等任务上取得了显著进步，效果已经能比肩国内外那些参数规模往往是它2到5倍的旗舰模型。换句话说，一个激活参数仅21B的模型，靠着训练策略和架构设计，把和数倍体量对手的差距压到了肉眼难辨的程度。当用户的呼声把免费窗口续到了8月5日，这场关于效率与性价比的较量，也给了更多人亲自上手验货的时间。Hy3腾讯混元大模型MoE本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源：AIBase 来源：https://www.aibase.com/zh/news/29715

马斯克称2万亿参数大模型即将完成训练，或挑战Kimi K3性能

2026年7月20日 12:00

马斯克称2万亿参数大模型即将完成训练，或挑战Kimi K3性能AIbase基地发布于AI新闻资讯·1分钟阅读·Jul 20, 202617月之暗面发布新一代开源大模型Kimi K3后，特斯拉CEO马斯克表示，其旗下2万亿参数规模大模型预计将于下周完成初步训练，并称该模型整体性能将超过此前的1.5万亿参数版本，甚至可能超越Kimi K3。此前，马斯克曾在相关评测报道评论区评价Kimi K3令人印象深刻。7月18日，他进一步透露新模型训练进展，引发业内对超大规模模型竞争的关注。据悉，Kimi K3拥有2.8万亿参数规模、100万词元上下文窗口，并支持原生视觉理解能力，是目前全球参数规模最大的开源大模型之一。模型发布当天，其在Arena AI前端编程排行榜中以1679分登顶全球第一，超过Claude Fable5、GPT-5.6Sol等海外主流模型。随着大模型竞争进入新阶段，参数规模、推理能力、上下文长度以及开源生态成为厂商争夺的重要方向。马斯克旗下AI公司xAI近年来持续推进大模型研发，此次公布2万亿参数模型训练进展，也显示出全球AI企业正在围绕下一代基础模型展开更激烈的技术竞争。KimiK3马斯克2万亿参数开源大模型本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源：AIBase 来源：https://www.aibase.com/zh/news/29714

别再数Token了：OpenAI甩出AI时代记分卡，用"有用智能每美元"给CFO算清ROI

2026年7月20日 12:00

别再数Token了：OpenAI甩出AI时代记分卡，用"有用智能每美元"给CFO算清ROIAIbase基地发布于AI新闻资讯·1分钟阅读·Jul 20, 202615当全世界的首席财务官都在追问同一个问题时，OpenAI决定亲自下场把这笔账算明白:我们从人工智能的投入里，到底换回了多少价值?过去十几年，软件行业习惯了用采用率衡量成败卖了多少席位、有多少活跃用户、续费了多少许可证。但到了AI这里，这套尺子失灵了。真正的刻度，应该是模型到底干完了多少活。OpenAI在7月17日发布的这篇长文里，把企业领导者面对的核心经济命题摊开:人工智能完成的工作，其价值增长是否快过了生产它的成本增长?要回答这个问题，光看每token成本远远不够。一个便宜的模型，token单价或许低，但为了得到好结果，可能要反复试错、耗费更多时间、叠加更多人工审核;一个昂贵的模型，token单价高，却可能一次就把任务做对。真正的成本，是产出一个成功结果的完整代价，再拿它去对照这个成果创造的价值。于是OpenAI给出了AI时代的终极记分卡有用智能每美元。这个指标要回答四件事:人工智能是否在完成有意义的工作?每一项成功任务的成本是多少?人们能否信赖它的结果?随着用量增长，每投入一美元的人工智能，是否创造了更多价值?先说第一项，完成了多少有用工作。价值只在token变成人们能直接使用的实际产出时才被创造出来。模型越强，能扛下的任务就越长越复杂:它开始保持上下文、做多步推理、跨工具协作，并在过程中不断调整适应。最务实的切口，是先锁定一个具体工作流，定义清楚什么叫完成，然后在工作实际发生的系统里去度量这个结果。对支持团队，完成意味着一个客户问题被解决;对工程团队，是一笔通过测试的代码变更;对法务团队，是一份被准确且及时审查的合同。OpenAI举了一个财务团队为预测评审做准备的例子:在最终决策之前，要去找最新预测、把数据导进Excel或Sheets、识别变化、核对标签页、重建幻灯片、检查所有数字是否吻合，这一连串杂活大部分都可以交给ChatGPT Work，团队因此腾出精力去想真正重要的事发生了什么变化、为什么、下一步该怎么办。这就是每一美元在实践里换来的有用智能。第二项，一个成功任务实际花了多少钱。AI任务的成本天差地别，一句快速回答消耗的计算极少，而编码、研究、财务类工作流往往涉及深度推理、工具调用和大量操作，它们吃更多算力，也创造更大价值。在模型层面，单次成功任务的成本由价格、实际用掉的计算量以及得出正确结果的概率共同决定;对企业而言，总成本还要叠上员工时间、人工审核、重试和返工。算法很简单:把完成工作的总成本加起来，除以达到质量标准的任务数量。这正是每token最低价未必换来每结果最低成本的原因即使对常规请求，如果一个前沿模型能一次给对答案，省下的重试、延迟、审核和总计算量，反而可能让它成为最划算的选择。OpenAI刚发布的GPT-5.6正是按这个逻辑设计的三个层级:Sol是旗舰，Terra在性能与成本间取平衡，Luna最快也最省。这套分层给了客户优化公式的起点，但OpenAI强调，最终该用哪档模型，要看整笔任务的经济性高吞吐流程用Luna，需要深度时用Terra，当更强推理能以更少尝试换来最好结果时用Sol。训练GPT-5.6时，OpenAI的目标就是让每个token产出更多有用成果:在Artificial Analysis编程智能体指数上，开启最大推理的GPT-5.6Sol创下新的最优水平，同时比另一款领先模型少用了54%的输出token;在DeepSWE v1.1长周期工程任务里，GPT-5.6Sol达到72.7%的新高，高于Claude Fable5的69.9%，预估API成本还降低了36.2%。每一代模型都该在两方面同时进步更高效率让旧任务更便宜，更强能力让全新类型的工作成为可能。第三项，AI正确完成工作的频率有多高，也就是可靠性。人工智能的采用通常会分阶段深化:先是辅助起草，接着在工具和数据之间找上下文、做推理，再往后开始主动采取行动、处理异常、跑完整个工作流，而人只在必要时给出判断和控制。每一步都创造更多价值，也对系统提出更高要求。可靠性本身就是钱当结果准确、来源可靠、前后一致且能恰当地升级处理，人们花在审查、纠正和返工上的时间就少了，成功任务的成本随之降低，组织也更有底气把AI用进更重要的流程。OpenAI建议团队追踪三种结果来衡量这一点:可直接使用、需要修正、需要升级处理，这比单纯的模型准确率更能说明AI是否真的减少了完成项目所需的工作量。可靠性还需要清晰的边界:在AI从起草走向行动之前，组织必须定义系统能访问哪些数据、可以使用或更改哪些系统、何时需要人工审查或批准某个操作。安全、保障、隐私和控制构筑了深度使用的基础，而ChatGPT Work正是建立在ChatGPT Enterprise的安全、合规与工作区管理之上，让组织在保持监督的同时，给AI接入更有价值的流程。能力带来第一次使用，可靠性才让AI成为完成工作的组成部分。第四项，随着使用量增长，每一美元AI投入能否完成更多工作。企业可以长期追踪同一工作流来度量:统计达到质量标准的任务数、完成它们的总成本、以及每项成功任务的成本，如果完成的工作量增长快过总成本、质量还保持不变或提升，那么每一美元就产出了更多价值。算力处于这个等式的核心它驱动着研究，也驱动着AI完成的每一项任务，决定了产品质量、速度、可靠性、可用性和成本。训练算力构筑未来能力，推理算力交付当下的价值，两者最终都要转化为更好的客户成果。更优的模型、更高效的推理、专用硬件、更高利用率、更聪明的路由和更强的产品设计，都能抬升算力的回报。客户从体感上接住这些改进:答案更准、响应更快、修正更少、产品更可靠、完成所需工作的成本更低。这些收益会自我累积更好的基础设施加速研究，研究催生更强更高效的模型，模型改进产品，产品推动采用、学习与收入增长，而这又反过来支撑对下一代研究、算力、部署和安全的持续投入。OpenAI用一个统一的智能平台把所有这些要素收拢:用户通过ChatGPT和ChatGPT Work使用，开发者通过Codex和API构建，企业把它部署进真实工作发生的系统，任何一层改进，所有产品和客户都随之受益。把四项指标合在一起，这张记分卡其实在回答一件事:每单位成本换来的有用智能，是否在持续上升。有用产出告诉我们AI能产生什么，每项成功任务的成本告诉我们达成结果要付什么，可靠性告诉我们人们可以放心使用多少成果，规模化价值则告诉我们随着时间推移，每一美元和每一单位算力是否实现了更多成效。OpenAI把它自己的职责，归结为让这个等式在每一代模型上都变得更好更强的模型、更快更可靠的结果，以及为客户真实所需的工作压低的成本。当AI开始用每美元的有用智能说话，而不是用token的流水账，价值这回事，才算真正被算清。OpenAI人工智能模型价值成本分析本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源：AIBase 来源：https://www.aibase.com/zh/news/29713