移动端背景

"如果你不冒险去做你害怕的事情,你就永远不会成功。"

——埃隆·马斯克

阿里通义实验室再出王炸!Z-Image-Turbo-Fun-Controlnet-Union 开源,6B 参数秒杀 Flux
2025年12月3日 09:00

阿里通义实验室再出王炸!Z-Image-Turbo-Fun-Controlnet-Union 开源,6B 参数秒杀 FluxAIbase基地发布于AI新闻资讯·1分钟阅读·Dec 3, 202523.3k2阿里巴巴通义实验室今日正式开源 Z-Image-Turbo-Fun-Controlnet-Union,这款全新 ControlNet 模型标志着其 Z-Image 系列图像生成生态的重大扩展。作为 AIbase独家追踪的开源 AI 动态,此次发布进一步强化了 Z-Image-Turbo 在精确控制与创意生成方面的领先优势,迅速引发全球开发者与创作者的热议。模型已在 Hugging Face 平台上线,支持 Apache2.0许可,适用于商用场景。发布背景与技术基础Z-Image 系列自11月底首发以来,已迅速登顶 Hugging Face 趋势榜,首日下载量突破50万次。该系列以单流扩散架构为核心,仅6亿参数却实现照片级真实感渲染,包括皮肤纹理、发丝细节及光影美学优化。Z-Image-Turbo 作为快速推理版本,仅需8步采样即可生成1024x1024分辨率图像,推理时间低至9秒(RTX4080硬件),并在提示词理解上支持中英混合文本渲染,显著提升了创作效率。此次 Z-Image-Turbo-Fun-Controlnet-Union 的推出,是对 Z-Image-Turbo 的深度扩展。它在模型的6个核心块上集成 ControlNet 结构,兼容 Canny 边缘检测、HED 边界提取及 Depth 深度映射等多模态控制条件。该模型专为复杂场景设计,如人物姿态精确生成及基于线稿的建筑渲染,目前通过 Python 代码实现集成,ComfyUI 等工作流支持即将跟进。核心功能与应用亮点多条件控制融合:支持姿态、边缘与深度信息的联合输入,实现零失真图像操控。开发者可轻松构建从草图到成品的自动化管道,适用于电商视觉设计、影视特效及游戏原型制作。高效兼容性:继承 Z-Image-Turbo 的轻量架构,仅需6GB VRAM 即可运行,远低于传统 ControlNet 模型的硬件门槛。测试显示,在低端 GPU 上生成速度达250秒/5步,平衡了质量与实时性。开源生态赋能:模型提供4-bit 量化版本(如 MFLUX 兼容),便于 Mac 等消费级设备部署。同时,Z-Image-Edit 变体增强了复合编辑指令理解,保持画面一致性。这些功能不仅降低了 AI 图像生成的门槛,还为非专业用户打开了专业级创作大门。社区反馈显示,该模型在广告素材生成中,提示词忠实度超越 OVIS Image 等竞品。社区反响与未来展望开源社区对 Z-Image-Turbo-Fun-Controlnet-Union 的响应热烈,Reddit 与 X 平台上涌现大量基准测试,包括名人面部识别及 K-pop 偶像生成实验,结果显示其在辨识度与自然度上表现出色。开发者赞誉其按着 Flux 打的效率优势,尤其在低 CFG Scale(2-3)下的稳定输出。 AIbase 分析,此次发布强化了阿里巴巴在开源 AI 领域的全球竞争力。未来,预计将与 Z-Image-Base 版本联动,形成完整图像生成-编辑-控制闭环。Hugging Face :https://huggingface.co/alibaba-pai/Z-Image-Turbo-Fun-Controlnet-UnionZ-Image-Turbo-Fun-Controlnet-UnionControlNetZ-ImageAIbase本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23294

Google Discover测试AI生成标题引争议,出版商与平台矛盾再升级
2025年12月3日 09:00

Google Discover测试AI生成标题引争议,出版商与平台矛盾再升级AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 3, 202523.3k谷歌正在Google Discover中测试AI生成标题功能,但这一尝试引发了误导性信息问题。据《The Verge》发现,Google Discover中部分文章标题已由AI改写,与原文标题存在明显差异。其中一些改写后的标题具有误导性,甚至完全错误。例如,Ars Technica一篇关于Valve Steam Machine的文章,原标题为"Valve的Steam Machine看起来像一台游戏主机,但别指望它的价格也像游戏主机",却被AI改写成"Steam Machine价格揭晓"而实际上该硬件的价格尚未公布。Engadget工作人员在调查中还发现,Discover会保留原始标题,但附加AI生成的摘要。这些内容均标注"由AI生成,可能会出错"的提示,但错误信息的出现仍引发质疑。谷歌发言人Mallory Deleon回应称,这是"针对部分Discover用户进行的小型用户界面实验",旨在"测试一种新设计,改变现有标题的位置,让用户在浏览来自网络各处的链接之前,更容易理解主题详情"。这一举措再次凸显谷歌与在线媒体之间的紧张关系。多年来,网络出版商一直试图从谷歌获得展示其内容的补偿。谷歌曾至少两次直接将新闻来源从搜索结果中移除,并声称展示新闻对其广告业务的盈利贡献不大。与此同时,谷歌正在推进AI功能的更深度整合。此前被新闻媒体联盟指责为"盗窃"的AI模式聊天机器人,如今正与移动搜索平台进行更紧密的融合。谷歌搜索产品副总裁罗比·斯坦昨天在X网站上宣布,公司正在测试将AI模式与AI概览放在同一屏幕上,而非像现在这样分别放在不同标签页中。AI生成标题谷歌GoogleDiscoverValveSteamMachine本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23293

ChatGPT 突发故障,OpenAI 紧急修复服务中断问题
2025年12月3日 09:00

ChatGPT 突发故障,OpenAI 紧急修复服务中断问题AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 3, 20256OpenAI 的人工智能聊天机器人 ChatGPT 于12月2日和3日接连遭遇服务中断,导致部分用户无法正常使用该服务。此次故障主要影响网页版 ChatGPT,许多用户在尝试通过浏览器进行交互时,遇到服务无响应或无法加载的情况。相比之下,ChatGPT 的 Mac 桌面客户端在此期间运行正常,没有受到影响,这表明问题可能出在 OpenAI 的 Web 服务器或相关网络基础设施。故障首次发生在北京时间12月2日2点08分,OpenAI 随即采取了缓解措施,并在2点37分时开始监测恢复情况。经过努力,该问题于当日3点确认已完全恢复。然而,服务中断并没有持续太久,3日再次出现问题,显示 ChatGPT 错误率增加,该问题于北京时间3日3点26分开始,直到4点12分才完全恢复。OpenAI 在给 CNBC 的一份声明中解释了故障原因,称是由于路由配置错误,导致一些用户在使用 ChatGPT 时遇到问题。不过,问题现在已经得到修复,用户可以恢复正常使用。根据 Downdetector 的统计,约有3000名用户在故障发生时报告了问题。尽管此次故障对部分用户造成了不便,但总体影响范围有限,并未扩散至所有用户或所有平台。划重点: 故障影响:ChatGPT 网页版在12月2日和3日接连出现服务中断,主要影响浏览器用户。 故障原因:OpenAI 表示因路由配置错误导致部分用户无法正常使用服务。 服务恢复:问题经过及时修复后,用户现已恢复正常使用 ChatGPT。ChatGPTOpenAI服务中断路由配置错误本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23292

亚马逊推出全新 AI 芯片 Trainium3:性能翻倍、能效提升显著
2025年12月3日 09:00

亚马逊推出全新 AI 芯片 Trainium3:性能翻倍、能效提升显著AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 3, 20255在2025年 AWS re:Invent 大会上,亚马逊云科技(AWS)正式发布了最新一代的人工智能训练芯片 Trainium3。这款芯片在多个方面都实现了显著的进步,给 AI 模型训练带来了全新的可能性。根据 AWS 的介绍,Trainium3芯片采用先进的3纳米制程,其性能相比于第二代产品提升了4倍,内存容量同样增加了4倍,能效则提高了40%。这一系列的改进使得 Trainium3能够更好地满足高负载推理和 AI 训练的需求。此次发布的 Trainium3UltraServer 系统能够支持大规模集群的构建,最多可以连接100万颗 Trainium3芯片,这个数字是前一代系统的10倍。每台 UltraServer 最多可以容纳144颗芯片,极大地提升了数据处理能力。亚马逊表示,该系统将帮助客户在使用 AI 云服务时显著降低推理成本,进一步促进了 AI 技术的应用。此外,AWS 还透露了 Trainium4的开发计划,表示这一新一代芯片将支持与英伟达的 GPU 协同工作。通过支持英伟达的 NVLink Fusion 高速互连技术,Trainium4不仅能够扩展整体性能,还能利用亚马逊自研的低成本服务器架构。这一举措将可能降低将现有英伟达优化的 AI 应用迁移至亚马逊云平台的门槛。划重点: Trainium3性能提升4倍,内存和能效分别增至4倍和40%。 UltraServer 系统可搭载100万颗芯片,支持超大规模集群。 Trainium4将支持与英伟达 GPU 协同工作,降低 AI 应用迁移门槛。Trainium3AWSre:InventAI训练芯片Trainium3UltraServer本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23291

黑五战报:Rufus成交率飙100%,亚马逊AI助手成假日季最大转化引擎
2025年12月2日 18:00

黑五战报:Rufus成交率飙100%,亚马逊AI助手成假日季最大转化引擎AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 2, 20256亚马逊旗下AI购物助手Rufus在刚刚过去的黑五交出首份实战成绩单:Sensor Tower数据显示,使用Rufus的购物会话成交率较未使用者高出100%,单日成交增幅达75%,显著跑赢仅依赖传统搜索的用户35%的增幅。这一表现直接推动亚马逊美国站黑五成交会话总量同比增长100%,而同期未接入Rufus的会话仅增20%;Rufus参与的总会话量亦较平日上涨35%,超出网站整体20%的日增幅。Adobe同期报告指出,AI导流用户转化意愿比非AI流量高38%,且AI流量在黑五当天同比增长805%,成为假日季最大变量之一。Rufus于 2024 年 8 月全量上线,目前已在 250 万次购物会话中亮相,帮助用户完成比价、选品及礼品灵感询问。CEO安迪·雅西在财报电话会中透露,Rufus用户购买完成率比非使用者高60%,公司预计其年度增量销售额有望突破 100 亿美元。尽管订单均价因通胀同比上涨7%,但AI助手的对话式导购显著缩短了决策路径:用户平均会话时长减少12%,却带来更高的客单价与复购率。行业分析指出,Rufus的成功验证了生成式AI+零售的闭环模型从自然语言查询到个性化推荐,再到一键结账,全程无需跳出App。亚马逊表示, 2026 年将继续扩大Rufus国际版图,并引入图像与语音多模态交互,进一步降低购物门槛。对竞争对手而言,AI助手已从锦上添花变为转化刚需,假日季的AI流量大战才刚开始。AI购物助手Rufus亚马逊AI导流本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23290

有警告称,人工智能技术将消耗澳大利亚12%的电力
2025年12月2日 18:00

有警告称,人工智能技术将消耗澳大利亚12%的电力AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 2, 202562025 年 12 月 2 日 随着人工智能产业迅猛发展,对算力和数据中心的需求激增,澳大利亚联邦政府正考虑要求大型 AI 公司为其高耗能的数据中心配套建设可再生能源电厂,以减轻对国家电网和环境的压力。据悉,监管机构和产业观察者警告称,到 2050 年,人工智能相关设施可能消耗全国约 12% 的电力。数据显示,仅在 2024 年,数据中心就消耗了约 4 太瓦时 (TWh) 的电力,占全国电网供电总量的约 2%。基于此,澳洲负责能源与基础设施的部长 Tim Ayres 表示,将在 2026 年初推出一套数据中心投资原则 (data centre principles),明确规定未来大型数据中心若要获得建设许可,须配套投资可再生能源发电与水资源可持续方案。他说:我们希望看到数字基础设施不仅服务于 AI 的发展,同时也为我们的能源未来提供支撑。政府目前设想,大型 AI 公司可能被要求自行建设风电、太阳能发电厂,或投入储能与备用发电设施 (如天然气峰值电厂),以保障数据中心运营的电力来源与环境可持续。这一提议受到商界组织、工会乃至科技产业本身的欢迎,他们认为这或许为 AI 行业的快速扩张设立一种绿色共生的新模式。与此同时,也有人对政府现有的国家 AI 计划 (National AI Plan) 缺乏明确、紧迫的投资承诺提出批评。正如一位产业评论者所言:就像全球已经在百米冲刺,我们却还在问 起跑线在哪里。如果落实,这一政策可能催生一轮新的可再生能源基础建设浪潮从风电、太阳能发电、储能设施,到与数据中心冷却系统、水资源管理相结合的绿色基础设施,将成为未来 AI 基建的重要组成部分。对环保人士、能源规划者与科技企业来说,这既是挑战,也是一次将 AI 与绿色转型融合的机会。AI新词数据中心可再生能源储能本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23288

800 万美元ARR、零融资Chatbase副业逆袭,要造客户联合创始人级AI智能体
2025年12月2日 18:00

800 万美元ARR、零融资Chatbase副业逆袭,要造客户联合创始人级AI智能体AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 2, 20256Chatbase创始人Yasser在X平台官宣:其AI客服平台年经常性收入(ARR)突破800万美元,全部由自筹资金完成,未拿一分钱VC。按当前月续费率测算,Chatbase每30分钟即新增约1.5万美元订阅收入,全球付费企业客户已超过1万家。从副业到现金奶牛-2021年:Yasser下班后上线把PDF变AI客服的小工具,首月即获得2000美元MRR-2023年:产品上线网页嵌入、Slack集成与多语言对话,ARR首次越过100万美元-2025年12月:ARR达800万美元,月环比保持8%增长,客户续费率92%,远超行业平均客户联合创始人计划启动Yasser同时披露下一代产品路线图:Chatbase将不再局限于回答工单,而是升级为具备增长思维的AI智能体,核心能力包括:1. 主动洞察:每日扫描客户行为数据,输出高流失风险名单与优化建议2. 自动实验:无需代码即可发起A/B测试、定价调整或邮件召回,并实时汇报收益3. 战略模拟:通过多智能体协作,模拟市场、运营、客户成功团队,输出季度增长剧本4. 执行层对接:与Shopify、Stripe、HubSpot等主流SaaS双向同步,一键落地运营动作行业观察Chatbase的零融资+高续费路径被视为AI自举创业的新范本。低成本全球分发、插件式集成与按用量计费,使个人开发者也能与大厂正面竞争。Yasser透露,下一步将开放AI联合创始人API,允许SaaS厂商把增长智能体嵌入自身产品,目标在三年内将ARR推至1亿美元。当资本寒冬与AI热潮并存,Chatbase用800万美元的真实收入证明:持续盈利才是对创业者和投资人最友好的护城河。AI客服ChatbaseARRYasser本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23287

Google 全球扩展 Gemini 3 AI 模式,覆盖全球 120 个国家
2025年12月2日 18:00

Google 全球扩展 Gemini 3 AI 模式,覆盖全球 120 个国家AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 2, 202510Google 近日宣布,其最新的生成式人工智能模型 Gemini3正式在全球范围内大规模扩展。自从 Gemini3首次发布以来,仅过去数周时间,Google 便开始面向全球用户开放这一强大的 AI 功能,让更多用户能够在 Google 搜索的 AI 模式中体验其优势。这次扩展覆盖了120个国家和地区,包括美洲、亚太及欧洲、中东和非洲等地。用户只要在支持的地区,便可以使用 Gemini3Pro 进行搜索。最初,这一版本仅在美国向 Google AI Pro 和 Ultra 订阅用户开放,用户可以通过 Gemini 应用的下拉菜单中的 Thinking 选项来访问。Gemini3的推出,不仅提升了用户查询的处理能力,还在理解用户意图和语义细微差别方面进行了优化,展现出更强的推理与多模态能力。Google 表示,其用于发散式检索的 query fan-out 技术也得到改进,能够帮助用户挖掘复杂问题中可能遗漏的相关信息。在发布节奏上,Google 这次明显加快了旗舰模型的落地速度。值得注意的是,Gemini3在 LMArena 榜单上的表现也超过了 OpenAI 的多个领先模型。同时,Google 调整了搜索模型的调度策略:对于需要深度推理的复杂问题,搜索引擎会智能切换至 Gemini3,而简单任务则依然使用反应速度更快的轻量模型,以确保用户体验的流畅性。除了文本生成能力外,Google 还推出了 Gemini3家族中的图像生成模型 Nano Banana Pro,扩大了其在搜索 AI 模式中的应用范围。此功能同样仅向订阅了 Google AI Pro 和 Ultra 方案的用户开放,主要支持英文界面。此外,Gemini 系列还引入了科学领域的新型交互式图示,以及 AI 生成图像识别功能,显示出 Google 在强化 Gemini 生态系统方面的积极努力。划重点: 全球扩展:Gemini3AI 模式现已在120个国家和地区上线,用户可享受更丰富的搜索体验。 优化能力:新模型在理解用户意图和语义方面进行了提升,具备更强的推理和多模态能力。 快速落地:Google 加快了 Gemini3的推出速度,确保用户在复杂和简单任务中均能获得流畅体验。Gemini3GoogleAI模型生成式人工智能本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23286

MIT 新创公司 OpenAGI 推出 AI Agent,声称超越 OpenAI 与 Anthropic
2025年12月2日 18:00

MIT 新创公司 OpenAGI 推出 AI Agent,声称超越 OpenAI 与 AnthropicAIbase基地发布于AI新闻资讯·1分钟阅读·Dec 2, 202515近日,来自麻省理工学院的初创公司 OpenAGI 正式亮相,并宣布其新推出的 AI 模型 Lux 在计算机操作方面的表现超越了 OpenAI 和 Anthropic 的同类产品,且成本仅为其十分之一。OpenAGI 的首席执行官秦增义表示,Lux 是一种基础模型,旨在通过解析计算机截图,自动执行桌面应用程序中的操作。在最新发布的 Online-Mind2Web 基准测试中,Lux 的成功率达到了83.6%,而 OpenAI 的 Operator 仅为61.3%,Anthropic 的 Claude Computer Use 则为56.3%。这种显著的性能差距让业界人士对 Lux 的技术能力充满期待。与传统的大型语言模型不同,Lux 采用了 Agent主动预训练 的方法,专注于从计算机截图和动作序列中学习。这一自我强化的训练循环使得 Lux 能够在不断探索的过程中提高自身能力,从而实现了更高效的操作。OpenAGI 还声称,Lux 的操作成本大约是 OpenAI 和 Anthropic 前沿模型的十分之一,且其速度也更快。不同于仅能处理浏览器任务的竞争对手,Lux 可以全面控制桌面应用程序,包括 Excel、Slack 等,极大地扩展了其市场潜力。公司同时发布了开发者软件开发工具包,允许第三方基于 Lux 开发应用。在安全性方面,OpenAGI 为 Lux 设计了内置的安全机制,当模型接收到可能违反安全政策的请求时,会拒绝执行,并向用户发出警告。这一特性在当前 AI 代理快速发展的背景下尤为重要。秦增义博士背景深厚,曾参与开发多个广受欢迎的 AI 模型,展示了较小团队在技术上的潜力与创新。划重点:- OpenAGI 推出的 Lux AI 代理在计算机操作基准测试中获得83.6% 的成功率,远超 OpenAI 和 Anthropic。- Lux 采用独特的学习方式,通过计算机截图和动作序列进行训练,具有自我强化的能力。- 安全机制内置于 Lux 中,能够识别和拒绝潜在的危险请求,保障用户数据安全。AI新词LuxOpenAGIAgent主动预训练本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23284

vLLM-Omni开源:把扩散模型、ViT、LLM塞进一条流水线,多模态推理一次跑完
2025年12月2日 18:00

vLLM-Omni开源:把扩散模型、ViT、LLM塞进一条流水线,多模态推理一次跑完AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 2, 202516vLLM团队发布首个全模态推理框架vLLM-Omni,将文本、图像、音频、视频的统一生成从概念验证变成可落地代码。新框架已上线GitHub与ReadTheDocs,开发者可立即pip安装并调用。解耦流水线架构- 模态编码器:ViT、Whisper等负责把视觉、语音转为中间特征- LLM核心:继续沿用vLLM自回归引擎,承担思考、规划与对话- 模态生成器:DiT、Stable Diffusion等扩散模型解码输出,支持图像、音频、视频同步生成框架把三段组件视为独立微服务,可在不同GPU或节点间调度,资源按需弹性伸缩图像生成高峰时横向扩容DiT,文本推理低谷时收缩LLM,显存利用率提升最高40%。性能与兼容性vLLM-Omni提供Python装饰器@omni_pipeline,三行代码即可把原有单模态模型拼装成多模态应用。官方基准显示,在8×A100集群运行10亿参数文本+图像模型,吞吐比传统串行方案提高2.1倍,端到端延迟下降35%。开源与路线图GitHub仓库已放出完整示例与Docker Compose脚本,支持PyTorch2.4+和CUDA12.2。团队透露,2026Q1将加入视频DiT与语音Codec模型,并计划提供Kubernetes CRD,方便企业在私有云一键部署。行业观点业内人士认为,vLLM-Omni把异构模型纳入同一数据流,有望降低多模态应用落地门槛,但不同硬件间的负载均衡与缓存一致性仍是生产环境挑战。随着框架逐渐成熟,AI初创公司可更便宜地构建文本-图像-视频统一平台,而不必分别维护三条推理链路。项目地址:https://github.com/vllm-project/vllm-omnivLLM-Omni全模态推理框架ViTStableDiffusion本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23283

蚂蚁数科Agentar入选中国智能体开发赛道第一梯队"
2025年12月2日 18:00

蚂蚁数科Agentar入选中国智能体开发赛道第一梯队"AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 2, 202517近日,全球权威研究机构IDC全新发布《IDC MarketScape: 中国智能体开发平台2025年厂商评估》,蚂蚁数科跻身领导者象限,标志着其在中国AI智能体开发领域已具备领先实力。作为当前中国智能体研发技术服务市场的权威评估,该报告通过技术能力、产品成熟度、生态布局及行业落地成效等多维度,对主流厂商进行了全面考评。蚂蚁数科的Agentar平台凭借技术架构的完整性、产品迭代的成熟度、生态布局的前瞻性,以及在金融领域多年沉淀的技术经验与规模化落地成果,已得到第三方权威评测机构的认可。随着大模型技术深入应用,智能体正成为企业推进AI原生转型、重构业务流程的核心载体。IDC在报告中指出,现阶段,那些具备多智能体协同构建、全域知识数据整合、多元工具调用适配及全流程运营发布等全栈能力,同时拥有丰富行业落地实践的平台厂商,正逐步在市场竞争中占据有利地位。而未来该领域的竞争焦点,将集中在复杂场景智能体的构建与应用一体化开发能力上。值得关注的是,蚂蚁数科专为金融场景研发的Agentar-Fin-R1推理大模型,在三项重要金融基准测试中均位列第一,性能表现超越多款主流开源模型。记者了解到,蚂蚁数科的这一技术优势已转化为实际应用价值,目前宁波银行、上海银行、天津银行、新华人寿等众多金融机构,都已基于该金融推理大模型,着手打造专属的AI大脑,推动业务智能化升级。行业数据进一步印证了蚂蚁数科在金融科技领域的影响力:其相关技术与服务已覆盖全部国有股份制银行,服务的地方性商业银行占比超60%,累计为数百金融机构提供支持,成为推动金融业高效数智化转型的重要动力。AI智能体蚂蚁数科AgentarIDC本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23282

奥特曼宣布 OpenAI 进入红色警报状态 暂停广告业务全力抢救 ChatGPT
2025年12月2日 15:00

奥特曼宣布 OpenAI 进入红色警报状态 暂停广告业务全力抢救 ChatGPTAIbase基地发布于AI新闻资讯·1分钟阅读·Dec 2, 20251据一份内部备忘录显示,OpenAI 首席执行官**萨姆·奥特曼(Sam Altman)**于周一告知全体员工,鉴于来自谷歌及其他人工智能竞争对手的威胁日益增加,公司已进入红色警报状态。奥特曼此举旨在调集更多资源,全力投入改进其旗舰产品ChatGPT。他表示,为了集中力量应对核心竞争,OpenAI 计划推迟其他一些非核心计划,例如正在规划中的广告业务。这一红色警报状态的宣布,标志着 OpenAI 将战略重心完全转向产品强化,以确保其在快速演进的生成式 AI 市场中保持领先地位。红色警报OpenAIChatGPT生成式AI本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23281