演员刘美含被铸币坊难倒,五个 AI 读音各不同
2026年3月2日 18:00
演员刘美含被铸币坊难倒,五个 AI 读音各不同AIbase基地发布于AI新闻资讯·1分钟阅读·Mar 2, 20263近日,演员刘美含在社交平台分享的一段配音趣事引发了网友对 AI 准确性的热议。她在为新剧配音时,因不确定铸币坊中坊字的读音,先后求助了 5 家主流 AI 工具,结果却让她彻底绕晕。AI 界的多音字大乱斗:各有各的读法:在刘美含的测试中,百度给出的读音是fáng;DeepSeek、腾讯元宝和阿里千问则异口同声地给出了fng的答案。同款软件不同命:最令人震惊的是,刘美含发现自己手机里的豆包与录音老师设备上的豆包,针对同一个词给出的读音竟然也不统一。权威词典终结比赛:在一片混乱中,刘美含最终通过新华词典App 确认了正确读音为fáng(用于街巷名或店铺名)。刘美含对此感叹,虽然现在大家习惯遇事问 AI,但大模型在处理这类严谨的学术或拼音问题时,依然存在明显的幻觉和不一致性,最终结果未必可靠。AI铸币坊刘美含豆包本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/25846定义智能体 AI 性能标杆!高通发布全新 X105 调制解调器及射频系统
2026年3月2日 18:00
定义智能体 AI 性能标杆!高通发布全新 X105 调制解调器及射频系统AIbase基地发布于AI新闻资讯·1分钟阅读·Mar 2, 20262在2026年巴塞罗那世界移动通信大会(MWC2026)上,高通正式发布了全新一代调制解调器及射频系统高通 X105。该系统采用了面向AI 赋能的5G Advanced 全新架构,专为下一代智能体 AI(Agentic AI)终端打造。高通 X105不仅在硬件和软件层面实现了双重革新,显著优化了能效与占板面积,更通过深度集成的 AI 特性,为移动通信、工业物联网、自动驾驶及卫星通信树立了全新性能基准。核心技术突破:第五代5G AI 处理器:高通 X105内置强悍的 AI 引擎,通过智能体 AI 支持卓越的5G Advanced 用户体验。OEM 厂商可利用新增的 API 调用预测性智能,从而实时优化连接性能。极致能效与紧凑设计:得益于全新的射频收发器,其占板面积减少了15%,功耗大幅降低30%,为轻薄型终端和可穿戴设备腾出了更多空间。首发支持 NR-NTN 卫星通信:这是首个支持标准协议非地面网络(NTN)的平台,使用户能够通过卫星网络进行高质量的语音通话、视频流传输及数据消息交互。全球首款四频 GNSS 支持:X105率先支持 L1、L2、L5、L6四个 GNSS 频段。在提升全球覆盖范围和定位精度的同时,其定位功耗还降低了25%。作为 MWC2026的重磅成果,高通 X105还配套了全新的射频前端组件,包括 QET8200包络追踪器和高性能功率放大器模组,旨在为单链路 FDD 场景提供更强的信号覆盖与效率。AI赋能高通X1055GAdvancedAgenticAI本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/25845攻克长视频检索难题!北京大学联手 OceanBase 打造 LoVR 基准:入选 WWW 2026,开启全视频+片段级智能检索新范式
2026年3月2日 18:00
攻克长视频检索难题!北京大学联手 OceanBase 打造 LoVR 基准:入选 WWW 2026,开启全视频+片段级智能检索新范式AIbase基地发布于AI新闻资讯·1分钟阅读·Mar 2, 202612长视频理解的深水区终于迎来了权威评测标准。2026 年 3 月 2 日,由 与 联合提出的长视频多模态检索基准LoVR (Long Video Retrieval)正式宣布被国际顶级会议WWW 2026 (The Web Conference)录用。这一成果填补了业界在真实长视频(Long-form Video)多粒度检索评测领域的空白。核心突破:解决长视频检索的三座大山传统的视频检索基准大多局限于短视频(如 TikTok 风格),难以应对长视频中复杂的语义关联。LoVR 的出现针对性地解决了三大痛点:全粒度覆盖:既支持全视频 (Video-level)的宏观检索,也支持片段级 (Clip-level)的微观精确定位,满足了从搜整部片子到搜某个瞬间的多元需求。规模化高质量标注:配套了一套创新的标注流水线,通过大模型(VLM)自动化生成、质量自动评分与动态修正相结合,实现了低成本、可扩展的高质量多模态数据构建。真实场景建模:系统性地刻画了长视频检索中的长程语义偏移、信息密度极高等真实难点。技术规格:40,000+ 精细片段的支撑不仅仅是一个理论框架,更是一个庞大的实战数据库:海量数据:包含467 个真实长视频,平均时长超过 25 分钟。精细切片:衍生出超过40,804 个精细片段,每个片段均配有经过人工和机器双重验证的高质量文本描述(Captions)。语义融合技术:引入了语义融合方法,确保在生成全视频摘要时不会丢失关键的上下文信息,为长程语义建模提供了统一的评测平台。行业观察:校企联研助推 AGI 落地作为与北大校企联合研究的代表作,LoVR 的入选意味着国产数据库领军企业正从单一的存储计算向向量检索+多模态理解的前沿领域迈进。随着长视频在流媒体、监控监控、在线教育等领域的爆发,LoVR 提供的多粒度检索标准将成为未来视频搜索引擎、AI 剪辑助手等应用走向可靠的重要基石。LoVR长视频多模态检索WWW2026本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/25843创意一站式打通!谷歌升级 Flow AI 工具:视频、绘画与特效全融合
2026年3月2日 18:00
创意一站式打通!谷歌升级 Flow AI 工具:视频、绘画与特效全融合AIbase基地发布于AI新闻资讯·1分钟阅读·Mar 2, 20267谷歌近日宣布,正式对其名为Flow的实验性 AI 创作工具进行大规模功能扩展。此前,Flow 主要被定位为一款 AI 视频生成器,而现在,谷歌正将其先进的图像生成技术Whisk和ImageFX深度集成至该应用中,旨在为创作者打造一个统一的AI 创意工作室。本次更新的核心亮点:统一工作流:用户现在可以在同一个界面内完成从生成图片到图片无缝转动画的全过程。这种全家桶式的集成消除了跨工具操作的繁琐,让创意表达更加连贯。ImageFX 强力驱动:通过引入 ImageFX,用户可以利用谷歌最新的 DALL-E 级别图像模型生成高质量素材,并直接在 Flow 中进行编辑。Whisk 风格迁移:集成的 Whisk 工具允许用户通过参考图快速调整作品风格,实现更高程度的视觉定制化。动态化编辑:除了静态内容的生成,新版 Flow 强化了动画制作功能,用户可以更精细地控制视频中的动作流向和特效表现。谷歌在官方演示视频中展示了New Flow的强大潜力:只需简单的文字指令或素材拖拽,用户就能在几分钟内制作出具有电影质感的短片。FlowAI创作工具WhiskImageFX本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/25842美团系 Tabbit 正式开启公测:主打智能代理自动化
2026年3月2日 18:00
美团系 Tabbit 正式开启公测:主打智能代理自动化AIbase基地发布于AI新闻资讯·1分钟阅读·Mar 2, 20265由北京酷讯互动公司打造的Tabbit AI 浏览器今日正式上线公测。值得关注的是,该公司由美团创始人王兴持股95%,这意味着 Tabbit 实际上是美团在 AI 终端领域的重要布局。Tabbit 的核心愿景是将工作交给 AI,将时间留给自己。与传统浏览器不同,它引入了深度集成的智能代理模式(Agent Mode),旨在改变用户与网页交互的方式。Tabbit 的核心功能亮点:自主执行复杂任务:Tabbit 能够根据用户指令,自动完成打开网页、提取关键信息、填写表单等操作。它可以跨平台流转数据,打破不同业务系统之间的壁垒,替代人工进行重复性的搬运工作。独立后台运行:AI 任务在独立的标签组中运行,不会干扰用户的正常浏览。用户可以继续处理其他事务,而 Tabbit 在后台默默完成工单处理、审批流转或定期检查。深度调研与报表汇总:该浏览器具备全网检索能力,能自动阅读并筛选海量信息,提炼核心数据并生成结构化调研报告;同时能自动遍历多个业务平台,将散乱的指标清洗汇总成统一报表。全明星模型矩阵:Tabbit 允许用户自由切换国内顶尖大模型,首批支持包括DeepSeek-V3.2、Doubao-Seed-1.8、Kimi-K2.5、Qwen3.5-Plus、GLM-5以及MiniMax-M2.5等在内的多款主流模型。此外,Tabbit 还支持名为妙招(Skill)与脚本(Script)的扩展功能,允许开发者和高级用户自定义更复杂的自动化流程,进一步拓展浏览器的能力边界。TabbitAI浏览器AI终端智能代理模式王兴本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/25841阿里巴巴AI业务重塑 阿里巴巴大模型品牌统一为千问
2026年3月2日 18:00
阿里巴巴AI业务重塑 阿里巴巴大模型品牌统一为千问AIbase基地发布于AI新闻资讯·1分钟阅读·Mar 2, 202614在 3 月 2 日的官方公告中,阿里巴巴宣布将其旗下的 AI 业务品牌统一命名为 千问(英文名 Qwen),标志着该公司的人工智能战略进入了一个全新的阶段。这一整合不仅涵盖了基础模型与专业领域模型,更进一步明确了千问 APP 作为面向消费者的旗舰应用程序的地位。此次品牌整合的背后,反映了阿里巴巴在 AI 领域的深耕与创新。千问大模型将作为一个统一的名称,代表着阿里巴巴在人工智能技术上的强大实力。更值得注意的是,阿里于除夕时开放了千问 3.5 的源代码,并推出了多款中小型 Qwen 3.5 模型,这些新模型迅速在 Hugging Face 平台上获得了极高的评价,目前已占据全球开源大模型榜单的前四名。在市场反应方面,千问 APP 在春节假期期间共处理了近 2 亿次 一句话下单 的指令,显示出其强大的用户粘性与市场吸引力。根据第三方机构 QuestMobile 的数据,千问的日活跃用户(DAU)在这一期间达到了 7352 万,增长幅度高达 940%,在国内 AI 类应用中名列前茅。这一表现不仅展示了千问在 C 端市场的巨大潜力,同时也预示着阿里巴巴在 AI 行业的进一步发力。同时,通义实验室的成立则明确了阿里巴巴在 AI 领域的组织架构,使得该公司在 AI 技术研发和应用上能够更加高效地进行探索与创新。这一新的实验室将专注于推动技术的突破与应用场景的扩展,助力阿里巴巴在全球科技竞争中持续领先。总之,阿里巴巴通过千问大模型和通义实验室的全新布局,正在为其 AI 业务注入更多的活力与创造力,未来的发展值得我们拭目以待。千问QwenAI大模型开源模型本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/25840制霸 Hugging Face!阿里千问 3.5 开启刷榜模式:Qwen 系列包揽全球开源前四,春节 DAU 暴涨 940%
2026年3月2日 15:00
制霸 Hugging Face!阿里千问 3.5 开启刷榜模式:Qwen 系列包揽全球开源前四,春节 DAU 暴涨 940%AIbase基地发布于AI新闻资讯·1分钟阅读·Mar 2, 20262国产大模型正在全球开源界与 C 端市场同步上演速度与激情。2026 年 3 月 2 日,随着阿里云 (Alibaba Cloud)在春节期间的一系列密集布局,通义千问 (Qwen)家族正式确立了其在全球 AI 生态中的霸主地位。此次春节攻势不仅是技术的输出,更是 AI 深度融入国民生活的一次里程碑事件。技术统治力:Qwen 3.5 霸榜 Hugging Face阿里在开源领域的除夕大礼包余威犹存,多款中小型模型齐发,改写了全球大模型格局:全球前四全包揽:在权威AI 社区Hugging Face的全球开源大模型榜单上,Qwen 3.5 系列凭借卓越的推理、编码及多模态能力,强势占据了前四名的所有席位。中小型模型爆发:针对端侧和边缘计算优化的Qwen 3.5-7B/14B等模型,以极低的参数量跑出了超越同级闭源模型的性能指标,极大降低了开发者的创新门槛。市场爆发力:DAU 飙升 940%,位列国内第一在用户端,通义千问 App凭借春节假期的社交与消费场景,实现了现象级的增长:一句话下单成爆款:春节期间,千问 App 累计处理了近 2 亿次语音指令,用户只需一句话即可完成打车、订餐、购票等复杂操作,标志着AI 智能体 (Agent)正式进入大众化阶段。用户规模跨越式增长:根据QuestMobile的最新数据,千问在春节期间的日活跃用户(DAU)冲上7352 万,同比增长率高达940%,这一增幅在当前所有国内 AI 类应用中傲视群雄。行业观察:从会聊天到会干活的蜕变阿里云此次双线大捷,反映出 2026 年大模型竞争的两个核心逻辑:底层开源生态的掌握与顶层应用场景的穿透。Qwen 3.5 既能在极客社区赢得口碑,又能在真实商业交易中通过一句话下单证明其实际效用,这意味着 AI 已不再是实验室的玩具,而是真正改变国民生活方式的新基座。AI新词通义千问阿里云HuggingFace本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/25839打破闭源垄断!Notion 引入首个开源权重模型 MiniMax M2.5:联手国产之光重塑 AI 工作流,主打一个极致性价比
2026年3月2日 15:00
打破闭源垄断!Notion 引入首个开源权重模型 MiniMax M2.5:联手国产之光重塑 AI 工作流,主打一个极致性价比AIbase基地发布于AI新闻资讯·1分钟阅读·Mar 2, 20266全球顶级协同办公平台Notion正在加速拥抱混合模型生态。2026 年 3 月 2 日,Notion 联合创始人Akshay Kothari宣布,Notion Custom Agents(自定义智能体)正式引入由 MiniMax 研发的开源权重模型MiniMax M2.5,并作为实验性功能向全球用户开放。这一动作不仅打破了 Notion 长期以来由 Claude、GPT 等顶尖闭源模型垄断的选择列表,更标志着国产大模型正式进入全球主流生产力工具的核心版图。核心亮点:极致性能与白菜价成本MiniMax M2.5 的加入,为 Notion 的 1 亿多用户提供了一个更具吸引力的选项:独立并列:在 Notion 的模型选择下拉菜单中,MiniMax M2.5已与Claude Sonnet 4.6、Gemini 3 Pro等顶级模型齐名并列。高性价比:对于文档整理、日程同步、自动化任务等简单但量大的日常工作,M2.5 的调用成本远低于闭源模型,被称为 AI 界的生产力刚需。Agent 原生设计:MiniMax M2.5 采用了针对Agentic Workflow(智能体工作流)优化的 RLAIF 框架,在处理复杂任务拆解和多步执行时,表现极其稳健。技术背书:首个进驻 Notion 的开源权重模型MiniMax M2.5自 2026 年 2 月发布以来便在硅谷引发关注:性能强悍:在 SWE-Bench 等硬核编程与工具调用榜单中,M2.5 的表现甚至超越了部分闭源旗舰模型,且推理速度高达100 tokens/second。垂直办公优化:该模型在训练中深度模拟了 Excel 财务建模、Word 深度撰写及 PPT 逻辑生成等真实办公场景,与 Notion 的全能工作台属性完美契合。行业观察:从全能大脑到专业分工Akshay Kothari此次引入开源模型,反映了 Notion 2026 年的核心战略:模型不可知论 (Model Agnosticism)。用户不再被锁定在某一家供应商手中,而是可以根据任务需求自由切换:追求深度文学创作,用Claude Opus 4.6;进行大规模数据清洗与逻辑执行,选MiniMax M2.5。这种混合动力模式,将助力Notion进一步巩固其作为 AGI 时代个人与企业数字大脑的地位。NotionCustomAgentsMiniMaxM2.5协同办公平台国产大模型本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/25838OpenAI 疑似收购 GPT.com 顶级域名,目前已跳转至 ChatGPT 官网
2026年3月2日 15:00
OpenAI 疑似收购 GPT.com 顶级域名,目前已跳转至 ChatGPT 官网AIbase基地发布于AI新闻资讯·1分钟阅读·Mar 2, 202610OpenAI 在品牌资产布局上再现重磅动作,近期疑似已完成对顶级域名 GPT.com 的收购,进一步强化其在生成式 AI 领域的品牌护城河。据域名追踪机构报告显示,GPT.com 目前已转移至企业级域名注册商 MarkMonitor 进行管理,并启用了 Whois 隐私保护服务。尽管官方尚未公开确认所有权更迭,但该域名目前已正式定向跳转至 ChatGPT.com 官方网站,这一路径与 OpenAI 此前收购 Chat.com 后的处置方式高度一致。追溯历史数据,GPT.com 此前长期由一家名为 Global Payment Technologies Australia 的澳大利亚公司持有,并指向其企业官网。该域名于2025年末发生注册商转移,并在近期触发了域名服务器(DNS)变更提醒。值得注意的是,OpenAI 旗下的 OpenAI.com 及此前斥巨资购入的 Chat.com 均托管于 MarkMonitor 平台,这种高度集中的资产管理模式进一步印证了本次收购行为。作为 Generative Pre-trained Transformer 的缩写,GPT已成为大模型时代的标志性技术符号。随着 OpenAI 持续通过战略性域名收购收拢流量入口,此举不仅是对品牌资产的防御性保护,更显示出其构建全生态入口、深化用户心智占领的长期战略意图。在全球 AI 竞争进入存量博弈的背景下,顶级域名的归位将助力 OpenAI 在搜索、交互与服务化转型中占据更具优势的流量高地。OpenAIGPT.comChatGPT.comAI新词本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/25837从闭源垄断到混合生态:Notion 集成 MiniMax M2.5开启高性价比 AI 办公新局
2026年3月2日 15:00
从闭源垄断到混合生态:Notion 集成 MiniMax M2.5开启高性价比 AI 办公新局AIbase基地发布于AI新闻资讯·1分钟阅读·Mar 2, 2026102026年3月2日,全球知名全能工作台 Notion 联合创始人 Akshay Kothari 宣布,其 AI 自动化工具 Notion Custom Agents 正式引入国产开源权重模型 MiniMax M2.5,并作为实验性功能向全球超1亿用户开放。这一举动标志着 MiniMax M2.5与 Claude Sonnet4.6、Opus4.6、Haiku4.5以及 GPT-5.2、GPT-5.3Codex 等国际顶尖闭源模型共同进入 Notion 的核心模型库,成为该平台模型选择列表中的重要成员。作为目前列表中唯一的开源权重模型,MiniMax M2.5的接入为 Notion 的文档、笔记及项目管理场景提供了更具经济性的算力方案。Kothari 指出,在执行简单任务时,该模型的使用成本显著低于传统闭源大模型。Notion 此番动作反映了生产力工具平台在模型集成策略上的转变,即从单一依赖顶级闭源模型,转向高性能闭源+高性价比开源的混合架构。这种趋势不仅有助于降低企业级用户的 AI 调用门槛,也预示着国产模型在国际主流生态中的协同地位进一步巩固。随着全球生产力工具市场竞争加剧,通过多元化模型配置优化任务效能与运营成本,已成为行业演进的必然路径。NotionCustomAgentsMiniMaxM2.5NotionAI自动化工具本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/25836美团光年之外首发!Tabbit AI 浏览器公测:集成全网大模型,智能代理替你完成脏活累活
2026年3月2日 12:00
美团光年之外首发!Tabbit AI 浏览器公测:集成全网大模型,智能代理替你完成脏活累活AIbase基地发布于AI新闻资讯·1分钟阅读·Mar 2, 20269浏览器不再只是看网页的窗口,正进化为全能的智能员工。2026 年 3 月 2 日,美团旗下光年之外(GN06)团队正式宣布,其首款AI 原生浏览器Tabbit开启公测。作为美团在 AGI 应用领域的重量级布局,Tabbit 旨在通过深度集成的 AI 能力,彻底重塑上班族、学生及内容创作者的数字生产力。核心亮点:从信息展示到任务执行Tabbit 最显著的特征是打破了传统浏览器地址栏、搜索框与 AI 对话框的隔阂,将其统一为**全能输入框**:智能代理 (Agent):这是 Tabbit 的杀手锏。它能根据自然语言指令自动执行复杂网页操作,如自动跨平台填写表单、数据录入、定期检查工单或进行全网深度调研并生成报告。妙招 (Skill) 与脚本 (Script):用户可将高频流程保存为妙招一键调用;脚本功能则允许用户通过自然语言定制网页风格或批量提取资源,无需编写任何代码。模型全家桶:Tabbit 并非单模态驱动,而是集成了DeepSeek、GLM、Kimi、豆包、通义千问 (Qwen)、Minimax等国内顶尖大模型的最强版本,支持用户按需切换。交互革新:像管理文件一样管理标签页针对重度网页用户,Tabbit 重新设计了交互逻辑:垂直标签与智能分组:侧边垂直排列让标题一目了然,AI 会根据主题自动归类,形成独立的工作空间。全域引用:在全能输入框中,用户可以一键@整个标签组、某张截图或本地文件,让 AI 结合这些实时上下文给出精准回答。永久收藏夹:支持全文永久保存与划词收藏,用户可通过 AI 对话直接检索收藏夹内的海量碎片信息。行业观察:AI 浏览器的下半场目前,Tabbit已在官网上线,公测期间免费且无需邀请码。业内人士指出,美团通过光年之外切入 AI 浏览器赛道,本质上是在抢占 AI 时代的流量入口。当浏览器具备了人机并行的执行能力,它就不再只是一个工具,而是一个真正懂业务、能落地的智能工作伙伴。AI原生浏览器Tabbit美团智能代理本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/25835通义实验室发布语音双模型:Fun-CosyVoice3.5与Fun-AudioGen-VD上线
2026年3月2日 12:00
通义实验室发布语音双模型:Fun-CosyVoice3.5与Fun-AudioGen-VD上线AIbase基地发布于AI新闻资讯·1分钟阅读·Mar 2, 20266今日,通义实验室宣布正式发布两款支持FreeStyle指令生成的语音大模型:Fun-CosyVoice3.5与Fun-AudioGen-VD。此次发布标志着语音生成技术从依赖预设标签的传统范式,向基于自然语言指令自由控制的新范式跨越,实现了一句话自由生成语音的深度交互体验。在技术架构与功能升级方面,Fun-CosyVoice3.5侧重于多语种复刻与精细化表达,新增泰语、印尼语等4个语种支持。通过引入DiffRO与GRPO强化学习技术,该模型显著提升了语音的韵律表现与音质相似度,其生僻字读错率从15.2%大幅降至5.3%,首包延迟亦降低了35%。与之互补的Fun-AudioGen-VD则专注于声音设计与场景化建模,支持通过指令精确控制性别、情绪及空间声学效果,能够模拟从疯狂反派到热闹咖啡馆等复杂的角色与背景音一体化场景。从行业趋势来看,通义实验室这一动作将语音生成从单纯的转换工具升级为创作工具。这种可描述、可编排的数字表达能力,将直接赋能影视、游戏及AI智能体等领域,在降低内容创作成本的同时,极大拓展了人机交互的语义丰富度。API调用:https://help.aliyun.com/zh/model-studio/text-to-speech?spm=a2c4g.11186623.help-menu-2400256.d_0_3_2_0.d5536a31V2tEJP文档:https://help.aliyun.com/zh/model-studio/cosyvoice-clone-api?spm=a2c4g.11186623.help-menu-search-2400256.d_2FreeStyle通义实验室Fun-CosyVoice3.5Fun-AudioGen-VD本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/25834