移动端背景

"如果你不冒险去做你害怕的事情,你就永远不会成功。"

——埃隆·马斯克

前字节跳动视觉模型负责人潘欣加盟美团,主导多模态 AI 创新
2025年12月11日 09:00

前字节跳动视觉模型负责人潘欣加盟美团,主导多模态 AI 创新AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 11, 20252据智能涌现消息,外卖巨头美团在 AI 战略上迈出了重要一步,前字节跳动视觉模型 AI 平台负责人潘欣正式加入公司,负责多模态 AI 的创新工作。这一人事变动被业内广泛关注,标志着美团在竞争日益激烈的外卖市场中,正致力于提升 AI 技术的基础设施建设。潘欣在人工智能领域拥有丰富的经验,曾任谷歌大脑的研究员,参与了 TensorFlow 动态图模式的开发。在回国后,他在百度、腾讯及字节跳动等科技巨头中历任重要职务,负责多模态领域的 AI 平台建设,积累了深厚的技术积累。入职美团后,他将主导 LongCat App 等多项与多模态 AI 相关的应用开发。在2025年的美团战略中,AI 被视为提升核心竞争力的关键。创始人王兴曾表示,美团在 AI 技术上的战略定位是积极进攻而非消极防御。美团的 AI 战略主要包括三个方面:将 AI 应用于员工工作和运营中,利用 AI 改造现有产品和服务,以及大力投入自研的大语言模型(LLM)建设。然而,自2025年第二季度起,外卖市场竞争愈演愈烈,美团在 AI 基础模型的训练方面投入了更多资源,招聘了大量来自阿里、腾讯等大厂的 AI 人才。尽管面临外部压力,美团在 AI 技术研发的积极性并未减弱,招聘标准仍然保持较高水平。从2025年年初至今,美团已陆续推出多款 AI 基础模型和应用,包括 AI 编程产品 Nocode、大语言模型 LongCat-Flash-Chat、视频生成模型 LongCat-Video 等。这一系列产品的发布,展示了美团在 AI 技术上从语言模型向视觉、音频、视频等全模态的全面布局。在 AI 应用方面,美团也在加速向主营业务的转型。近期推出的 袋鼠参谋、智能掌柜 等 AI 工具,旨在为餐饮商家提供免费服务,助力其业务提升。这些措施不仅反映了美团对 AI 技术的重视,也显示了其在市场竞争中的灵活应对策略。AI新词美团多模态AILongCatApp本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23564

阿里通义推出新型强化学习方法 SAPO,让大语言模型更稳更强
2025年12月10日 18:00

阿里通义推出新型强化学习方法 SAPO,让大语言模型更稳更强AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 10, 20252在大语言模型(LLM)发展的浪潮中,阿里通义 Qwen 团队近日推出了一种创新的强化学习方法 Soft Adaptive Policy Optimization(SAPO)。这一方法的核心目标是解决当前大语言模型在强化学习中面临的策略优化不稳定性问题。传统的强化学习方法,如 GRPO 和 GSPO,采用硬剪切技术来控制重要性比率的范围,确保更新过程中的稳定性。然而,这种方式有其固有的缺陷。首先,过于严格的剪切往往导致有效学习信号的丢失,尤其是在 GSPO 中,一旦某些 token 表现不佳,整个序列的梯度可能会被舍弃。其次,调整剪切范围非常棘手:若范围过小,许多样本可能无法贡献梯度;若范围过大,则会引入噪声,反而损害学习的稳定性。这些问题在大规模混合专家模型(MoE)中尤为显著。针对这些挑战,Qwen 团队提出了 SAPO,这是一种新型的强化学习方法,旨在提升大语言模型的学习稳定性和性能。SAPO 采用了一种平滑的、温度控制的门控函数来替代传统的硬剪切,从而在保持稳定性的同时,保留更多的有效梯度。其独特设计包括:1.  连续信任域 :避免了硬剪切带来的不连续性问题。2.  序列级一致性 :确保不丢弃整段序列,保留更多的信息。3. token 级自适应性 :减弱异常 token 对整体学习的影响。此外,SAPO 在处理正负 token 时采用非对称的温度设计,使其对不同类型的 token 进行差异化处理,这进一步增强了学习的效果。经过实验证明,SAPO 在多个规模的 dense 和 MoE 模型上均展现出显著的提升。为验证这一新方法的有效性,Qwen 团队对其进行了全面评估。在数学推理、代码生成、逻辑推理和多模态数学推理等任务上,SAPO 的表现明显优于传统方法 GRPO 和 GSPO。这一突破不仅标志着阿里通义在大语言模型领域的技术创新,也为未来的 AI 研究开辟了新的方向。论文地址:https://arxiv.org/abs/2511.20347AI新词SoftAdaptivePolicyOptimization大语言模型阿里通义Qwen本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23563

谷歌在印度推出 AI Plus 订阅服务,月费仅需399卢比
2025年12月10日 18:00

谷歌在印度推出 AI Plus 订阅服务,月费仅需399卢比AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 10, 20256谷歌近日在印度推出了 AI Plus 订阅服务,旨在为用户提供更广泛的 AI 模型和工具的访问权限。用户可以通过 Gemini 应用以及谷歌的各项服务,体验到最新的 AI 技术。谷歌产品负责人 Vikas Kansal 在博客中表示:我们很高兴看到印度用户以多种方式使用我们的 AI 工具,我们希望让更多人受益于这些技术的进步。AI Plus 订阅计划的亮点在于用户可以获得对最新的 Gemini3Pro 模型的访问权限,同时还包括图像生成与编辑系统 Nano Banana Pro。用户不仅能够在 Gemini 应用中生成视频,还可以使用如 Flow 等创意工具。此外,Gemini 将与 Gmail、Docs 等谷歌应用进行集成。订阅用户将获得200GB 的云存储空间,可以在 Photos、Drive 和 Gmail 等服务中使用,同时可与最多五位家庭成员共享该计划。该服务的月费为399,而新用户在前六个月内可享受特价,仅需199。此次推出恰逢全球 AI 公司在印度扩展业务的时机。近期,OpenAI 也在印度推出了 ChatGPT Go 计划,为期一年免费提供其最新的模型和图像及文件分析工具。谷歌早前与 Jio 达成合作,为5G 用户提供18个月的 Gemini Pro 免费访问权,同时提高图像和视频生成的上限,并提供2TB 的云存储。划重点: 新推出的 AI Plus 订阅服务,用户可访问最新的 AI 模型 Gemini3Pro 和 Nano Banana Pro。 每月费用399,首六个月新用户特价199,享有200GB 云存储。 此服务旨在推动谷歌 AI 工具在印度的更广泛应用。AIPlusGemini3ProNanoBananaPro谷歌本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23562

23天狂飙3000万月活!阿里通义千问直接免费放大招,PPT、写作、文库、讲题全线免费用
2025年12月10日 18:00

23天狂飙3000万月活!阿里通义千问直接免费放大招,PPT、写作、文库、讲题全线免费用AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 10, 202525刚刚,阿里通义千问官宣:公测仅23天,月活跃用户已突破3000万!这一数字不仅刷新了国内大模型最快增长纪录,更在宣布当天直接祭出核弹级大招将最受好评的四大生产力功能:AI PPT、AI写作、AI文库、AI讲题全部永久免费开放,零门槛、无次数限制,彻底引爆全网。3000万用户投票:大家要的不是会聊天的AI,而是能办事的生产力神器从11月17日公测到12月9日,通义千问用23天完成了行业需要半年甚至一年才能达到的用户体量。这背后,是用户用脚投票的明确信号:大家已经厌倦了只会讲段子、生成表情包的玩具AI,真正渴望的是能一键搞定PPT、改论文、批作业、找资料的超级助理。通义千问精准抓住了这一需求窗口期,用最顶级的模型能力直接把办公+教育这两个最高频刚需场景打穿。AI PPT:一句话到成品PPT,全程对话式修改,彻底告别复制粘贴传统流程:AI生成内容 手动复制到PowerPoint 反复调整排版 崩溃。通义千问AI PPT的打法是:一句话、一张图、一份文档丢进去,直接在聊天框里生成完整PPT,还能用自然语言继续对话修改把第三页换成极简风加上南极企鹅的动态图把字体调大两号改完直接导出成品。实测10秒做出30页《南极极光旅行计划》PPT,配色、动画、排版全部自动高级感拉满。AI讲题:比99%的家教老师还会教,真·学习闭环拍照上传一道数学题,通义千问不只会甩答案,而是像顶尖老师一样:- 先标重点考点和易错点- 逐行拆解解题思路- 举一反三出3道同类型变式- 整页作业批改完成后,自动生成薄弱知识点诊断报告+错题深度讲解家长直呼:这不香了,学生直呼作业不写了。AI文库:5亿份资料免费下,智能挂载再也不用爬墙找资源覆盖教育、职场、创作、生活全场景的5亿级资料库全部免费开放。上传需求后,系统自动判断类型:- 试卷、课件直接挂下载卡片- 行业报告、企划方案先给出关键摘要,再附完整文档- 论文模板、合同范本几十万份直接套用再也不用在各种资源群和小程序里东拼西凑。AI写作:对话即成稿,智能排版Word直接导出不需要再打开Office,直接在聊天框里说:帮我写一篇5000字人工智能伦理毕业论文,引用不少于30篇,芝加哥格式几分钟后,直接下载带目录、参考文献、完美排版的Word文档。还能继续说把第三章润色得更学术把整篇改成知乎体,瞬间秒出新版本。阿里真正的野心:把通义千问打造成AI时代的超级入口这波免费四连,直接把竞争对手甩开几个身位。通义千问的策略非常清晰:1. 用最强模型(Qwen-Max已多次登顶全球多个榜单)做底座2. 把最高频的生产力场景做到极致好用3. 全部免费,迅速占领用户心智和每日使用时长4. 等用户习惯养成后,自然成为流量和商业化的超级入口正如业内人士评价:ChatGPT让大家知道了AI能聊天,通义千问正在让所有人相信AI真的可以取代一半的办公软件和教辅资料。3000万只是开始。当打开千问变成和打开微信一样自然的行为时,属于中国大模型的反击战,才真正打响。AI新词通义千问生产力功能AIPPT本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23560

具身智能抢C位!宇树、智元上演春晚天价竞标战,智元回应不是真的
2025年12月10日 18:00

具身智能抢C位!宇树、智元上演春晚天价竞标战,智元回应不是真的AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 10, 202517继宇树机器人在2025年蛇年春晚以扭秧歌的精彩表演引发全年具身智能热潮之后,中央电视台2026年马年春晚的赞助商资格,已成为具身智能公司激烈竞逐的高地。据多位知情人士透露,今年有多家机器人公司参与竞标,按照春晚惯例,同一品类内多家公司打破头挤翻天争抢赞助席位,最终的成败不仅取决于赞助金额,还需要综合考量品牌形象和公司发展等因素。目前的竞争焦点集中在智元机器人和宇树科技之间,竞争态势尤为激烈。报道指出,为了争夺最大赞助商的权益,智元机器人率先开出了6000万元的报价,随后宇树科技直接将报价拉升至惊人的1亿元。这一天价已让不少具身智能公司望而却步,有业内人士坦言,在听到头部两家的报价后,认为太过吓人,只能选择退出竞争。对此,界面新闻向智元机器人方面求证,对方回应称不是真的,而宇树方面暂无公开表态。截至目前,尽管报价传言已高达亿元级别,多位消息人士仍透露,多家公司仍在争抢,谁是最终的头号玩家还没有定下来,还在争,这场具身智能头部企业间的春晚赞助商之战仍悬而未决。具身智能宇树科技智元机器人春晚赞助本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23559

自由软件之父 RMS:别把 ChatGPT 当 智能,它只是个 胡说八道生成器
2025年12月10日 18:00

自由软件之父 RMS:别把 ChatGPT 当 智能,它只是个 胡说八道生成器AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 10, 202521自由软件之父、GNU 计划创始人理查德斯托曼(Richard Stallman,简称 RMS)最近在个人网站上发布了一篇引人注目的文章,题为《Reasons not to use ChatGPT》。在这篇文章中,他明确表达了对当前热门的人工智能聊天工具 ChatGPT 的强烈反对意见。斯托曼开篇指出,ChatGPT 并不是真正的 智能,因此不应该被称为 人工智能。他将 智能 定义为能够在某一领域内认知、理解和掌握知识的能力,而 ChatGPT 完全缺乏这种能力。斯托曼认为,这个工具无法理解自己的输出内容,它的生成过程更像是在随机拼凑文字,而非有意识的思考。这让他称之为 胡说八道生成器,因为它所产生的内容常常与事实无关,且完全无视真实。图源备注:图片由AI生成,图片授权服务商Midjourney除了对 ChatGPT 的智能性表示质疑,斯托曼还指出,使用这个工具还意味着用户在计算自由方面的损失。他强调,ChatGPT 是一款私有软件,运行在云端服务器上,用户根本无法获得它的源代码或执行文件。这样的使用方式使得用户在与服务器的互动中,完全失去了对自己计算过程的掌控。他认为,通过依赖其他人的服务器进行计算,本质上是在削弱自己的计算自由。在这篇文章中,斯托曼呼吁公众要对这些 生成式系统 保持警惕。他强调,很多人对这些工具的误解,导致了不必要的信任。他希望大家能够传播这个重要信息:不应相信那些仅仅是文字游戏的系统,因为它们对语言含义的理解是极为有限和错误的。斯托曼的观点为我们提供了一个新的视角,让我们重新审视当前科技发展的方向,尤其是在人工智能领域的应用与影响。自由软件GNU计划ChatGPT人工智能本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23558

Pebble 创始人推出售价 75 美元的 AI 智能戒指,轻松记录灵感与提醒
2025年12月10日 15:00

Pebble 创始人推出售价 75 美元的 AI 智能戒指,轻松记录灵感与提醒AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 10, 202523.6k最近,Pebble 智能手表的创始人埃里克米吉科夫斯基(Eric Migicovsky)宣布了一款新产品 AI 智能戒指 Index01。这款售价75美元的戒指专为食指设计,旨在提供一种便捷的方式,帮助用户通过按压戒指侧面的按钮来快速记录备忘和灵感,而不是与那些始终在线的 AI 设备竞争。这款戒指的 AI 功能依托于运行在用户手机上的开源语音转文本模型。用户必须按住戒指的按钮才能开始录音,这意味着不能在不被注意的情况下悄悄录制对话。此外,该戒指具有一定的防水性能,能够在淋浴、洗手和下雨时佩戴,但不适合游泳。与市场上其他智能设备不同,Index01并非健身追踪器,也不具备心率监测等健康功能。米吉科夫斯基强调,这款戒指是为了解决记忆问题而设计的外部存储器。他表示,许多创意和灵感如果不及时记录下来,很快就会被遗忘。该戒指的电池续航能力令人惊叹,据称可以使用数年。用户可以录制最长五分钟的音频,并将其保存在戒指中,之后再同步到手机。戒指还支持超过100种语言,并具有一定的本地存储,便于在蓝牙范围外时使用。米吉科夫斯基同时透露,戒指的按钮是可编程的,用户可以通过不同的按压组合自定义其功能,例如播放音乐或控制手机相机。此外,Index01还与 Pebble 的移动应用程序兼容,提供便捷的笔记和提醒功能。如今,米吉科夫斯基重新启动 Pebble 项目,他的目标是从盈利出发,打造一款可持续发展的产品。此次推出的 Index01戒指已经开始预售,并将在2026年3月之后涨价。戒指可选择银色、抛光金色和哑光黑色,并提供多种尺码供消费者选择。划重点: 埃里克米吉科夫斯基推出的 AI 智能戒指 Index01售价75美元,专为快速记录灵感设计。 戒指采用开源语音转文本技术,确保用户隐私且无需订阅服务。 电池续航长达数年,支持超过100种语言,功能可自定义,适配多种应用。AI智能戒指Index01埃里克米吉科夫斯基开源语音转文本模型本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23557

马斯克的 xAI 推出新工具,可在电影中实时植入 AI 广告
2025年12月10日 15:00

马斯克的 xAI 推出新工具,可在电影中实时植入 AI 广告AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 10, 20255近日,马斯克创办的人工智能公司 xAI 宣布推出一款名为 Halftime 的新工具,该工具能够将 AI 生成的产品植入到观众正在观看的电影和电视剧中。这项技术的目标是使广告看起来像是故事的一部分,而非单纯的插播广告。在 xAI 的介绍中,Halftime 能够实时生成与观众兴趣匹配的广告场景。比如,在一段《金装律师》的片段中,剧中角色哈维斯佩克特突然停下对话,手中高举着一罐 AI 生成的可乐,向镜头展示。在《老友记》中,角色乔伊也会在镜头前面带上新款的 Beats 耳机,这种植入方式显然打破了时间和情节的界限。在观看时,观众可以点击屏幕上的 了解更多 按钮,直接链接到产品页面。退出后,AI 生成的广告就会在观众的记忆中消失,仿佛什么都没发生过。虽然这一技术是由一组来自滑铁卢大学的学生在 xAI 的黑客松活动中开发的,但其潜在的影响引发了广泛的讨论。此工具的推出引发了不少争议,许多网友对这一创新表示担忧,认为这会破坏电影艺术的完整性。有网友发文调侃,认为这种广告植入方式反而让观众更难以沉浸在剧情中,认为这与经典电影和文学中的反乌托邦情节相似。尽管此技术的应用前景不明,尤其是在版权问题上可能会面临巨大的法律挑战,但 xAI 表示这一技术仍在持续探索中。我们将拭目以待,这一工具是否会真的在未来的影视作品中实现。划重点: Halftime 是一款可以实时将 AI 生成的广告植入到电影和电视剧中的工具。 该工具可以在角色对话中打断并展示产品,力求让广告看起来像剧情的一部分。 引发的争议让人们担忧这一技术可能会影响电影艺术的完整性。AI新词HalftimexAIBeats本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23556

一张图秒变AI风格神器!Qwen-Image-i2L颠覆图像生成,零门槛LoRA训练来袭
2025年12月10日 15:00

一张图秒变AI风格神器!Qwen-Image-i2L颠覆图像生成,零门槛LoRA训练来袭AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 10, 20257在AI图像生成领域,一项革命性技术新鲜出炉:Qwen-Image-i2L。这款由阿里通义实验室推出的开源工具,能将任意单张图片瞬间转化为可微调的LoRA(Low-Rank Adaptation)模型,极大降低了个性化风格迁移的门槛。无需海量数据集或昂贵计算资源,用户只需上传一张图片,即可生成轻量级LoRA模块,并无缝集成到其他生成模型中,实现高效的单图风格迁移。这一创新迅速在AI社区引发热议,被誉为AI艺术生产的最后一步飞跃。核心创新:从单图到LoRA,一键解锁个性化生成Qwen-Image-i2L的核心在于其独特的图像分解机制。它采用SigLIP2、DINOv3和Qwen-VL等多模态特征提取体系,将输入图片智能拆解为风格、内容、构图、色调等核心视觉元素。这些可学习特征随后被高效压缩,形成一个体积小巧的LoRA模块平均仅需数GB空间,却能捕捉图片的精髓。想象一下:你提供一张印象派油画,系统自动提取其柔和笔触和暖色调;或上传一位艺术家的肖像,瞬间生成人物风格LoRA。生成的模块可直接加载到Stable Diffusion或其他扩散模型中,用于后续生成任务。这不仅简化了传统训练流程(以往需20+张图片和GPU集群),还实现了一键学习,让AI艺术创作从专业门槛转向大众娱乐。社区反馈显示,这一功能特别适用于快速原型设计和风格实验。开源发布后,开发者已开始探索其在产品可视化和数字艺术中的应用,预计将加速AI工具的商业落地。四款模型变体,精准适配多元场景为满足不同需求,Qwen-Image-i2L提供了四种专属模型风格,每个变体针对特定用途优化:- 风格模式(2.4B参数):专注纯美学提取,理想用于艺术画风迁移,如将水彩风格注入新图像。- 粗粒度模式(7.9B参数):综合捕捉内容与风格,适合整体场景重构,例如建筑或景观的快速变体生成。- 精细模式(7.6B参数):支持1024x1024高分辨率细节增强,常与粗粒度模式搭配,提升纹理和边缘精度。- 偏见模式(30M参数):确保输出与Qwen-Image原生风格一致,避免偏差,适用于需要品牌统一性的企业级应用。这些变体均基于Apache2.0许可开源,用户可在Hugging Face或ModelScope平台免费下载。测试显示,在复杂文本渲染和语义编辑基准上,Qwen-Image-i2L超越多数开源竞品,与闭源模型不相上下。技术底蕴与潜在挑战:高效却需警惕过拟合Qwen-Image-i2L的强大源于其多模态基础模型Qwen-Image(20B参数MMDiT架构),该模型已在GenEval、DPG等基准中脱颖而出,尤其在中英双语文本渲染上领先行业。结合FlowMatchEuler调度器,它支持高效推理,平均生成时间缩短至数秒。然而,正如社区讨论所指出的,这一单图学习虽革命性,但也面临挑战:从单一2D图像提炼复杂3D逻辑可能导致过拟合,输出在多样化场景中稳定性待优化。开发者建议结合多步蒸馏或辅助数据集,进一步提升鲁棒性。展望未来:AI个性化时代的加速器Qwen-Image-i2L的问世标志着AI图像工具从通用生成向即时定制转型。它不仅赋能创作者,还为电商、游戏和影视行业注入新活力。未来,随着生态扩展,这一工具或将催生更多一键创新应用,推动开源AI向更普惠方向演进。模型下载地址:https://modelscope.cn/models/DiffSynth-Studio/Qwen-Image-i2L/summaryAI新词Qwen-Image-i2LLoRA阿里通义实验室本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23555

马斯克旗下的 xAI 推出新工具,电影场景中可植入 AI 生成广告
2025年12月10日 15:00

马斯克旗下的 xAI 推出新工具,电影场景中可植入 AI 生成广告AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 10, 20259近期,埃隆马斯克的人工智能公司 xAI 宣布推出一款名为 Halftime 的新工具,旨在将 AI 生成的产品植入广告巧妙地融入观众正在观看的电影和电视剧中。与传统的广告插播不同,Halftime 可以实时调整场景中的角色,令其不再按照原脚本进行对话,而是主动展示某个品牌的产品。在 xAI 的一段演示视频中,我们可以看到在《律政英雄》中,角色哈维斯佩克特突然停下话语,举起一罐 AI 生成的可口可乐向镜头展示。而在经典情景喜剧《老友记》中,乔伊则是拿起一副全新的 Beats 耳机,脸上洋溢着笑容,这种情况显然与该剧在90年代首播的时间设定不符。观众在看到这些产品广告时,可以通过屏幕上的 了解更多 按钮直接跳转到产品页面。等观众查看完毕,AI 生成的广告便会像一场噩梦般消失,节目也会回归正常。Halftime 并非由 xAI 直接开发,而是由一组三位滑铁卢大学的学生在公司近期的黑客马拉松中创作而成。其共同创作者克里什戈尔格在 LinkedIn 上表示,他通过制作 隐形广告 赢得了此次活动。该技术的推出引发了广泛的关注和争议,许多人担心这种技术可能会对影视行业造成影响。部分网友对此表示强烈反对,甚至在社交媒体上发文要求 烧掉一切。电影评论家罗杰艾伯特曾形容电影是一种 同情机器,而这种新技术却可能将其变为 AI 产品广告机器。尽管 Halftime 引起了激烈的讨论,但目前尚不清楚这项技术是否会实际应用于影视作品中,尤其是考虑到其可能引发的版权问题。划重点: xAI 推出名为 Halftime 的新工具,能在电影和电视剧中植入 AI 生成的广告。 演示中,角色会突然展示品牌产品,与原剧情无缝衔接。 该技术引发广泛争议,观众对未来影视作品的影响表示担忧。AI新词HalftimexAI品牌产品词本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23554

亚马逊 Alexa + 新升级:打造智能购物助手,提升用户体验
2025年12月10日 15:00

亚马逊 Alexa + 新升级:打造智能购物助手,提升用户体验AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 10, 202510亚马逊近期宣布,其语音助手 Alexa + 在美国和加拿大市场推出了一系列新的购物功能,旨在提升用户的购物体验。此次升级将亚马逊的 Echo 智能音箱屏幕转变为一个集购物、订单追踪和推荐于一体的中心。新的 购物必需品 界面将应用于带屏幕的 Echo 设备,如 Echo Show15和21。用户可以通过这个仪表板实时追踪包裹的送达状态,查看最近的订单信息,以及获得关于家庭必需品的补货提醒。此外,用户还可以轻松访问购物清单和保存的商品。为了使用这一新功能,用户只需对 Alexa 说 我的东西在哪里? 或 打开购物必需品。未来,亚马逊还将在 Echo 设备的主屏幕上推出一个购物小部件,进一步便利用户的购物操作。另一个引人注目的功能是,Alexa 设备用户可以在包裹离开仓库之前,随时向即将发出的订单中添加商品。这一功能与亚马逊的零售网站和应用程序中最近推出的类似,尽管之前在 Alexa 设备上尚未上线。此外,Alexa + 还新增了礼物推荐功能。用户可以描述他们的购物对象或场合,Alexa + 会在屏幕上展示分类的产品建议,帮助用户挑选合适的礼物。亚马逊表示,Alexa + 目前已向 数千万 客户开放,新的购物功能也已在美国和加拿大上线。尽管部分用户对 Alexa + 表示不满,但公司指出,选择恢复至没有 AI 界面的用户比例仍然维持在 非常低的单数百分比 中。划重点: 亚马逊为 Alexa + 推出新购物功能,增强购物体验。 用户可以实时追踪订单和补货提醒,操作更便捷。 Alexa + 新增礼物推荐功能,助力用户选择合适商品。Alexa亚马逊Echo购物功能本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23553

Mistral 发布 Devstral2 开源编程模型:1230 亿参数,成本仅 Claude Sonnet 1/7
2025年12月10日 15:00

Mistral 发布 Devstral2 开源编程模型:1230 亿参数,成本仅 Claude Sonnet 1/7AIbase基地发布于AI新闻资讯·1分钟阅读·Dec 10, 20254Mistral AI 正式推出第二代开源编码模型家族:Devstral2(1230亿参数旗舰版)与 Devstral Small2(240亿参数轻量版)。旗舰模型在 SWE-Bench Verified 基准拿下72.2% 得分,刷新开源类别最佳成绩;官方宣称「成本效益比 Claude Sonnet 低7倍」,并同步开源 CLI 工具 Mistral Vibe,支持自然语言批量改代码。两款模型已上线 API,Devstral2每百万输入 token0.40美元,轻量版 完全免费 。模型速览:一大一小,开源双轨性能突破:72.2% 刷新开源代码模型纪录- SWE-Bench Verified:Devstral2得分72.2%,超越 CodeLlama-70B(53.8%)、DeepSeek-Coder-33B(61.4%),距离 GPT-4-Turbo(73.2%)仅1pp- HumanEval:84.1% Pass@1,领先同类开源模型6-8pp- 成本:官方称「比 Claude Sonnet 便宜7倍」;0.4$/M in 约为 GPT-4-Turbo 的1/5开源工具:Mistral Vibe 自然语言批量改代码- 功能:一句「把函数改为异步」可自动重写整个仓库,支持 diff 预览与回滚- 引擎:本地调用 Devstral Small2(Apache2.0),无需联网即可跑- 集成:VS Code 插件已上架,支持一键修复 ESLint 错误或添加单测商业策略:轻量免费+旗舰 API,分层收割- Devstral Small2:Apache2.0,可商用、可微调、可嵌入- Devstral2:修改 MIT,月营收>2000万美元需购买商业许可或走官方 API,避免「大厂白嫖」- API 定价:输入0.4$/M、输出1.2$/M;前30天免费额度100万 token行业信号:开源编码模型进入「70+ 俱乐部」-2024年主流开源代码模型 SWE-Bench 普遍50-60%;Devstral2直接把门槛拉到72%+- 低成本+高分数,将冲击 GitHub Copilot、Cursor 等付费插件的性价比- 轻量版完全免费,有望加速「本地 AI 编码助手」普及,开发者 RTX4090即可跑24B 模型下一步:2025路线图- Q1:发布 Devstral2-INT4量化版,单 A100即可跑;推出 Jetson Orin 边缘部署包- Q2:开放128k 上下文版本,支持整个代码库+文档作为 prompt- Q3:上线「Vibe Cloud」浏览器内自然语言重构整包代码,按项目计费编辑结语当「代码生成」卷到70+ 分,胜负手从「模型能力」转向「成本与合规」。Devstral2用0.4美元百万 token 把价格打到骨折,再通过「修改 MIT」堵住大厂免费商用漏洞;轻量版则彻底开源,抢占本地部署心智。对于开发者而言,「免费24B + 低价1230B」组合意味着:本地写代码、云端跑重活,无需再为 Copilot 订阅买单。AIbase 将持续跟踪其量化版本与128k 长下文发布。MistralAIDevstral2DevstralSmall2开源编码模型本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -

信息源:AIBase 来源:https://www.aibase.com/zh/news/23552