Akamai 利用 AI 技术和 Kubernetes 平台实现云成本节省 70%
2025年6月17日 18:02
Akamai 利用 AI 技术和 Kubernetes 平台实现云成本节省 70%AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 17, 202519.0k在当前的数字时代,云计算的开销持续高企,企业在计算资源的使用效率上普遍存在浪费。根据最新统计,预计今年企业在不必要的云开销上将浪费高达445亿美元。Akamai Technologies 作为一家大型的网络安全和内容交付服务提供商,面临着复杂的多云基础设施以及严格的安全合规要求,因此需要寻找有效的解决方案来优化云成本。图源备注:图片由AI生成,图片授权服务商Midjourney为此,Akamai 引入了 Kubernetes 自动化平台 Cast AI,借助其 AI 代理,Akamai 能够实时优化其云环境中的成本、安全性和速度。经过实施,Akamai 成功减少了40% 到70% 的云开支,具体取决于工作负载。Akamai 的云工程高级总监 Dekel Shavit 表示,优化基础设施和降低云成本的持续方法至关重要,尤其是在他们处理安全事件时,延迟不可接受。他们需要一种能够在多个云环境中实时优化核心基础设施的解决方案,以应对不断变化的需求,同时不影响应用性能。在 Cast AI 的帮助下,Akamai 的 DevOps 团队不再需要每月手动调节 Kubernetes 工作负载,数以百计的 Cast 代理能够每秒钟进行自动优化。这一过程显著提高了云资源的使用效率,确保企业在面对突发的流量高峰时能够灵活应对。此外,Cast AI 的核心功能包括自动扩展、深入的 Kubernetes 自动化、自动选择最具性价比的计算实例,以及工作负载的合理化等。Akamai 在两分钟内便获得了清晰的成本分析,这在之前是无法实现的。通过使用 Spot 实例,Akamai 不仅降低了成本,还提升了操作效率,得以专注于为客户提供更快速的服务。Shavit 强调,最大的收获是 Akamai 的团队不再需要管理基础设施,Cast AI 的代理自动完成了这一任务,从而让团队可以专注于开发新功能,提高产品交付速度。划重点: Akamai 通过引入 Cast AI,成功节省了40% 到70% 的云开销。 Cast AI 的自动化技术让 Akamai 的 DevOps 团队实现了每秒的实时优化。 Akamai 的团队因此腾出了时间,专注于为客户推出更快的功能和服务。云计算AkamaiKubernetesCastAI本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19020硅基流动上线全球首个开源大规模混合注意力推理模型 MiniMax-M1-80k
2025年6月17日 18:02
硅基流动上线全球首个开源大规模混合注意力推理模型 MiniMax-M1-80kAIbase基地发布于AI新闻资讯·1分钟阅读·Jun 17, 202547硅基流动(SiliconCloud)正式上线了全球首个开源的大规模混合注意力推理模型 MiniMax-M1-80k(456B)。这一创新模型旨在为软件工程、长上下文理解和工具使用等复杂任务提供强有力的支持,并且在性能上可与目前顶尖的模型如 o3和 Claude4Opus 相媲美。据悉,MiniMax-M1-80k 具备最大支持128K 的上下文长度,这为处理长文本提供了极大的便利。对于有特殊需求的用户,平台还提供了后台支持,满足1M 的长上下文需求。使用该模型的价格为输入 ¥4每百万 Tokens,输出则为 ¥16每百万 Tokens。新用户在首次使用时还能享受到14元的体验赠金。MiniMax-M1-80k 模型的研发基于 MiniMax-Text-01,采用了混合专家系统(MoE)架构和 Lightning Attention 机制,具备高效的强化学习扩展框架。这一设计使得模型不仅适用于传统的数学推理任务,还能够在真实的沙盒软件开发环境中发挥作用。因此,它成为了需要长文本处理与深度思考任务的理想选择。在性能方面,MiniMax 的基准测试显示,该模型在生成10万 Tokens 时,FLOPs 消耗仅为 DeepSeek R1的25%,这意味着其推理算力的高效扩展。同时,MiniMax-M1-80k 在数学、编程、工具使用及长上下文理解等领域的评测结果都与 o3等顶尖模型不相上下。SiliconCloud 作为一站式的大模型云服务平台,致力于为开发者提供优质的服务。除了 MiniMax-M1-80k,平台上还推出了多款优秀的模型,包括 DeepSeek-R1-0528、Qwen3、GLM-4系列等,极大丰富了开发者的选择。特别是 DeepSeek-R1的蒸馏版及其他多款模型均可免费使用,助力开发者实现 Token 自由。如需体验新上线的 MiniMax-M1-80k,用户可通过 SiliconCloud 官方网站进行在线体验和接入,进一步推动生成式 AI 的应用发展。在线体验https://cloud.siliconflow.cn/models第三方应用接入教程https://docs.siliconflow.cn/cn/usercases/AI新词MiniMax-M1-80kSiliconCloudo3本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19015前谷歌 CEO 投资的初创公司发布240亿参数化学推理模型,准确率超越多种领先模型
2025年6月17日 18:02
前谷歌 CEO 投资的初创公司发布240亿参数化学推理模型,准确率超越多种领先模型AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 17, 202536在人工智能领域,大模型的研究不断进展,尤其是在推理能力的提升上。最近,由前谷歌 CEO 埃里克施密特投资的初创公司 FutureHouse,开源了一个名为 ether0的化学任务推理模型,参数规模高达240亿。这一模型在不需要额外领域预训练的情况下,通过后训练技术,展现出强大的化学领域能力,尤其是在数据需求上相比于传统领域专用模型显著减少。推理模型的应用不仅限于简单的选择题测试,FutureHouse 团队希望通过 ether0改变这种现状,推动科学推理的深入研究。为了构建该模型,研究团队从大量的学术论文中整理了化学实验数据,追踪分子特性如溶解度和气味,并将这些数据转化为可验证的科学问题。ether0基于 Mistral-Small-24B 架构,利用强化学习进行训练,并处理了640,730个实验数据相关的化学问题,涵盖18类任务,包括合成可行性、血脑屏障渗透性和气味分析等。为了提升模型性能,研究团队引入了推理行为蒸馏和动态课程学习等技术。在性能评估方面,ether0与多种通用大语言模型(如 Claude、o1)及化学专用模型(如 ChemDFM、TxGemma)进行了对比。结果显示,ether0在开放答案(OA)类别中准确率最高,选择题(MCQ)方面也具备强大的竞争力。其在某些任务上的准确率甚至达到了竞争对手的两倍以上。此外,ether0在训练成本上也展现出显著的优势,要达到相似的反应预测准确率,传统的非推理型模型需要消耗50倍以上的数据。尽管 ether0在独立基准测试中难以与其他模型及人类表现进行交叉验证,但其能够对未经过训练的分子结构进行有效推理。总之,ether0不仅能理解自然语言提问,还能通过自然语言进行推理,最终生成分子结构,特别擅长于类药分子的设计。尽管目前仍处于原型阶段,但其已为未来构建通用科学推理模型奠定了坚实的基础。划重点: Ether0是由 FutureHouse 开源的240亿参数化学推理模型。 该模型的准确率在多个任务中超越了 GPT-4.1和 DeepSeek-R1等领先模型。 训练 ether0所需的数据量显著低于传统非推理型模型。大模型ether0FutureHouse科学推理本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19006月之暗面发布全新开源模型 Kimi-Dev-72B,打破编程基准记录
2025年6月17日 18:02
月之暗面发布全新开源模型 Kimi-Dev-72B,打破编程基准记录AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 17, 202589月之暗面(Moonshot AI)宣布推出其新开源模型 Kimi-Dev-72B,这一模型专注于软件工程任务,并在 AI 编程基准测试 SWE-bench Verified 中创下了全球最高的开源模型成绩。Kimi-Dev-72B 以仅72亿参数量的设计,成功超越了刚发布不久的 DeepSeek-R1,后者的参数量高达671亿。在 SWE-bench Verified 测试中,Kimi-Dev-72B 获得了60.4% 的高分,成为当前开源模型中的新标杆。该模型的优化过程包括大规模强化学习,使其能够自动修复 Docker 环境中的真实存储库。Kimi-Dev-72B 在测试中仅在所有测试用例通过后才能获得奖励,从而确保所生成解决方案的正确性和稳健性,符合现实开发的高标准。Kimi-Dev-72B 目前已在 Hugging Face 和 GitHub 平台上开放下载,用户可获取模型权重、源代码,技术报告也即将发布。Hugging Face 链接为:huggingface.co/moonshotai/Kimi-Dev-72B,GitHub 链接为:github.com/MoonshotAI/Kimi-Dev。在设计理念方面,Kimi-Dev-72B 结合了 BugFixer 和 TestWriter 的双重角色。BugFixer 负责修复错误,TestWriter 则编写相应的单元测试。这两个部分相互补充,确保模型在编程任务中的有效性。Kimi-Dev-72B 的工作流程简单明确,主要分为文件本地化和代码编辑两个阶段。为了增强模型的能力,月之暗面使用了约1500亿个高质量数据进行中期训练,数据来自 GitHub 的真实问题和 PR 提交。通过严格的数据净化,该模型能够学习人类开发者如何解决问题并编写代码。强化学习阶段则重点提升其代码编辑能力,通过基于结果的奖励系统,逐步优化模型的表现。在测试环节,Kimi-Dev-72B 能够协调 BugFixer 和 TestWriter 的角色,采用自我博弈机制,从而提升模型的性能和效果。每个问题最多可以生成40个补丁候选和测试候选,显示了自博弈机制的强大效应。未来,月之暗面计划进一步扩展 Kimi-Dev-72B 的功能,探索与流行开发工具的深度集成,使其更无缝地融入开发者的工作流程。公司承诺将持续改进这一模型,进行严谨的红队测试,以便向社区推出更强大的版本。Hugging Face地址:huggingface.co/moonshotai/Kimi-Dev-72BGitHub地址:github.com/MoonshotAI/Kimi-Dev划重点: Kimi-Dev-72B 是新发布的开源模型,创下了编程基准测试的全球最高分。 该模型结合了 BugFixer 和 TestWriter 的功能,以提升编程效率和代码质量。 月之暗面将继续优化 Kimi-Dev-72B,未来计划与流行开发工具进行更深入的整合。Kimi-Dev-72BMoonshotAISWE-benchVerified开源模型本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19002腾讯LeVo来袭!媲美Suno 4.5的AI唱歌模型,支持零样本音色克隆
2025年6月17日 18:02
腾讯LeVo来袭!媲美Suno 4.5的AI唱歌模型,支持零样本音色克隆AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 17, 2025112腾讯AI团队推出了一款令人振奋的AI唱歌模型LeVo,以其强大的音色克隆、分轨生成和高保真音乐表现引发业界热议。据悉,LeVo在多项关键指标上可媲美行业领先的Suno4.5,为中国AI音乐生成技术赢得一席之地。AIbase整理最新信息,为您深度解析LeVo的突破性功能与潜力。媲美Suno4.5:LeVo的硬核实力LeVo由腾讯AI实验室研发,采用语言模型(LM)架构,结合LeLM和音乐编解码器,能够并行生成混合音轨(融合人声与伴奏)或双轨音轨(人声与伴奏分开)。在音乐性、音质、人声与伴奏和谐度以及歌词对齐等维度上,LeVo全面超越现有开源学术模型。根据最新评测,LeVo在歌词对齐能力(LYC)上比Suno4.5高出0.21分,展现出卓越的文本控制能力。项目地址:https://levo-demo.github.io/零样本音色克隆:个性化音乐创作新高度LeVo支持零样本音色克隆(Zero-Shot Voice Cloning),仅需3秒音频片段即可精准复制目标音色,包括音调、情感和韵律。这一功能无需大量训练数据,极大降低了音乐创作的技术门槛。无论是为个人定制专属音色,还是模仿知名歌手风格,LeVo都能提供自然流畅的生成效果,赋予创作者无限可能。分轨生成:专业音乐制作的利器与传统AI音乐生成模型不同,LeVo支持双轨生成模式,可分别生成人声和伴奏音轨,为后期混音和编辑提供了更大灵活性。这一功能尤其适合专业音乐制作人,能够轻松实现高质量的分轨输出,优化创作流程。相比之下,Suno4.5在音色克隆和分轨支持上略显不足,LeVo的这一特性无疑为行业树立了新标杆。高保真与多场景应用LeVo在音质表现上接近Suno4.5的行业标准,尤其在音乐性、人声与伴奏和谐度和音质(MOS评分)等方面表现出色。尽管在歌曲结构清晰度上略逊于Suno4.5和Mureka-O1,但LeVo通过多偏好对齐方法优化了生成结果,确保音乐在各种风格和场景下都能保持高保真效果。无论是流行音乐、影视配乐还是广告制作,LeVo都能提供专业级输出。开源承诺:推动AI音乐生态发展腾讯表示,LeVo将以开源形式发布,计划提供完整代码和预训练模型,供全球开发者免费使用。这一举措不仅体现了腾讯在AI音乐领域的雄心,也为全球音乐创作社区注入了新的活力。AIbase注意到,LeVo的开源策略将有效降低创作门槛,助力内容创作者和音乐爱好者实现创意表达。腾讯LeVo的发布标志着中国AI音乐生成技术迈向全球前沿,其零样本音色克隆和分轨生成功能为音乐创作带来了革命性突破。尽管在部分指标上与Suno4.5仍有差距,但LeVo凭借高性价比和开源优势,已成为AI音乐领域的强有力竞争者。AIbase认为,LeVo的推出不仅提升了中国AI技术的国际影响力,也为音乐创作的民主化进程迈出了重要一步。AI唱歌模型LeVo腾讯AI实验室Suno4.5本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19001夸克App推出夸克老师 具备个性化AI辅导能力
2025年6月17日 15:03
夸克App推出夸克老师 具备个性化AI辅导能力AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 17, 20251今日,夸克App正式推出全新升级的学习产品夸克老师,这一AI家教的亮相,为学习领域带来了新的活力。夸克老师功能强大,集讲题、批作业、出题、找试卷等多种能力于一身,堪称学生身边的得力学习助手。其背后依托夸克灵知学习大模型,并以通义千问为基础,在解答数学、物理等高难度题目时,展现出强大的推理及讲解能力。此前在多家媒体组织的高考数学题测评中,夸克凭借出色表现分别取得145分和146分的成绩,位列榜首,这也从侧面印证了夸克老师在解题方面的实力。与传统拍题工具和AI对话类产品不同,夸克老师最大的亮点在于具备因材施教的能力。它能够根据学生的学习阶段、历史错题以及知识点掌握程度等信息,为学生提供像学校老师一样更具针对性的1对1辅导。在讲解题目时,夸克老师会模拟人类老师的教学思路,将题目中的知识点和考点进行细致拆解,清晰呈现每一步的解题过程,帮助学生更好地理解题目。批改作业时,它不仅能精准定位学生的薄弱点,还会给出切实可行的学习建议,并智能推荐同类题目,助力学生举一反三。当学生提出帮我出两道面积计算的应用题时,夸克老师会根据考生所在区域和学习能力,生成适配的练习题和本地试卷,满足学生的个性化学习需求。值得一提的是,夸克老师拥有十亿级的专业题库和数百万份地方名校的真题,丰富的资源为学生的学习提供了有力保障。为让更多用户体验到夸克老师的强大功能,夸克目前将发放1000万份夸克学习会员季卡。用户只需更新夸克App并搜索夸克学习,即可领取这份专属福利。AI新词夸克App夸克老师通义千问本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19000MagicTryOn发布!浙大x vivo联手打造视频虚拟试衣,跳舞也能完美换装!
2025年6月17日 15:03
MagicTryOn发布!浙大x vivo联手打造视频虚拟试衣,跳舞也能完美换装!AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 17, 202525浙江大学联合vivo推出了一款革命性的视频虚拟试衣模型MagicTryOn,以其卓越的时空一致性、服装细节保真度和泛化能力引发业界热议。这一创新技术不仅支持图像和视频试穿,还能在复杂场景和大幅度运动中实现逼真的服装效果,为电商、时尚和虚拟内容创作开辟了全新可能。全球首创:基于扩散Transformer的视频试穿框架MagicTryOn摒弃了传统的U-Net架构,采用先进的扩散Transformer(DiT)技术,显著提升了模型的表达能力。结合全自注意力机制,该框架实现了视频在时间和空间维度上的联合建模,确保试穿效果在动态场景中的流畅性和一致性。相较于传统方法,MagicTryOn有效避免了帧间抖动和服装细节丢失问题,生成效果堪称影视级别。支持多样化试穿场景,动态表现惊艳MagicTryOn支持图像试穿、视频试穿以及自定义试穿,能够适应从静态展示到动态表演的多种场景。尤其在大幅度运动(如跳舞)或复杂背景中,MagicTryOn依然能保持服装的自然贴合与动态真实感。此外,其强大的泛化能力使其不仅适用于人体试穿,还能在玩偶等非标准对象上实现虚拟换装,为创意内容生成提供了更多可能性。电商广告新利器:细节保真,商业价值凸显MagicTryOn通过粗到细的服装保留策略和掩码感知损失优化,显著提升了服装纹理、图案和轮廓的保真度。实验表明,该模型在视频虚拟试穿(VVT)数据集上的表现全面超越现有技术,生成的试穿视频效果逼真稳定,可直接应用于电商广告和时尚展示场景。这一技术有望减少实体试穿和产品退货,降低时尚行业的环境影响,同时提升消费者在线购物的体验。开源赋能,助力全球开发者MagicTryOn采用Apache2.0许可证,已在Hugging Face平台开放源代码、预训练模型和Gradio演示界面,供全球开发者免费体验和使用。这一举措不仅展示了浙江大学与vivo在AI技术开源领域的领先地位,也为电商、虚拟现实和内容创作等行业注入了新的创新动力。MagicTryOn的发布标志着视频虚拟试穿技术迈向新高度,其在时空一致性、动态适配和细节保真方面的突破,为AI驱动的时尚科技树立了新标杆。AIbase认为,MagicTryOn不仅将推动电商和时尚行业的数字化转型,还将为虚拟内容创作和元宇宙应用带来深远影响。未来,随着更多技术细节的公开和社区的参与,这款模型的潜力将进一步释放。项目地址:https://github.com/vivoCameraResearch/Magic-TryOn/AI新词品牌产品词MagicTryOnvivo本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18999颠覆传统!新多智能体框架OWL获17K Star,超越OpenAI开创智能协作新时代
2025年6月17日 15:03
颠覆传统!新多智能体框架OWL获17K Star,超越OpenAI开创智能协作新时代AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 17, 202546随着大型语言模型(LLM)的迅猛发展,单一智能体在应对复杂现实任务时显露出诸多局限。为了解决这个问题,香港大学与 camel-ai 等多家机构联合推出了一种名为 Workforce 的全新多智能体框架,并配套了一种名为 OWL(Optimized Workforce Learning)的训练方法。最近,这一创新成果在权威基准测试 GAIA 上获得了69.70% 的准确率,不仅刷新了开源系统的记录,还超越了 OpenAI Deep Research 等多家商业系统。这一研究成果的所有代码已在 GitHub 上开源,当前已获得超过17,000个 Star 的点赞,标志着社区对这一创新的认可。那么,Workforce 框架是如何突破多智能体系统的局限性的呢?其核心在于创新的 解耦设计。框架将整个系统拆分为三个关键组成部分:领域无关的规划器(Planner Agent)、智能协调器(Coordinator Agent)和专业工作节点(Worker Nodes)。这种设计不仅提升了系统的灵活性,还显著降低了跨领域迁移的复杂性。尤其是在需要适应新领域时,用户只需替换或添加工作节点,而不必对核心系统进行全面修改。OWL 训练方法则是这一框架的另一大亮点。该方法采用了两阶段的训练策略,第一阶段是监督微调,通过专家演示数据对规划器进行初步训练;第二阶段则是强化学习优化,通过直接偏好优化(DPO)算法进一步提升决策能力。这一系列优化确保了规划器能够处理现实世界中的多样化任务。在 GAIA 基准测试中,Workforce 框架展示了其显著的优势,尤其是在多智能体推理方面,达到了69.70% 的准确率,远超以往的开源系统。同时,OWL 训练方法也在测试中取得了显著成果,提升了 Qwen2.5-32B-Instruct 模型的性能。这一突破使得多智能体系统在处理复杂任务时,不再受限于以往的设计思路,展现出强大的自我纠错和进化能力。Workforce 框架的推出不仅提升了多智能体系统的整体性能,也为智能助手的未来发展指明了方向。论文地址:https://arxiv.org/pdf/2505.23885大型语言模型WorkforceOWLGAIA本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18997OpenAI 重磅升级 ChatGPT 搜索功能,让智能响应更精准!
2025年6月17日 15:03
OpenAI 重磅升级 ChatGPT 搜索功能,让智能响应更精准!AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 17, 202561在数字化快速发展的今天,信息的获取方式不断演变。为了提升用户体验,OpenAI 近期宣布对其人工智能助手 ChatGPT 的搜索功能进行重大升级。此次更新不仅优化了搜索质量,还让智能响应更加精准,用户体验更上一层楼。新版本的 ChatGPT 搜索功能具备了多项新特性,首先,它的响应更加智能,能够更好地理解和处理复杂的对话上下文。这意味着用户在进行长时间对话时,ChatGPT 能够保持上下文的连贯性,从而提供更符合需求的回答。此外,系统增强了对指令的跟踪能力,用户可以通过更自然的方式进行提问,获得更准确的结果。图源备注:图片由AI生成与此同时,ChatGPT 还支持图像搜索,用户可以上传图片来获取相关的信息。这一功能的加入,使得搜索不仅局限于文字,极大丰富了用户的使用体验。尽管新版本在回答生成时可能会稍显延迟,偶尔也会在简单问题上出现复杂推理的情况,但整体上用户能够获取的信息更加全面和及时。为了应对竞争,谷歌也在其搜索结果顶部加入了人工智能搜索概览,显示出市场竞争的激烈。不同于传统的搜索方式,ChatGPT 搜索不仅提供直接生成的回答,还会标注信息来源,帮助用户快速核实内容的真实性。这种透明度无疑增强了用户对信息的信任感。OpenAI 在搜索功能上的升级,让 ChatGPT 不仅仅是一个聊天助手,更是一个智能的信息检索工具。在未来,随着技术的不断进步,我们可以期待 ChatGPT 在帮助用户获取知识和信息方面发挥更大的作用。AI新词OpenAIChatGPT品牌产品词本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18993Gemini 2.5 Pro即将更新Deep Think的功能 提供额外计算能力
2025年6月17日 15:03
Gemini 2.5 Pro即将更新Deep Think的功能 提供额外计算能力AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 17, 202594随着人工智能技术的迅猛发展,Google的Gemini系列模型持续引领行业创新。AIbase最新获悉,Gemini2.5Pro即将正式发布全新Deep Think功能,这一增强推理模式被誉为AI复杂问题解决的里程碑。Deep Think功能:多线程推理的突破根据近期社交媒体上的可靠信息,Gemini2.5Pro的Deep Think模式通过并行处理多个假设,显著提升了模型在复杂任务中的推理能力。相较于标准模式,Deep Think在数学、编程和多模态任务中的性能提升约15%,尤其在2025年美国数学奥林匹克(USAMO,49.4%)、LiveCodeBench编程测试(80.4%)以及多模态推理测试MMMU(84.0%)中表现卓越。这种多线程推理机制类似于心理GPU,能够高效破解高难度问题,为用户提供更精准的答案。Deep Think不仅提升了性能,还通过用户界面优化了交互体验。用户可通过网页UI的工具栏直接切换至Deep Think模式,操作更加直观。这一功能预计将首先向限定测试者和Google AI Ultra计划用户开放,随后逐步推广。广泛的应用前景Deep Think的推出标志着Gemini在专业分析和复杂任务处理上的新突破。AIbase分析认为,该功能将广泛应用于学术研究、软件开发和数据分析等领域。例如,在学术场景中,Deep Think可协助研究人员快速验证多个假设;在编程领域,它能高效生成和优化复杂代码。此外,Deep Think还支持多模态输入,结合文本、图像和音频,为跨领域任务提供更全面的解决方案。值得注意的是,Google在Deep Think的开发中格外重视安全性。在正式发布前,Google将通过API向可信测试者开放,收集反馈并进行进一步的安全评估,以确保功能稳定性和数据安全性。发布计划与用户期待社交媒体上的最新动态显示,Deep Think模式即将迎来正式发布,预计最快在本月内通过Google AI Studio和Gemini API向更多用户开放。部分早期测试者已通过API体验了该功能,并对其在复杂数学和编程任务中的表现给予高度评价。AIbase注意到,用户对Deep Think的期待主要集中在以下方面:更高效的问题解决能力、更低的计算成本以及与Google生态(如Google Workspace)的深度整合。Google还计划将Deep Think与Gemini的其他功能(如Deep Research)进一步结合,形成更强大的AI代理生态。这意味着未来用户可以通过单一平台完成从研究到执行的多步骤任务,极大地提升工作效率。AIbase点评:Gemini的战略布局作为AI领域的领先者,Google通过Deep Think功能的推出进一步巩固了Gemini在高端AI市场的竞争力。AIbase认为,Deep Think不仅是技术上的突破,更是Google迈向代理型AI愿景的重要一步。与OpenAI的o1-pro等模型相比,Deep Think在多模态推理和计算效率上展现出独特优势,未来有望在专业领域抢占更多市场份额。AI新词:DeepThink品牌产品词:GoogleGemini2.5ProAI新词:多线程推理品牌产品词:AIbase本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18991豆包大模型再进化!全球领先,AI Agent 应用加速落地!
2025年6月16日 21:00
豆包大模型再进化!全球领先,AI Agent 应用加速落地!AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 2025105近日,豆包大模型迎来了全新1.6版本,标志着其综合能力的再次跃升。在推理、数学、指令遵循等多个核心领域,豆包1.6实现了显著的性能提升,同时大幅降低了用户使用的门槛,推动 AI Agent 在消费电子、汽车、金融等行业的快速应用。根据最新发布的数据显示,豆包大模型1.6在复杂推理、竞赛级数学、多轮对话和指令遵循等领域的测试中,成绩已跻身全球前列。例如,在针对北京市海淀区高考模拟试卷的评测中,豆包1.6的理科成绩较去年提升了154分,文科成绩提升了90分。这一成果无疑吸引了众多企业的关注,豆包大模型的日均调用量已从3月份的12.7万亿 tokens 增长至5月底的16.4万亿 tokens。在保持市场领导地位的同时,豆包1.6继续延续其价格优势,创新性地采用 输入长度 区间定价。以0-32K 的输入区间为例,豆包1.6的输入费用仅为0.8元 / 百万 tokens,输出为8元 / 百万 tokens,整体成本仅为其前版本的三分之一。Seedance1.0pro 模型的每千 tokens 收费仅0.015元,为用户提供了更为经济实惠的选择。豆包大模型的创新还体现在其多模态能力上,涵盖视频、图像、语音、音乐等多个领域,为企业用户带来了全新的智能体验。火山引擎总裁谭待表示,AI 时代的核心是 Agent,能够自主感知和规划,从而完成更复杂的任务。多个行业客户对此表示赞同,例如梅赛德斯 - 奔驰在新车型中引入了豆包 AI 大模型,使其更好地理解中国客户的需求。豆包1.6还在加速 Agent 的实际应用落地,重塑用户体验。例如,用户可以通过豆包1.6自动操作浏览器完成酒店预定,或者将购物小票整理为 Excel 表格。此外,与瑞幸咖啡的合作更是将 AI 点单智能体推向市场,实现了通过语音下单的全新消费体验。谭待强调,降低 Token 成本对于 Agent 的高效运行至关重要。豆包1.6的突破使得企业能够以低成本构建真正智能的 AI Agent,为未来的智能化发展奠定了基础。豆包大模型AIAgent北京市海淀区1.6版本本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18944又一顶级三甲医院与蚂蚁集团达成合作,推动AI医疗成果落地
2025年6月16日 18:01
又一顶级三甲医院与蚂蚁集团达成合作,推动AI医疗成果落地AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 202586月16日,首都医科大学附属北京友谊医院(下简称友谊医院)与蚂蚁集团正式签署共建协议,围绕AI医疗创新服务、重大临床学科项目、科研数据共享等展开深度合作,探索AI医疗融合新范式。目前,双方联合打造的消化专科智能体消化百事通已经上线,用户上支付宝搜AI健康管家即可使用,后续将为患者提供覆盖预防诊断治疗康复的全链路服务。该智能体依托蚂蚁集团医疗多模态大模型,深度融入了友谊医院消化科的权威医学知识体系、丰富临床诊疗经验和独特诊疗思路,能够模拟医生主动进行具有逻辑性、连贯性的问诊,为患者提供专业、严谨、便捷的疾病咨询服务。借助于此,消化科团队也可以更全面地掌握就诊患者情况,让线下诊疗服务和疾病管理更高效。友谊医院副院长李鹏表示:大模型时代开启,医院既要积极拥抱前沿科技,更要以高度的医学责任感和审慎的态度推动其落地应用。医院经过深入评估,选择从消化科这一覆盖人群广泛、在慢病管理中地位关键的优势学科出发,开启与蚂蚁集团的合作。此次合作能将友谊医院在消化疾病领域的深厚积淀与领先的AI技术真正结合,共同探索技术与医学融合的有效模式,让高科技真正惠及老百姓的就医体验和健康管理。今年以来,越来越多医院拥抱大模型,而作为连接医院与用户的载体,AI智能体成为提升医疗服务可及性、探索医生与AI协作的新路径。据了解,目前在蚂蚁AI健康管家上已汇集北京协和医院、浙江大学医学院附属第二医院等一百多位名医智能体。其中,与上海仁济医院共建泌尿外科专科智能体,上线半年完成的AI服务即占门诊量超50%;杭州市第七人民医院主任医师、副院长毛洪京推出的医生智能体,上线至今,已累计服务超200万患者,帮助毛洪京医生团队筛查出约2万睡眠障碍人群。蚂蚁集团医疗健康事业部AI医疗总经理、AI健康管家负责人刘军伟表示:在建设健康中国道路上,我们坚信AI技术创新会成为重要的连接器、助推器。从数字医疗、智慧医疗到AI医疗,蚂蚁始终致力于成为医疗机构诊疗服务升级的创新引擎。我们携手友谊医院进入医疗服务的深处,打造医生和患者都能用、好用、想用的产品。公开资料显示,蚂蚁集团于2023年正式投入AI医疗,蚂蚁医疗大模型在MedBench医疗大模型评测中,曾连续斩获医学知识问答等多项第一,是业内应用场景最丰富、与医疗机构、医生、医院共建最深的垂类大模型之一。以医疗大模型为核心,以AI健康管家、好大夫为纽带,蚂蚁形成了医疗机构医生患者的三维服务体系,打通医疗AI从诊疗、服务到健康管理的闭环。记者了解到,蚂蚁集团还计划在未来一年内,联合国内顶尖名医打造覆盖肿瘤、慢病等领域的AI智能体矩阵。AI医疗消化百事通蚂蚁集团医疗多模态大模型本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18943