苹果 AI 负责人 Giannandrea 降职,WWDC25 缺席引发关注
2025年6月16日 18:01
苹果 AI 负责人 Giannandrea 降职,WWDC25 缺席引发关注AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 20259在最近举办的2025年 WWDC25全球开发者大会上,苹果公司的人工智能部门负责人约翰贾南德雷(John Giannandrea)未能出席,引起了广泛的关注和猜测。根据彭博社记者马克古尔曼的报道,Giannandrea 似乎已经逐渐淡出苹果的核心管理层,甚至有可能在不久的将来离开公司。Giannandrea 自2018年加入苹果以来,曾被寄予厚望。作为谷歌前搜索与 AI 部门的负责人,他在业内积累了丰富的经验。然而,尽管拥有过硬的技术背景,他在苹果的表现并不如预期。多年来,Giannandrea 一直未能融入苹果的公司文化,与公司高层在人工智能的理念上也存在显著分歧,这些因素导致了他近期的降职。与去年的 WWDC24相比,Giannandrea 的缺席显得格外刺眼。去年,他还在会议上与媒体互动并发表讲话。然而在今年的活动中,不仅 Giannandrea 缺席,苹果对 AI 的整体表态也显得异常谨慎。苹果软件主管克雷格费德里希(Craig Federighi)在演讲中仅提到,Apple 智能还需要更多打磨时间,而整场发布会的焦点则转向了 iOS26的新视觉风格和系统更新。古尔曼分析认为,Giannandrea 在苹果内部的权力已受到削弱,公司可能不再信任他。随着人工智能技术在市场竞争中越来越重要,这一变化让人们对苹果未来的 AI 发展充满疑问。尽管苹果一直在努力提升其 AI 功能和应用,但内部的高层动荡是否会影响未来的进展,仍然需要进一步观察。苹果正面临着如何更好地将 AI 技术与其产品结合的挑战,而 Giannandrea 的缺席或许会使得这一过程变得更加复杂。业界对苹果在人工智能领域的未来布局仍将保持高度关注。划重点: Giannandrea 缺席 WWDC25,可能面临离职风险。 他的降职与公司高层在 AI 理念上的分歧有关。 苹果对 AI 发展的表态谨慎,未来规划引发猜测。WWDC25苹果人工智能JohnGiannandrea本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18942AI代理的未来:GPTs正在改变我们的工作和学习方式
2025年6月16日 18:01
AI代理的未来:GPTs正在改变我们的工作和学习方式AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 202541在科技的快速发展中,人工智能(AI)的应用越来越广泛,许多人开始期待 代理 技术的崛起。代理是指一种能够自主工作、完成特定目标的智能程序。近期,有关 AI 代理的讨论如火如荼,但现有技术距离真正的智能代理仍有一段距离。想象一下,如果我们能拥有一款能够自动撰写学术论文的 AI 代理,它可以在接收到数据集和研究领域后,深入学习如何撰写论文、分析数据、进行文献综述、生成假设并进行测试,最后输出一篇完整的学术论文。然而,现实中的 GPT(生成预训练变换器)技术虽然有所进展,但仍需人为的反馈和指导。目前,GPT 的最大优势在于它能够简化任务和流程的自动化。GPT 允许用户创建结构化的提示,这些提示可以帮助 AI 更好地完成任务。例如,用户可以使用 GPT 构建一个互动游戏或教育工具,通过与 AI 的对话来不断改进和调整功能。在实际应用中,我们看到一些令人振奋的案例。作者尝试创建一个 反馈向导 GPT,用于为学生的写作提供具体的反馈。这个系统可以帮助学生在写作过程中获得个性化的指导,极大地提升他们的学习体验。通过上传作业和评分标准,AI 能够提供详细的反馈和建议,帮助学生不断改进自己的写作能力。然而,随着 AI 与更多系统的连接,我们也需要关注潜在的风险。由于 AI 的 易受欺骗 特性,黑客可能利用这一点进行恶意操作,甚至可能导致 AI 自主行动时引发更严重的后果。因此,必须对 AI 代理的发展保持警惕,以便在享受其带来便利的同时,确保其安全性。GPTs 不仅是 AI 技术发展的重要里程碑,也预示着未来 AI 代理的无限可能。随着越来越多的专业人士和组织加入这一领域,我们期待看到更多创新的应用案例,不仅改变我们的工作方式,也将极大地丰富我们的学习体验。人工智能代理GPT学术论文AI应用本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18938小米官宣7月底新品发布潮,首款真AI眼镜重磅亮相对标Meta雷朋
2025年6月16日 18:01
小米官宣7月底新品发布潮,首款真AI眼镜重磅亮相对标Meta雷朋AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 202566此次小米7月底的发布会将是科技爱好者关注的焦点。除了万众期待的小米汽车之外,小米还将带来多款重磅新品,包括性能强劲的Redmi K80至尊版以及功能升级的小米平板7S Pro。然而,最令人期待的莫过于小米首款真AI眼镜的首次公开亮相。据知名博主数码闲聊站透露,这款AI眼镜的市场定位将对标Meta雷朋,后者目前是全球范围内销售表现最佳的AI眼镜产品。此前已有爆料指出,作为小米在该领域的开山之作,这款真AI智能眼镜将采用先进的双芯架构,并自带高清镜头,预计能实现与Meta雷朋相媲美的拍摄效果。更重要的是,这款产品有望通过其内置镜头感知现实世界,并结合强大的AI功能,带来一系列丰富的交互与应用体验。例如,它可能具备类似苹果视觉智能的功能,能够通过镜头识别物体,甚至自动识别餐厅并提供包括价位、评分等详细信息,极大地拓展了智能眼镜的应用场景。值得注意的是,爆料信息显示,这款小米AI眼镜并未配备屏幕,这意味着其主要的交互方式将集中于触摸和语音控制。此外,也有猜测其可能基于AI识别实现手势操控,尽管这在误操作优化方面可能面临一定挑战。回顾此前的消息,这款小米AI眼镜的发布计划早在去年就有所提及。当时有传闻称,该产品原定于今年3月至4月发布,并由小米与歌尔公司合作打造。爆料还指出,这款AI眼镜将集AI功能、音频耳机模块和摄像头模块于一体,并将以小米自有品牌而非MIJIA品牌进行发布,彰显了小米在智能硬件生态链中的独立布局和技术实力。小米首款真AI眼镜的发布,不仅标志着小米在智能穿戴设备领域迈出了重要一步,也预示着AI技术在消费者日常生活中将扮演越来越重要的角色。小米汽车RedmiK80至尊版小米平板7SProAI智能眼镜本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18937RAGFlow震撼来袭!开源RAG引擎解锁深度文档理解,引爆企业AI新革命!
2025年6月16日 18:01
RAGFlow震撼来袭!开源RAG引擎解锁深度文档理解,引爆企业AI新革命!AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 2025111近日,一款名为RAGFlow的开源RAG(检索增强生成)引擎引发了业界广泛关注。这款基于深度文档理解的企业级AI工具,以其强大的多模态数据处理能力和高效的工作流程,为企业处理复杂文档和实现精准问答提供了全新解决方案。RAGFlow:深度文档理解的先锋RAGFlow是一款完全开源的RAG引擎,专注于深度文档理解,旨在帮助企业和个人从海量非结构化数据中提取有价值的信息。不同于传统基于关键词的检索方式,RAGFlow结合大型语言模型(LLM)与先进的文档解析技术,支持从复杂格式的文档(如Word、Excel、PDF、图片、网页等)中提取知识,并提供带有明确引用的精准问答功能。其核心优势在于高质量输入,高质量输出,通过智能模板分块和可视化文本处理,用户可直观干预数据处理过程,确保检索结果的准确性和可追溯性。RAGFlow的GitHub仓库已获得超过55,000颗星,显示出社区对其的高度认可。核心功能:多模态与深度研究的完美结合RAGFlow通过一系列创新功能,为企业级RAG工作流程树立了新标杆:多模态数据支持:支持处理文本、图片、扫描件、结构化数据及网页等多种数据类型,适用于法律、医疗、金融等需要处理复杂文档的行业。智能分块与可视化:提供多种模板化分块选项,并支持可视化文本分块,允许用户直观调整数据处理方式,减少AI幻觉(hallucination)。网络搜索与深度研究:结合外部搜索工具(如Tavily),RAGFlow支持类似深度研究的推理能力,可为任意大型语言模型提供实时外部知识补充。高效部署与集成:通过Docker提供轻量版(2GB)和完整版(9GB)镜像,支持CPU和GPU加速,并通过直观的API接口实现与企业系统的无缝整合。知识图谱与SQL支持:支持知识图谱提取、关键词提取及文本转SQL功能,进一步提升数据检索和应用的灵活性。技术亮点:企业级效率的保障RAGFlow通过多项技术创新解决了传统RAG系统的局限性:深度文档理解:利用高级文档布局分析模型(如DeepDoc),从复杂格式的非结构化数据中提取关键信息,堪称数据海洋中的探针。多重召回与重排序:采用全文搜索与向量搜索结合的混合检索技术,并通过PageRank评分优化检索结果的准确性。本地化部署:100%开源,支持本地部署,数据存储默认使用Elasticsearch,近期还新增了对Infinity存储引擎的支持(Linux/arm64除外),确保数据安全与隐私保护。灵活配置:支持多种大型语言模型(如Deepseek-R1、DeepSeek-V3)及嵌入模型(如bce-embedding-base_v1),用户可根据需求自由选择。应用场景:从个人到企业的全面赋能RAGFlow的灵活性和强大功能使其在多个领域展现出广泛应用潜力:企业知识管理:帮助企业从海量文档中快速提取关键信息,优化内部搜索和决策支持系统。客户服务自动化:通过精准问答和引用支持,提升客户服务效率,减少人工干预。学术与法律研究:支持复杂文档的深度解析和知识图谱构建,助力研究人员快速定位关键信息。多模态内容处理:在医疗、金融等领域,RAGFlow可处理扫描件、图片等非文本数据,拓展了AI的应用边界。挑战与未来:RAG2.0的进化之路尽管RAGFlow在技术上取得了显著突破,其仍需面对一些挑战。例如,多模态数据处理对硬件要求较高,可能增加中小企业的部署成本。此外,如何进一步优化知识图谱的提取效率和模型的幻觉抑制能力,也是未来发展的关键方向。AIbase分析认为,RAGFlow代表了RAG技术向2.0时代的迈进。其开源特性降低了技术门槛,使中小型企业和开发者能够快速定制AI解决方案。未来,随着社区贡献的增加和功能的持续迭代,RAGFlow有望成为企业AI工作流程的标配工具。社区与生态:开源力量的崛起作为一款100%开源的项目,RAGFlow通过GitHub平台吸引了全球开发者的广泛参与。其官方Demo(demo.ragflow.io)已开放试用,展示了对复杂文档的处理能力。近期更新包括支持本地LLM部署(如Ollama、Xinference)、代码执行组件以及法律文档专用的布局识别模型,显示出其快速迭代的活力。结语RAGFlow以其深度文档理解、多模态支持和开源优势,正在重新定义企业级RAG工作流程的未来。从智能问答到深度研究,这款引擎为企业和开发者提供了高效、可靠的AI解决方案。项目地址:https://github.com/infiniflow/ragflowRAGFlow检索增强生成深度文档理解AI工具本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18935OpenAI升级ChatGPT Search功能,提供更精准、更智能的响应
2025年6月16日 18:01
OpenAI升级ChatGPT Search功能,提供更精准、更智能的响应AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 2025106OpenAI于2025年6月13日宣布对ChatGPT Search功能进行重大升级,进一步提升其搜索质量和用户体验。据悉,此次更新使ChatGPT能够提供更精准、更智能的响应,同时支持更长的对话上下文记忆。这意味着用户在进行复杂查询或长时间交互时,ChatGPT能够更好地理解需求并减少重复回答,为用户带来更流畅的体验。OpenAI表示,新版本在生成答案时可能略微耗时更长,但搜索结果的全面性和准确性得到了显著提升。技术突破:图片搜索与项目功能优化除了文本搜索的改进,ChatGPT Search现已新增图片搜索功能,用户可以通过上传图片进行相关内容的查询,这一功能为用户提供了更多样化的交互方式。此外,ChatGPT的Projects功能也同步升级,新增了更强大的研究、规划和组织工具。用户可以在Projects模块中更高效地管理相关对话、文件和指令,使ChatGPT从单一的聊天工具转变为一个综合性的生产力中心。市场竞争:向谷歌发起挑战ChatGPT Search自推出以来,已被OpenAI定位为谷歌搜索的有力竞争者。通过整合自然语言处理与实时网络搜索,ChatGPT不仅能快速提供答案,还能通过总结网页内容并附上可验证的来源链接,为用户提供更直观的信息获取方式。OpenAI表示,此次升级旨在进一步挑战谷歌在搜索领域的霸主地位,为用户提供更高效、更人性化的搜索体验。未来展望:持续迭代与用户反馈OpenAI强调,ChatGPT Search的优化离不开用户反馈的驱动。未来,OpenAI计划通过引入实时反馈机制,进一步完善搜索功能的表现,确保其能够适应多样化的用户需求。此外,OpenAI还在探索如何通过个性化设置,让用户能够更灵活地调整ChatGPT的行为模式,以满足不同文化背景和使用场景的需求。作为AI领域的先锋,OpenAI通过此次ChatGPT Search的升级,不仅展示了其在自然语言处理和搜索技术上的突破,也进一步巩固了其在AI驱动生产力工具领域的领先地位。AIbase认为,随着ChatGPT功能持续迭代,其在搜索、生产力工具乃至更广泛的AI应用场景中的潜力将进一步释放,未来或将重塑用户与信息的交互方式。OpenAIChatGPTSearch图片搜索Projects本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18931字节跳动Seaweed APT2震撼发布!实时互动AI视频生成,解锁3D虚拟世界新纪元
2025年6月16日 18:01
字节跳动Seaweed APT2震撼发布!实时互动AI视频生成,解锁3D虚拟世界新纪元AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 2025190近日,字节跳动推出了一款革命性的AI视频生成模型Seaweed APT2,其在实时视频流生成、互动相机控制及虚拟人类生成方面的突破引发了业界热议。这款模型以其高效的性能和创新的交互特性,被誉为通往虚拟全息甲板(HoloDeck)的重要一步。Seaweed APT2:实时视频生成新标杆Seaweed APT2是字节跳动Seed团队开发的一款8亿参数的生成式AI模型,专为实时交互视频生成设计。相较于传统视频生成模型,Seaweed APT2采用自回归对抗后训练(AAPT)技术,通过单次网络前向评估(1NFE)生成包含4帧视频的潜空间帧,显著降低了计算复杂性。该模型可在单块NVIDIA H100GPU上以24帧/秒、736×416分辨率实现实时视频流生成,而在8块H100GPU上可支持1280×720分辨率的高清输出。这种高效性能使其在交互式应用场景中展现出巨大潜力。核心功能:打造沉浸式交互体验Seaweed APT2的创新之处在于其强大的实时交互能力,以下为其六大亮点:实时3D世界探索:用户可通过控制相机视角(如平移、倾斜、缩放、前后移动)在生成的3D虚拟世界中自由探索,带来沉浸式体验。互动虚拟人类生成:支持实时生成并控制虚拟角色的姿势与动作,适用于虚拟主播、游戏角色等场景。高帧率视频流:在单块H100GPU上实现24帧/秒、640×480分辨率的流畅视频生成,8块GPU可支持更高清的720p输出。输入回收机制:通过将每一帧重新用作输入,Seaweed APT2确保长视频的动作连贯性,避免了传统模型中常见的动作断裂问题。高效计算:单次前向评估生成4帧内容,结合键值缓存(KV Cache)技术,支持长时间视频生成,计算效率远超现有模型。无限场景模拟:通过在潜空间中引入噪声,模型能够动态生成多样化的实时场景,展现无限可能。技术突破:自回归对抗训练的革新Seaweed APT2摒弃了传统的扩散模型多步推理模式,采用自回归对抗后训练(AAPT)技术,将预训练的双向扩散模型转化为单向自回归生成器。这种方法通过对抗目标优化视频的真实感和长期时间一致性,解决了传统模型在长视频生成中常见的动作漂移和物体变形问题。此外,模型在**图像到视频(I2V)**场景中表现出色,用户仅需提供初始帧即可生成连贯的视频内容。这使其特别适用于交互式应用,如虚拟现实(VR)、游戏开发和实时内容创作。应用场景:从虚拟主播到沉浸式叙事Seaweed APT2的实时性和交互性使其应用前景极为广泛:虚拟主播与角色动画:通过实时姿势控制和动作生成,Seaweed APT2可为虚拟主播或游戏角色提供流畅、自然的动画效果,降低传统Live2D或3D建模的成本。互动影视与教育:支持多镜头叙事和动态场景生成,适用于交互式短片、沉浸式教育内容等。虚拟现实与游戏:通过3D相机控制和场景一致性优化,Seaweed APT2可为VR和游戏开发提供实时生成的动态世界,接近星际迷航全息甲板的体验。电商与广告:快速生成产品演示视频或虚拟人物广告,提升内容创作效率。挑战与展望:迈向AI视频新未来尽管Seaweed APT2在技术上取得了显著突破,但其仍面临一些挑战。例如,目前模型尚未进行人类偏好对齐和进一步微调,未来在真实感与细节表现上仍有提升空间。此外,实时生成高分辨率视频对硬件要求较高,可能限制部分用户的接入成本。AIbase分析认为,Seaweed APT2的发布标志着AI视频生成领域从静态创作向动态交互的重大转型。字节跳动承诺未来将发布更多技术细节甚至开源代码,这将进一步推动社区创新。 随着技术的持续迭代,Seaweed APT2有望成为虚拟内容创作的基础设施,为影视、游戏和元宇宙等领域带来革命性变革。行业影响:重塑AI视频生态相较于OpenAI的Sora或Google的Veo,Seaweed APT2以更低的参数规模和计算成本实现了媲美甚至超越的表现。这种以小博大的策略不仅降低了技术门槛,也为中小型团队和个人创作者提供了高性能的视频生成工具。AIbase观察到,业内对Seaweed APT2的关注度迅速升温,其在社交媒体上的演示视频已引发广泛讨论,展现了从单帧到长篇叙事的卓越生成能力。结语字节跳动Seaweed APT2以其实时交互、3D世界探索和高帧率视频生成的突破性功能,为AI视频生成领域树立了新标杆。从虚拟人类到沉浸式叙事,这款模型正在重新定义内容创作的可能性。AI新词SeaweedAPT2字节跳动虚拟全息甲板本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18930英国电信裁员 5.5 万,AI 或将加速员工规模缩减
2025年6月16日 18:01
英国电信裁员 5.5 万,AI 或将加速员工规模缩减AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 2025106英国电信(BT)最近宣布了一项大规模裁员计划,预计在本十年末之前将裁减多达55,000名员工。该公司的首席执行官艾莉森柯克比(Allison Kirkby)在采访中表示,随着人工智能技术的快速发展,未来可能会有更多的裁员。BT 在两年前就曾公布计划,表示希望到2030年前削减40,000至55,000个岗位,旨在实现业务的 精简。然而,柯克比认为,这一计划并未充分考虑到人工智能的潜力。她指出:随着我们对人工智能的深入了解,BT 有望在本十年末变得更小。 公司之前的目标是通过裁员来削减30亿英镑的成本,但她认为,AI 的运用可能会为公司提供更多的成本节约机会。作为英国最大的宽带服务提供商,BT 在2023年决定缩减公司规模,这不仅包括裁员,还涉及减少合同工的数量。前首席执行官菲利普詹森(Philip Jansen)曾表示,BT 希望在本十年末实现员工和成本的大幅缩减。柯克比接任后,积极推动公司业务精简,包括出售意大利业务及爱尔兰的批发和企业部门,同时更加专注于提升英国本土业务。上个月,BT 将其国际业务拆分为一个独立部门,并对外表示可能考虑出售该部门。柯克比认为,BT 的宽带网络业务 Openreach 的价值在其股价中并未得到充分体现。如果这种情况持续,她表示 BT 绝对需要考虑其他选项。她补充道,一旦公司完成网络全光纤的升级,便会重新评估是否拆分该业务。不过,她更希望 BT 的股价能够反映 Openreach 的真实价值,而不是通过拆分来实现。此外,最近有消息指出,BT 正在考虑收购竞争对手电信和宽带公司 TalkTalk。TalkTalk 拥有约320万客户,但自2021年被伦敦投资公司 Toscafund 私有化后,背负了5.27亿英镑的债务,经营状况一直面临挑战。划重点: BT 计划在本十年末裁减多达55,000名员工。 AI 技术的发展可能会进一步推动公司裁员进程。 BT 考虑收购竞争对手 TalkTalk,积极推动业务整合。英国电信AI人工智能宽带服务本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18929商汤科技牵头打造智能油气未来 将建石化AI大模型联合实验室
2025年6月16日 18:01
商汤科技牵头打造智能油气未来 将建石化AI大模型联合实验室AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 202579近日,人工智能领军企业商汤科技与山东东明石化集团、北京好雅创新科技有限公司正式签署战略合作协议。此举旨在共同推动人工智能在石化产业的创新与发展,并将共建石化AI大模型联合实验室,助力石油和天然气行业实现全面智能化转型。根据协议,三方将紧密合作,共同设立石化AI大模型联合实验室。该实验室将聚焦石油化工产业的全流程生产经营管理,通过人工智能技术,在石化产业人工智能基础设施建设、智慧油田与生产优化、智能工厂与设备巡检、智能经营管理、智能营销与客户服务以及碳管理与能效优化等多个关键环节,促进全面降本增效提质。此次强强联手,有望加速石油和天然气行业的智能化转型进程,为石化产业的高质量发展注入强大动能。商汤科技石化AI大模型智能化转型石油和天然气本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18928OpenAI Codex 全新升级:让程序员轻松获取理想代码
2025年6月16日 18:01
OpenAI Codex 全新升级:让程序员轻松获取理想代码AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 202558OpenAI 最近宣布,旗下的人工智能编程助手 Codex 迎来了重磅更新。这一升级将极大改善开发者的编程体验,帮助他们更高效地完成编程任务。Codex 不仅可以生成代码,还能提供多种不同版本供开发者选择,这样一来,程序员再也不需要反复输入指令来获取理想的代码了。这项新功能的推出,意味着开发者可以在同一个编程任务中,得到多个不同的代码响应。这样,开发者就能根据自身需求,快速挑选出最符合要求的代码。这种方式不仅提升了编程的效率,也提高了代码的质量,使得开发者能够更加专注于创造性工作,而不是纠结于代码的细节。除了这一主要功能,OpenAI 还针对 Codex 进行了多项细节上的优化。更新日志显示,开发者在进行容器设置时,现在可以查看加载进度,了解代码库下载的实时情况。此外,开发者在使用 Codex 处理任务时,也可以手动取消操作,避免不必要的等待。针对安装过程中可能出现的问题,OpenAI 已经进行了修复,确保安装过程更加顺利。此外,Codex 对于网络访问限制的理解与响应也得到了改进,增加了操作的灵活性。更为重要的是,更新后,专业用户和团队用户的安装脚本运行时间增加到了20分钟,使得更复杂的任务也能被更好地处理。开发者们现在可以通过简单的操作,查看和管理代码差异,只需按住 Option 键点击代码标题,即可快速展开或折叠所有差异。Codex 的核心是基于 OpenAI最新的 codex-1模型,这一模型特别针对编程任务进行了优化,极大提高了代码生成的准确性。开发者不仅可以利用 Codex 编写新代码、提出拉取请求,还可以直接从 GitHub 提取代码库,运行各自的编程任务,实用性得到了显著提升。对于对编程感兴趣的开发者,OpenAI Codex 将是一个不可多得的利器,帮助他们加速开发进程,提升工作效率。有兴趣的开发者可以前往 OpenAI 的官网,下载并尝试这款强大的编程助手。OpenAICodex人工智能编程助手编程体验本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18927字节跳动AI Lab负责人李航卸任,Seed团队步入调整期
2025年6月16日 12:00
字节跳动AI Lab负责人李航卸任,Seed团队步入调整期AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 202517据自媒体爆料,字节跳动人工智能实验室(AI Lab)负责人李航已正式卸任,转为劳务/顾问身份。这一人事变动早有迹象,预示着字节跳动在人工智能领域的核心团队正经历一次重大调整。李航的职位变动始于 2025 年 2 月 21 日,原谷歌DeepMind副总裁吴永辉加入字节,担任大模型Seed基础研究负责人。此后,作为AI Lab总监的李航开始向吴永辉汇报。据悉,字节AI Lab成立于 2016 年,最初由微软亚洲研究院前常务副院长马维英领导,直接向字节跳动创始人张一鸣汇报。到 2018 年,该团队规模已达 150 人,是字节跳动AI研究的核心部门。 2020 年,AI Lab从集团级前瞻性项目转为技术中台,为字节多个业务团队提供支持,马维英的汇报对象也变为抖音负责人张楠。2020 年年中,马维英离开字节后,李航接任AI Lab负责人至今。此后,团队经历了多次重组。 2023 年起,AI Lab下属负责大语言模型的NLP组和开发视频生成模型的PixleDance先后被转入Seed团队。 2024 年开始,李航向Seed时任负责人朱文佳汇报。AI领域正迎来一个充满机遇与挑战的时代,技术创新、伦理考量和市场竞争将共同塑造其未来发展。AILab字节跳动人工智能李航本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18926DeepSeek R1模型震撼AI界:低成本高效能引领行业效率新赛道
2025年6月16日 12:00
DeepSeek R1模型震撼AI界:低成本高效能引领行业效率新赛道AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 202523今年1月,DeepSeek发布的R1模型不仅是一次普通的AI公告,更被誉为科技行业的分水岭,其影响力震动了整个科技行业,迫使行业领导者重新思考AI开发的基本方法。DeepSeek的非凡成就并非源于新颖的功能,而是它以极低的成本实现了与科技巨头相媲美的成果,这标志着AI发展正沿着效率和计算两条并行轨道快速前进。在约束中创新:低成本实现高性能DeepSeek的异军突起令人瞩目,它展现了即使在重大限制下,创新也能蓬勃发展的能力。面对美国对尖端AI芯片的出口管制,DeepSeek被迫寻找AI发展的其他途径。当美国公司通过更强大的硬件、更大的模型和更优质的数据追求性能提升时,DeepSeek则专注于优化现有资源,以卓越的执行力将已知理念付诸实践,这本身就是一种创新。这种效率至上的理念带来了令人瞩目的成果。据报道,DeepSeek的R1模型性能可媲美OpenAI,但运营成本仅为后者的5%到10%。更令人震惊的是,DeepSeek前身V3的最终训练运行成本仅为600万美元,与美国竞争对手动辄数千万甚至数亿美元的投入相比,这笔预算被特斯拉前AI科学家Andrej Karpathy称为笑话。据报道,OpenAI花费5亿美元训练其最新的Orion模型,而DeepSeek仅花费560万美元就取得了卓越的基准测试结果,不到OpenAI投资的1.2%。值得注意的是,DeepSeek实现这些成果并非完全处于芯片劣势。美国最初的出口管制主要针对计算能力,而非内存和网络而内存和网络是AI发展的关键要素。这意味着DeepSeek使用的芯片具备良好的网络和内存功能,使其能够在多个单元之间并行执行操作,这是高效运行大型模型的关键策略。再加上中国在人工智能基础设施垂直堆栈上的大力推动,进一步加速了这种创新。实用主义数据策略:合成数据与模型架构优化除了硬件优化,DeepSeek的训练数据方法也独具一格。据报道,DeepSeek并非仅仅依赖从网络抓取的内容,而是利用了大量的合成数据和其他专有模型的输出,这正是模型蒸馏的经典示例。尽管这种方法可能引发西方企业客户的数据隐私和治理担忧,但它凸显了DeepSeek注重结果而非过程的务实作风。有效利用合成数据是DeepSeek的关键差异化因素。DeepSeek等基于Transformer且采用混合专家(MoE)架构的模型在整合合成数据时更加稳健,而传统密集架构的模型若过度使用合成数据可能导致性能下降甚至模型崩溃。DeepSeek的工程团队在最初规划阶段就专门设计了模型架构,将合成数据集成纳入考量,从而在不牺牲性能的情况下充分利用合成数据的成本效益。市场反响:重塑AI行业格局DeepSeek的崛起已引发行业领导者的实质性战略转变。例如,OpenAI首席执行官Sam Altman近期宣布计划发布公司自2019年以来首个开放权重语言模型。DeepSeek和Llama的成功似乎给OpenAI带来了巨大冲击。DeepSeek推出仅一个月后,Altman便承认OpenAI在开源AI方面站在了历史的错误一边。面对每年高达70亿至80亿美元的运营成本,DeepSeek等高效替代方案带来的经济压力已不容忽视。正如人工智能学者李开复所言,竞争对手的免费开源模型正迫使OpenAI做出改变。尽管OpenAI进行了400亿美元的巨额融资,公司估值达到3000亿美元,但其方法比DeepSeek耗费更多资源的根本挑战依然存在。超越模型训练:迈向测试时计算和自主评估DeepSeek还加速了向测试时计算(TTC)的转变。随着预训练模型对公共数据利用接近饱和,数据稀缺正在减缓预训练的进一步改进。为解决此问题,DeepSeek宣布与清华大学合作,实现自我原则性评论调优(SPCT),即AI开发自己的内容评判规则,并利用这些规则提供详细评论,包含内置的评委实时评估AI的答案。这项进展是AI系统自主评估和改进运动的一部分,模型利用推理时间来改进结果,而非简单地增大模型规模。DeepSeek将其系统称为DeepSeek-GRM(通用奖励模型)。然而,这种方法也伴随着风险:如果AI制定自己的评判标准,可能偏离人类价值观、伦理道德,甚至强化错误的假设或幻觉,引发对AI自主判断的深层担忧。尽管如此,DeepSeek再次在他人工作的基础上,创建了可能是SPCT在商业上的第一个全栈应用程序。这可能标志着AI自主性的重大转变,但仍需严格的审计、透明度和保障措施。展望未来:适应与变革综合来看,DeepSeek的崛起预示着人工智能行业将朝着并行创新轨道迈进。在各大公司持续构建更强大的计算集群的同时,它们也将重点关注通过软件工程和模型架构改进来提升效率,以应对AI能耗带来的挑战。微软已停止了全球多个地区的数据中心建设,转向更加分布式、高效的基础设施建设,并计划重新分配资源以应对DeepSeek带来的效率提升。Meta也发布了首次采用MoE架构的Llama4模型系列,并将其与DeepSeek模型进行基准测试,这标志着中国AI模型已成为硅谷公司值得参考的基准。颇具讽刺意味的是,美国原本旨在维护其AI主导地位的制裁,反而加速了其试图遏制的创新。展望未来,随着行业在全球范围内的持续发展,所有参与者的适应能力将成为关键。政策、人员和市场反应将继续改变基本规则,我们彼此之间如何学习,以及如何应对,值得持续关注。DeepSeekR1AI科技行业本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18925视频版AI换衣框架MagicTryOn,基于Wan2.1视频模型
2025年6月16日 12:00
视频版AI换衣框架MagicTryOn,基于Wan2.1视频模型AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 16, 202555在现代时尚产业中,视频虚拟试穿(Video Virtual Try-On, VVT)逐渐成为了用户体验的重要组成部分。这项技术旨在通过模拟服装在视频中与人体动作的自然互动,展现出服装在动态变化中的真实效果。然而,目前的 VVT 方法仍然面临着空间时间一致性和服装内容保留等多重挑战。为了解决这些问题,研究人员提出了 MagicTryOn,一个基于大型视频扩散变换器(Diffusion Transformer)的虚拟试穿框架。与传统的 U-Net 架构不同,MagicTryOn 基于Wan2.1视频模型,采用了扩散变换器,通过全面的自注意力机制共同建模视频的时空一致性。这种创新性的设计使得模型能够更加有效地捕捉复杂的结构关系和动态一致性。在 MagicTryOn 的设计中,研究者们引入了一种粗到细的服装保留策略。在粗略阶段,模型在嵌入阶段整合服装标记,而在细化阶段则结合了多种服装相关的条件信息,如语义、纹理和轮廓线,从而在去噪声阶段增强了服装细节的表达。此外,研究团队还提出了一种基于掩码的损失函数,以进一步优化服装区域的真实感。为了验证 MagicTryOn 的有效性,研究者在多个图像和视频试穿数据集上进行了广泛的实验。结果表明,该方法在综合评估中优于现有的最先进技术,并且能够很好地推广到实际场景中。在具体应用中,MagicTryOn 在大幅度运动场景下表现尤为突出,例如舞蹈视频。这类场景不仅要求服装的一致性,还需要时空的连贯性。通过从 Pexels 网站选择的两个舞蹈视频,研究者成功评估了 MagicTryOn 在大幅度运动情况下的表现。MagicTryOn 代表了虚拟试穿技术的新进展,结合了先进的深度学习技术和创新的模型设计,展示了其在时尚界的巨大潜力。项目:https://vivocameraresearch.github.io/magictryon/划重点: MagicTryOn 采用扩散变换器,提升了视频虚拟试穿的时空一致性。 引入粗到细的服装保留策略,增强了服装细节的表现。 在大幅度运动场景下表现优异,成功展现了服装与人体动作的自然互动。VideoVirtualTry-OnVVT时尚产业用户体验本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/18923