谷歌Gemini重磅升级!视频上传与分析功能正式上线
2025年6月18日 18:01
谷歌Gemini重磅升级!视频上传与分析功能正式上线AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 18, 2025129近日,谷歌正式推出了其人工智能产品 Gemini 的最新版本 Gemini2.5Pro 和 Flash,全面开放给所有用户。此次更新不仅带来了更便宜且速度更快的 Gemini2.5Flash-Lite 模型,更令人瞩目的是新增的视频上传与分析功能,现已在安卓和网页端上线。用户在安卓端可以轻松上传视频进行分析,操作方式与添加图片相似,只需点击 + 按钮,选择视频片段即可。Gemini 能够对用户上传的视频进行全面分析,包括概述视频内容、查找特定片段或物品等。不仅如此,分析结果还将展示相关视频片段,方便用户快速获取所需信息。虽然分析时间会因视频长度而异,但这一功能无疑增强了 Gemini 在视频处理上的能力。值得一提的是,Gemini 的视频分析功能是在其已有的 YouTube 视频总结能力上进一步拓展,旨在为用户提供更便捷的使用体验。目前,用户仍无法在 Gemini 应用内直接录制视频,但可以拍摄照片并附加到提问中,丰富互动内容。此次功能的推出,标志着 Gemini 在与竞争对手 ChatGPT 的较量中又向前迈出了一步。虽然 ChatGPT 也支持实时摄像头画面的分析,但目前尚不具备视频上传分析的功能。因此,Gemini 在这一领域的优势愈发明显。谷歌 Gemini 的这次更新不仅丰富了功能,还为用户提供了更灵活的视频分析选项,使其在智能助手市场的竞争中进一步抢占先机。未来,随着 AI 技术的不断进步,Gemini 有望在更多场景中展现出其强大的潜力。GeminiGemini2.5ProFlash谷歌本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19059韩国计划未来5年在人工智能领域投入16万亿韩元
2025年6月18日 18:01
韩国计划未来5年在人工智能领域投入16万亿韩元AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 18, 202541据媒体报道,韩联社援引韩国科技部向总统国政规划委员会报告的计划称,韩国政府将在未来 5 年内在人工智能领域投入16. 1 万亿韩元。保障 5 万颗GPU安全供应,打造AI数据中心。支持人工智能模型的开发,使其对所有公民开放。人工智能GPUAI数据中心韩国科技部本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19057OpenAI CEO Altman 预测:5-10年内 AI 将发现新科学,人形机器人将走上街头
2025年6月18日 18:01
OpenAI CEO Altman 预测:5-10年内 AI 将发现新科学,人形机器人将走上街头AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 18, 202593在一场罕见的家庭式访谈中,OpenAI CEO Sam Altman 向其弟弟、Lattice 创始人 Jack Altman 描绘了他对人工智能(AI)未来5-10年发展的最新预测。Altman 认为,AI 在推理能力上的突破已使其达到博士生水平,但真正的颠覆之处在于 AI 发现新科学的能力。他同时对超级智能悖论表示担忧,即即便实现超级智能,社会生活方式也可能变化甚微,如同 ChatGPT 的出现并未从根本上改变人们的生活。AI 推理能力飞跃,科学发现成下一目标Altman 预测,在未来5-10年内,AI 将能够自主发现新的科学知识,其影响将压倒一切其他应用。他指出,目前的 O3模型在特定领域已展现出相当于优秀博士生的推理能力,例如在顶尖数学竞赛中取得高分或解决专家级博士难题。Altman 坦言,AI 进步的速度超出了他此前的预期。目前 AI 在科学研究中多扮演副驾驶角色,他预测天体物理学将是 AI最先实现自主新发现的科学领域,因为该领域数据量巨大但博士研究员不足。人形机器人将带来未来已来的真实感受谈及物理世界的 AI 应用,Altman 将人形机器人视为终极梦想,并预期在5-10年内,出色的人形机器人将走上街头,成为标志着未来已来的时刻。他认为,与 ChatGPT 等软件 AI 不同,人形机器人的出现将带来更具实质性的改变,让人们真切感受到未来的到来,而非像 ChatGPT 那样虽然神奇但仍局限于过去的个人电脑形态。超级智能悖论的忧虑:技术突破与社会停滞尽管对 AI 发展充满信心,Altman 对超级智能悖论表达了深刻担忧:即使实现了超级智能,世界也可能不会因此变得更好,社会甚至可能依然糟糕。他设想,即便构建了超级智能,如果它未能显著改善世界或改变人们的生活方式,那将是一个疯狂的说法。他认为,尽管 ChatGPT 已在许多领域展现出博士级智能并被广泛使用,但人们的生活方式和工作方式相比两年前并未发生根本性改变。他推测,即使出现 IQ 高达400的 AI,情况也可能依旧如此,这是一种技术图灵测试悖论。OpenAI 蓝图:打造无处不在的AI 伴侣生态系统Altman 描绘了 OpenAI 的未来愿景,即构建一个无处不在的AI 伴侣生态系统。他认为消费者最终需要的是一个能够通过各种界面和产品提供全方位帮助的 AI 伴侣,它了解用户的目标和信息,提供无缝的整体体验。他强调了成为一个一切都整合到其中并整合到各处的平台的至关重要性。Meta 的人才争夺战:高额挖角与文化差异Altman 透露,Meta 将 OpenAI 视为最大竞争对手,并采取了高额挖角策略,向 OpenAI 团队成员提供高达上亿美元的签约奖金和高薪。Altman 对此表示批评,认为这种过度依赖高额薪资和前期保证的策略不利于建立优秀的员工文化。他认为 OpenAI 的优势在于其善于可重复创新的文化,而 Meta 则不擅长创新。他还观察到,外界认为 ChatGPT 是 Google 的替代品,但在 Meta 内部,人们更多地将其视为 Facebook 的替代品。能源与太空展望:AI 驱动的未来发展针对 AI 算力激增带来的能源问题,Altman 坚信人类将消耗更多能源,并认为聚变和先进核能是解决方案。他展望,到最终阶段,人类消耗的能源将远超地球承载能力,届时必须开发太阳系资源,这或许是解决过度加热地球的最终途径。他虽信任专业公司,但表示自己已因 OpenAI 的核心使命而相当忙碌,无暇顾及创办火箭公司。OpenAIAIChatGPTLattice本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19056xAI加速融资步伐,43亿美元股权+50亿美元债务助力AI新征程
2025年6月18日 18:01
xAI加速融资步伐,43亿美元股权+50亿美元债务助力AI新征程AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 18, 202551人工智能领域的竞争日趋白热化,埃隆·马斯克旗下的xAI正以迅猛之势推进其融资计划。根据网络最新信息,xAI正在谈判筹集43亿美元的股权融资,同时计划通过债务融资再募集50亿美元,总计93亿美元的巨额资金注入。这一系列动作不仅彰显了xAI在AI领域的雄心,也反映了其对技术研发和基础设施建设的巨大投入。AIbase整理相关信息,带您深入了解xAI的融资动态及其背后的战略布局。图源备注:图片由AI生成,图片授权服务商Midjourney43亿美元股权融资:xAI的资本新篇章根据网络报道,xAI正在与投资者积极磋商,计划通过新一轮股权融资筹集43亿美元。这一融资规模建立在xAI自2023年成立以来已成功募集的140亿美元股权基础上。然而,由于AI研发和基础设施建设的高昂成本,截至2025年3月,xAI的现金储备仅剩40亿美元,显示出其资金消耗速度惊人。为应对这一挑战,xAI调整了融资条款,使之更具吸引力,最终推动了股权融资的顺利进展。分析指出,此轮融资将xAI的估值从510亿美元提升至800亿美元,增长约57%,反映了市场对其未来潜力的强烈信心。此外,xAI还在与部分硬件供应商谈判,预计获得6.5亿美元的折扣优惠,以缓解基础设施投资带来的财务压力。50亿美元债务融资:灵活应对资金需求除了股权融资,xAI还在推进一笔50亿美元的债务融资计划,由摩根士丹利牵头。这笔债务融资包括浮动利率贷款、固定利率贷款和担保债券,预计于近期完成分配。尽管市场对高收益债券的需求较为冷淡,xAI通过优化交易条款(如浮动利率贷款较基准利率高出700个基点,固定利率贷款和担保债券收益率约为12%)吸引了更多投资者参与。这笔债务融资旨在为xAI提供更大的运营灵活性,同时推迟现有股东的股权稀释。据悉,xAI每月烧钱超过10亿美元,主要用于开发其AI聊天机器人Grok以及建设大规模数据中心。这种高投入模式凸显了AI行业对资本的巨大需求,同时也为xAI的长期发展提供了资金保障。资金用途:加速AI技术与基础设施建设xAI的巨额融资计划与其雄心勃勃的发展目标密切相关。自2023年成立以来,xAI致力于开发加速人类科学发现的人工智能,其代表产品Grok已展现出强大的多模态能力。网络信息显示,xAI的资金主要用于以下几个方面:模型研发:持续优化Grok及下一代AI模型,提升其在文本、图像和多模态任务中的表现。数据中心建设:为支持AI训练和推理,xAI正在大规模投资数据中心基础设施。生态整合:xAI近期以800亿美元估值收购X平台(估值330亿美元),通过整合X的全球用户基础,进一步增强Grok的普及和应用场景。值得注意的是,xAI的快速烧钱速度引发了部分投资者对其财务可持续性的担忧。为此,xAI提出更严格的财务管控措施,以增强投资者信心。行业影响:AI竞赛中的资本博弈xAI的融资动态不仅反映了其自身的发展需求,也折射出全球AI行业的资本热潮。AI技术的研发和部署需要巨额资金支持,而xAI通过股权与债务并举的融资策略,展现了其在竞争激烈的AI市场中抢占先机的决心。网络评论指出,xAI与OpenAI、Anthropic等企业的竞争已进入白热化阶段,而充足的资金储备和X平台的流量优势,或将成为xAI突围的关键。此外,xAI的融资还带动了AI相关加密货币市场的活跃。例如,FIL、VIRTUAL和INJ等AI相关代币在融资消息公布后均出现小幅上涨,显示市场对AI行业的乐观预期。未来展望:xAI的星辰大海xAI的93亿美元融资计划为其未来的技术突破和市场扩张奠定了坚实基础。AIbase分析认为,凭借Grok的创新能力和X平台的全球影响力,xAI有望在多模态AI、科学计算和内容生态领域实现更大突破。然而,AI行业的快速迭代和高成本投入也意味着,xAI必须在技术商业化与成本控制之间找到平衡。随着xAI计划在2026年再募集64亿美元,其在全球AI竞赛中的角色将愈发重要。xAI股权融资AI领域AIbase本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19055稀宇科技MiniMax推出视频生成模型Hailuo 02
2025年6月18日 12:00
稀宇科技MiniMax推出视频生成模型Hailuo 02AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 18, 20257稀宇科技在视频生成领域取得新进展,正式推出全新视频生成模型Hailuo02。据悉,Hailuo02在处理高度复杂场景如体操动作时表现出色,是目前全球唯一能够实现此类效果的模型。自去年8月底展示视频生成模型Demo网页以来,稀宇科技推出的海螺视频产品已帮助创作者生成超过3.7亿个视频,此次Hailuo02的推出进一步降低了视频创作门槛,提升了创作质量。Hailuo02背后的核心架构为Noise-aware Compute Redistribution(NCR),该架构在同等参数量级下,使训练和推理效率提升了2.5倍。这使得在不增加创作者使用成本的前提下,可以采用更大的参数规模,从而让模型表现力更佳。同时,考虑到推理优化的空间,模型总参数量扩大到了上一版的3倍。得益于更大的总参数量和更高的训练效率,Hailuo02能够拟合更多数据。结合创作者在Hailuo01上的反馈,数据量扩大到了上一版的4倍,且数据质量和多样性显著提高。这使得新模型在复杂指令遵循和复杂物理表现上有了显著提升,能够完整响应复杂指令,让精心编写的提示词得到更好反馈。此外,创作者还能以相对实惠的价格生成原生的1080p视频。在Artificial Analysis Video Arena的测试中,Hailuo02的一个早期版本排名全球第二。目前,该模型已在海螺视频的Web、APP及开放平台API中全面更新,提供768p-6s、768p-10s和1080p-6s三个版本。稀宇科技持续为创作者提供业内最优价格,并计划在生成速度提升、偏好对齐、高阶功能实现以及技术与艺术结合上限探索等方面进行快速更新。稀宇科技Hailuo02视频生成Noise-awareComputeRedistribution(NCR)本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19054亚马逊 CEO 警告:生成式 AI 将重塑岗位,部分员工或被取代,鼓励技能提升
2025年6月18日 12:00
亚马逊 CEO 警告:生成式 AI 将重塑岗位,部分员工或被取代,鼓励技能提升AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 18, 202514亚马逊首席执行官安迪·贾西(Andy Jassy)周二在一封面向全体员工的电子邮件中透露,公司正加速部署生成式人工智能(Generative AI),此举将对部分岗位产生影响,预期会减少整体的企业员工数量。贾西在备忘录中指出,生成式人工智能的应用不仅是在亚马逊的产品中,更重要的是将进一步倾向于在内部流程中使用。亚马逊目前正在开发或已完成超过一千个生成式人工智能项目。他以 Alexa+ 为例,说明了公司未来的发展方向,尽管亚马逊首席信息安全官(CISO)强调该服务在正式发布前仍需在安全防护上进行完善。目前,Alexa+ 正在接受测试,但具体发布日期仍未公布。目前已有超过一百万人可以使用这项服务,我们对客户的反响非常满意随着业务规模的扩大,我们收到了许多很棒的反馈,也从中学习了很多,亚马逊发言人表示,我们正以更快的速度持续向客户推出这项服务,并期待着在今年夏天让这项服务在更广泛的范围内普及。然而,贾西坦承,随着生成式人工智能和代理程序的广泛应用,其将改变我们的工作方式。他预测,随着效率的提升,公司将需要更少的人手来完成当前的一些工作,同时需要更多人手从事其他类型的工作。我们预计,随着公司范围内广泛使用人工智能,效率将得到提升,这将减少公司员工总数。面对潜在的岗位变化,贾西鼓励员工积极学习新技能,参加研讨会并尝试 AI 技术。他提到,AWS Skill Builder 为亚马逊员工提供了免费的 AI 相关课程,部分课程具有实用价值。贾西以自己1997年加入亚马逊的经历为例,强调了学习和适应新技术的关键性。他认为,那些学习如何使用生成式人工智能的人员将处于有利地位,能够产生巨大的影响,并帮助我们重塑公司。尽管贾西的备忘录中并未提及立即的裁员计划,但亚马逊的重返办公室政策以及此前已进行的数轮大规模裁员(自2021年以来至少裁减了2.7万人),预示着公司在成本控制和效率提升方面的持续努力。在经济学家普遍认为生成式人工智能不会大规模取代工作和损害工资的论调下,亚马逊的举措引发了对其人工智能战略未来影响的广泛关注。同时,许多员工对其强制性的五天返工政策表达不满,这可能导致公司面临人才流失的风险。长远来看,业界对于人工智能对就业市场的影响存在不同看法。例如,Anthropic 首席执行官达里奥·阿莫迪预测未来五年内一半的白领工作岗位可能消失,这一观点尤其引起了程序员和初级安全人员等群体的担忧。生成式人工智能AmazonAlexa+安迪·贾西本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19053Meta豪掷1亿美元挖角OpenAI人才,奥尔特曼回应:我们不会走!
2025年6月18日 12:00
Meta豪掷1亿美元挖角OpenAI人才,奥尔特曼回应:我们不会走!AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 18, 202523在人工智能领域,Meta 首席执行官马克扎克伯格正全力以赴,试图招募 OpenAI 和 Google DeepMind 的顶尖人才。根据外媒 TechCrunch 的报道,Meta 为了吸引这些专家,甚至开出了高达1亿美元的薪资待遇,其中包括惊人的签约奖金。这一举动旨在为新成立的超级智能团队寻找合适的人才。OpenAI 的首席执行官山姆奥尔特曼在一档播客节目中确认了这一消息,他坦言尽管扎克伯格开出了如此丰厚的报价,但 OpenAI 的顶尖成员们却几乎没有人接受这个邀请。奥尔特曼感到欣慰,他表示:Meta 确实给我们团队很多人开出了惊人的报价,但到目前为止,我们最优秀的成员都没有接受这样的邀请。他进一步分析,OpenAI 员工之所以拒绝 Meta 的高薪挖角,是因为他们对 OpenAI 的未来抱有更大的信心,认为公司更有可能实现通用人工智能,并取得更高的商业价值。此外,奥尔特曼指出,Meta 在追求薪水的同时,忽视了企业的使命感和文化,这对创新氛围的形成并不利。据了解,Meta 曾试图挖走 OpenAI 的核心研究员诺姆布朗和谷歌 AI 架构负责人科拉伊卡武克苏格鲁,但最终都未能成功。奥尔特曼表示,OpenAI 的成功在于其持续的创新能力,而 Meta 目前的 AI 项目并没有达到预期效果。他坦言:我对 Meta 仍有一些方面的尊重,但我不认为 Meta 擅长创新。 在他看来,企业若想在 AI 竞赛中取得领先,仅仅依靠追赶是远远不够的,必须实现真正的突破。虽然 Meta 在招聘上持续发力,然而在奥尔特曼看来,真正的竞争力不仅仅来自于丰厚的薪水,更在于对创新和使命的坚持。未来谁将主导 AI 领域,或许还要看各家公司的真正实力与创造力。AI新词MetaOpenAIGoogleDeepMind本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19052苹果新Speech API转录速度惊人,胜过OpenAI Whisper 55%
2025年6月18日 12:00
苹果新Speech API转录速度惊人,胜过OpenAI Whisper 55%AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 18, 202532科技媒体 macstories 发布了一篇关于苹果新推出的 Speech API 的博文,引发了业界的广泛关注。通过对一段时长34分钟、大小达7GB 的4K 视频文件进行转录测试,结果显示,苹果的新 Speech API 仅耗时45秒,速度远超其他同类工具。相较之下,OpenAI 的 Whisper 转录时间为101秒,苹果的技术优势可见一斑,提升了约55% 的效率。苹果在2025年全球开发者大会 WWDC 上首次宣布了这一 Speech 框架,框架中包含了 SpeechAnalyzer 和 SpeechTranscriber 两款模块。这一技术的推出,标志着苹果在语音处理领域的进一步突破,尤其是在速度和准确性方面的提升。在具体的测试中,媒体使用了基于新模块开发的 Yap 应用进行转录。通过对比不同工具的表现,Yap 以45秒的快速转录时间,成为了市场上表现最优的选择。相对而言,MacWhisper(基于 OpenAI 的 Whisper 开源语音转录模型)需要1分41秒,而 VidCap 则需要1分55秒。更早版本的 MacWhisper(V2)甚至要耗时3分55秒。虽然所有测试工具在识别专有名词时都出现了一定误差,比如 AppStories 的识别,但 Yap 在本地化运算上的优势,确保了其在处理多段视频时的效率更为显著。通过计算每周处理多段视频所节省的时间,用户可以显著提高工作效率。这项技术的快速发展,不仅为视频内容创作者提供了便利,也为后续的应用场景拓展奠定了基础。未来,随着 AI 技术的不断演进,苹果在语音识别领域可能会推出更多创新的解决方案,进一步提升用户体验。划重点: 苹果新 Speech API 转录34分钟4K 视频仅需45秒,速度超越竞争对手。 与 OpenAI Whisper 相比,苹果技术提升了约55% 的效率,表现显著。 本地化运算优势使 Yap 在多段视频处理上效率更高,为用户节省大量时间。SpeechAPI苹果OpenAIWhisper本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19051特斯拉Grok车载 AI 助手即将上线,个性化定制让驾驶更有趣
2025年6月18日 12:00
特斯拉Grok车载 AI 助手即将上线,个性化定制让驾驶更有趣AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 18, 202539近日,特斯拉的 Grok 车载 AI 助手引起了广泛关注,预计将为车主带来全新的智能体验。根据最新的消息,尽管该助手尚未正式集成到特斯拉汽车中,但从固件代码中发现的线索表明,Grok 将具备极具互动性的功能,并在不久的将来与用户见面。特斯拉首席执行官埃隆马斯克早前透露,Grok 将会加入特斯拉车型,为驾驶者提供更为丰富的交流方式。通过与车辆的对话,用户将能够询问几乎任何问题,开启一段全新的智能出行体验。可以说,Grok 不仅仅是一个普通的助手,它将打破人与车之间的传统界限,让汽车更像一个可以聊天的伙伴。有趣的是,Grok 还将提供多种个性化定制选项。特斯拉黑客 green 通过对固件的分析,发现 Grok 将支持不同的 个性 版本,用户可以根据自身的需求调整助手的性格。这一设计将使每位车主能够获得独特的互动体验。此外,针对家庭用户,Grok 还将推出儿童模式,配备讲故事和猜谜等功能,让小朋友在车内也能享受乐趣。不过,值得注意的是,Grok 目前似乎仅限于基于 AMD 芯片的特斯拉车型。也就是说,使用英特尔芯片的老款车型将无法享受这一新功能。这一消息对老款车主来说,或许是个小小的遗憾,但也同时意味着新车型将享受到更强大的智能科技。随着特斯拉不断推进 Robotaxi 平台的计划,Grok 的上线也变得愈发紧迫和重要。这不仅是智能出行的进一步发展,也可能是推动车载 AI 技术走向成熟的关键一步。Grok特斯拉AI助手车载AI本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19050Meta 携手 Prada 等奢侈品牌推出新一代智能眼镜,AI 技术助力时尚潮流
2025年6月18日 12:00
Meta 携手 Prada 等奢侈品牌推出新一代智能眼镜,AI 技术助力时尚潮流AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 18, 202541近日,根据美国 CNBC 的报道,Meta 公司与依视路陆逊梯卡集团联合推出了一款全新智能眼镜,计划涵盖多个奢侈品牌,如 Prada 和 Oakley。这款眼镜将搭载最新的生成式 AI 技术,旨在为消费者带来更高端的穿戴体验。Meta 在社交媒体上发布了名为 Oakley|Meta 的 Instagram 账号,并预告将在6月20日正式揭晓这款新产品。该系列智能眼镜将主要面向运动爱好者,Meta 观察到许多 Ray-Ban 用户在打网球、滑雪等运动场合使用智能眼镜拍摄。基于这一发现,Meta 决定更加聚焦于活跃型消费群体。据了解,Oakley 系列的智能眼镜预计售价约为360美元(折合人民币约2586元)。与 Ray-Ban 系列相比,新款眼镜在耐候性方面有所提升,并将采用与2023年发布的 Ray-Ban Meta 眼镜类似的技术配置。知情人士透露,这款新产品的具体细节尚未对外公开,但预计将吸引众多运动爱好者的关注。依视路陆逊梯卡集团总部位于法国与意大利,旗下拥有 Ray-Ban、Oakley、Vogue Eyewear 和 Persol 等多个知名品牌,同时与全球150多个品牌建立了授权合作关系。Meta 与该集团的合作始于2019年,并于2021年推出了首代 Ray-Ban 智能眼镜。随着2023年搭载 Meta AI 语音助手的第二代产品问世,市场认可度逐渐上升。这款新版本能够在连接智能手机后,识别地标、分析食材并获取菜谱,同时支持通过 WhatsApp 和 Messenger 发送语音信息。值得注意的是,Meta 与依视路陆逊梯卡计划在今年年底前推出第三代智能眼镜。这款新眼镜预计体积更大,且有望在镜片中内置小型显示屏,为用户提供更多功能。划重点: Meta 与奢侈品牌 Prada、Oakley 联合推出新一代智能眼镜,搭载生成式 AI 技术。 新款眼镜主要面向运动爱好者,售价约为360美元,耐候性更强。 第三代智能眼镜预计于年末前发布,体积更大,功能更丰富。生成式AI智能眼镜PradaOakley本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19047告别AI感!Krea1公测开放,超现实纹理与细节、多样化艺术风格
2025年6月18日 12:00
告别AI感!Krea1公测开放,超现实纹理与细节、多样化艺术风格AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 18, 202567近日,Krea AI宣布其首款图像生成模型Krea1的公测版已正式向所有用户开放。这一突破性AI图像生成工具以其卓越的美学控制力和高品质输出引发行业热议,成为创作者和开发者探索AI艺术创作的新选择。Krea1由Krea AI与Black Forest Labs(FLUX系列开发者)合作打造,旨在解决传统AI图像生成中的AI感问题。相较于传统模型常出现的柔和纹理、过高对比度或单调构图,Krea1通过技术创新实现了以下核心突破:超现实纹理与细节:生成图像支持1.5K原生分辨率,并可通过增强功能提升至4K超高清,呈现细腻的皮肤纹理、逼真的材质和复杂场景的清晰细节。多样化艺术风格:从摄影级真实感到抽象艺术,Krea1能够精准理解复杂艺术风格需求,避免生成千篇一律的AI图像。个性化定制支持:支持风格参考和自定义训练,用户可上传参考图像或数据集,实时调整生成结果,赋予创作者更大控制力。据Krea AI官方介绍,Krea1的训练过程注重美学多样性与艺术表达,力求让AI生成图像摆脱程式化外观,真正服务于创意需求。免费公测:降低创作门槛为让更多用户体验这一前沿技术,Krea AI推出免费公测计划,无需复杂注册或付费即可试用Krea1。用户只需通过文本提示或图像输入,即可快速生成高品质视觉作品。这一举措不仅降低了技术门槛,还为专业设计师、内容创作者和普通用户提供了探索AI艺术的绝佳机会。值得一提的是,Krea1的实时生成与编辑功能让创作过程更加流畅。用户可即时调整提示词或风格参数,生成结果几乎实时呈现,大幅提升创作效率。行业影响:赋能创意新生态Krea1的发布不仅是一项技术突破,更是对创意产业的深刻赋能。其高品质输出和灵活定制功能使其适用于电商产品图、个性化插图、电影场景设计等多个领域。行业专家预测,Krea1将推动AI与创意产业的深度融合,助力更多人将想象力转化为现实。与Midjourney、Stable Diffusion等主流工具相比,Krea1在实时编辑和用户友好性上更具优势。尽管Midjourney在风格多样性上表现突出,Stable Diffusion则以开源灵活性见长,但Krea1凭借其直观界面和专业级输出,正在成为创意工作者的新宠。未来展望:持续创新可期Krea AI表示,将持续收集社区反馈,优化Krea1的性能,并计划推出更多高级功能,如3D感知渲染等。结合其此前在AI视频生成、图像增强等领域的探索,Krea AI正致力于打造一站式AI创意平台,为用户提供从图像到视频、甚至音频的全面创作支持。AIbase编辑认为,Krea1的开放标志着AI图像生成技术迈向更普惠、更专业的新阶段。无论您是专业创作者还是AI艺术爱好者,Krea1都值得一试。KreaAIKrea1BlackForestLabsAI图像生成本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19046百度首推双数字人互动直播间,文心大模型4.5T驱动多模态技术新突破
2025年6月18日 12:00
百度首推双数字人互动直播间,文心大模型4.5T驱动多模态技术新突破AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 18, 202587近日,百度在人工智能领域再下一城,推出了全球首个双数字人互动直播间。这一创新应用基于百度文心大模型4.5Turbo(以下简称4.5T),通过语言、声音和形象的多模态高度融合,实现了数字人与用户之间的自然、流畅互动,为直播行业带来了全新可能。AIbase结合网络最新信息,深入解析这一技术突破及其对行业的深远影响。双数字人直播间:多模态技术的全新舞台百度双数字人互动直播间是文心大模型4.5T的最新应用成果。该直播间通过两个数字人主播协同工作,展现了语言生成、语音合成以及虚拟形象实时渲染的强大能力。无论是实时对话、情感表达,还是与观众的动态互动,数字人都能做到自然流畅,宛如真人。据悉,这一技术依托文心4.5T的多模态联合建模能力,能够同时处理文本、图像和音频输入输出,确保声音与口型、表情与语义的高度一致。与传统数字人相比,百度双数字人直播间在交互性上实现了质的飞跃。数字人不仅能根据用户提问生成实时回答,还能通过情感分析调整语气和表情,甚至在直播中进行即兴表演或协同解说。这种多模态协同优化的特性,让直播内容更具吸引力和沉浸感,为电商、娱乐、教育等领域提供了全新的内容创作方式。文心大模型4.5T:多模态技术的核心引擎文心大模型4.5T作为百度最新一代原生多模态大模型,是驱动双数字人直播间的核心技术。据网络信息,文心4.5T在理解、生成、逻辑推理和记忆四大核心能力上全面升级,特别是在多模态理解和跨模态迁移能力上表现突出,超越了OpenAI的GPT-4.5和DeepSeek的V3等竞品。具体而言,文心4.5T通过多模态联合建模,实现了对文本、图像、音频等多种数据的统一处理。相比前代模型,其推理速度提升了30%,训练成本降低了80%,API调用价格仅为GPT-4.5的1%,为企业和开发者提供了高性价比的解决方案。此外,文心4.5T引入了自反馈增强技术框架,通过训练-生成-反馈-增强的闭环迭代,显著降低了模型幻觉,提升了复杂任务的处理能力。行业影响:重塑直播与内容创作生态百度双数字人互动直播间的推出,不仅是技术层面的突破,更对直播行业和内容创作生态产生了深远影响。网络评论指出,双数字人直播间能够大幅降低内容制作成本,同时提升内容的多样性和个性化。例如,在电商直播中,数字人可以全天候在线,自动生成符合品牌调性的营销文案和互动内容;在教育领域,数字人主播可通过多模态技术为学生提供沉浸式学习体验。与此同时,文心4.5T的低成本和高性能也为中小企业和开发者提供了更多可能性。百度智能云千帆平台已上线文心4.5T的API接口,企业用户可通过低代码配置快速开发定制化智能应用。此外,百度计划于2025年6月30日开源文心4.5系列,进一步降低技术门槛,推动多模态AI在各行业的广泛应用。未来展望:多模态AI的无限可能百度双数字人互动直播间的成功,标志着多模态AI从实验室走向实际应用的里程碑。AIbase认为,文心大模型4.5T的突破不仅提升了数字人技术的交互体验,也为AI在文化传承、虚拟现实和智能客服等领域的应用打开了新局面。例如,百度已与中国文物交流中心合作,基于文心大模型推出文博智能体,让文物知识通过数字人以更生动的方式呈现。随着文心大模型5.0的研发提上日程,业界普遍期待百度在多模态AI领域带来更多创新。百度文心大模型4.5Turbo数字人AIbase本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19043