蚂蚁开源轻量级MoE推理模型Ring-lite
2025年6月21日 18:00
蚂蚁开源轻量级MoE推理模型Ring-liteAIbase基地发布于AI新闻资讯·1分钟阅读·Jun 21, 202527近日,蚂蚁技术团队宣布正式开源其轻量级推理模型Ring-lite。该模型在多项推理榜单上取得了显著成绩,实现了轻量级推理模型的SOTA效果,再次验证了MoE架构的推理潜力。Ring-lite以蚂蚁技术此前发布的Ling-lite-1.5为起点,该模型采用MoE架构,总参数为16.8B,但激活参数仅2.75B。凭借独创的C3PO强化学习训练方法,Ring-lite在AIME24/25、LiveCodeBench、CodeForce、GPQA-diamond等多项推理榜单上表现优异,比肩3倍激活参数大小的10B以下Dense模型。在技术实现上,Ring-lite团队进行了多项创新。首创的C3PO强化学习训练方法有效解决了RL训练中回复长度波动导致的优化难题,显著改善了训练不稳定和吞吐波动问题。同时,团队还探讨了Long-CoT SFT与RL的黄金训练比重,从token efficiency角度提出了基于entropy loss来平衡训练效果和样本效率的方案,进一步提升了模型性能。此外,Ring-lite还直面了多领域数据联合训练的难题,系统验证了混合训练与分阶段训练的优劣边界,在数学、代码、科学三重领域实现了协同增益。在多项复杂推理任务中,Ring-lite均展现出了出色的性能,尤其在数学推理和编程竞赛方面,得分领先于对比模型。为了验证Ring-lite的实际应用效果,团队还进行了高考数学和物理题的测试。结果显示,Ring-lite在数学全国一卷上可以获得130分左右的成绩,表现优异。蚂蚁技术团队表示,Ring-lite的开源不仅包含了模型权重和训练代码,还将逐步公开所有训练数据集、超参配置乃至实验记录。这可能是轻量级MoE推理模型首次实现全链路透明化,为相关领域的研究人员提供了宝贵的参考资源。GitHub:https://github.com/inclusionAI/RingHugging Face:https://huggingface.co/inclusionAI/Ring-liteModelScope:https://modelscope.cn/models/inclusionAI/Ring-lite本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19135月之暗面Kimi推出Kimi-Researcher深度研究Agent 并开启内测
2025年6月21日 12:00
月之暗面Kimi推出Kimi-Researcher深度研究Agent 并开启内测AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 21, 202559近日,月之暗面旗下的Kimi智能助手宣布其首个Agent产品Kimi-Researcher(深度研究)正式开启小范围灰度测试。这一基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型,旨在为用户提供高效、深入的深度研究服务。Kimi-Researcher在面对问题时,展现出强大的自主规划与执行能力。它不仅能够主动澄清问题、深入思考,还能自主规划关键词进行搜索,并筛选出高质量的信息。在处理任务时,Kimi-Researcher平均会进行23步推理,规划74个关键词,并找到206个网址,最终只保留信息质量最高的前3.2%内容。这一过程确保了研究成果的详实与可溯源性。除了强大的信息搜索与筛选能力外,Kimi-Researcher还能自主调用浏览器、代码等工具,处理原始数据并自动生成分析结论。其交付成果包括一份信息详实、可溯源的深度研究报告,以及一个可交互、可分享的动态可视化报告。这些报告不仅长度在万字以上,平均引用约26个高质量信源,还支持在线生成链接并分享,极大地方便了用户的展示与协作需求。为了验证Kimi-Researcher的真实能力,月之暗面为其安排了一场高难度的考试Humanitys Last Exam(HLE)。这套专为AI设计的高难度benchmark覆盖了上百个专业领域,从数学、物理、医学到政治、历史,全面考察模型在复杂知识任务中的解决能力。Kimi-Researcher在完全零结构、无流程设计的设置下,取得了Pass@1准确率26.9%、Pass@4准确率40.17%的优异成绩,超越了多个知名AI模型,达到了目前已知的最高水平之一。在真实场景的应用中,Kimi-Researcher同样展现出了出色的表现。无论是算法同学寻找高价值的benchmark、运营同学研究行业内的公司发展,还是法务朋友快速了解各国数据隐私法规,Kimi-Researcher都能在短时间内生成结构清晰、信息全面的报告,为用户提供有力的支持。月之暗面表示,Kimi-Researcher是通过端到端强化学习训练出来的Agent模型,具有零结构、自适应的特点。它没有复杂的提示词或预设流程,而是完全依靠模型自身的试错与学习来应对复杂任务。这种设计使得Kimi-Researcher在面对信息冲突、工具切换和环境变化时,能够展现出强大的适应性与泛化能力。目前,Kimi-Researcher正处于小范围灰度测试阶段。用户可以通过访问kimi.com申请内测资格,并在获得权限后打开Kimi对话框下方的深度研究按钮开始使用。Kimi-Researcher端到端自主强化学习Agent模型月之暗面本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19134中央网信办强化AI技术监管,处理 3700 多个违规账号
2025年6月20日 21:00
中央网信办强化AI技术监管,处理 3700 多个违规账号AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 20, 202541近期,中央网信办发起了 清朗整治 AI 技术滥用 专项行动,自2025年4月以来,针对 AI 技术的滥用现象进行了一系列整治工作。该行动重点关注了 AI 换脸、拟声等技术对公众权益的侵犯,以及缺乏内容标识导致的公众误导等问题。经过第一阶段的努力,各地网信部门联合发力,成果显著。图源备注:图片由AI生成,图片授权服务商Midjourney在整治过程中,累计处置了3500余款违规小程序、应用程序和智能体,清理了超过96万条违法违规信息,并对3700多个违规账号进行了处理。这一系列措施旨在切断违规产品的营销引流渠道,促使各大网站平台加强技术安全保障,并加快生成合成内容标识的落地。各地网信办采取了多种措施积极推进整治工作。例如,北京网信办开设了举报渠道,形成了 用户标记 平台核查 联合处置 的工作模式,成功处理了26个举报案例。上海网信办则组织了法规宣贯活动,覆盖了400余家企业,确保显式标识规范的上线。浙江网信办针对 AI 应用和网站平台加强了督导,累计拦截和清理了超过2550万条违法信息。各大平台也在积极履行责任,腾讯公司规范了应用程序管理,优化了巡查机制,处置了570余款违规产品。微博通过多种审核渠道,清理了4800余条违规内容。抖音建立了 红蓝对抗 机制,修复了潜在安全漏洞,提升了对虚假信息的识别能力。划重点: 清朗整治 AI 技术滥用 专项行动自2025年4月启动,处理3700多个违规账号。第一阶段整治中共处置3500余款违规 AI 产品,清理超96万条违法信息。 各地网信办积极采取措施,推动显式标识规范及平台责任落实,确保网络安全。AI换脸Midjourney清朗行动违规小程序本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19133华为云发布盘古 5.5:三元组编码架构引领预测大模型新潮流!
2025年6月20日 18:00
华为云发布盘古 5.5:三元组编码架构引领预测大模型新潮流!AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 20, 202524在刚刚结束的华为开发者大会2025(HDC2025)上,华为常务董事兼华为云计算 CEO 张平安重磅推出了盘古大模型5.5,这一新版本带来了令人振奋的技术升级。张平安表示,此次发布的核心亮点在于采用了华为首创的 Triplet Transformer 统一预训练架构。这项新架构的神奇之处在于它能够将来自不同行业的多种数据类型进行统一处理。这包括工艺参数的表格数据、设备运行日志的时间序列数据以及产品检测的图片数据。通过对这些数据进行三元组编码,盘古大模型在同一框架内实现了高效的处理和预训练,大幅提升了模型的预测精度。图源备注:图片由AI生成,图片授权服务商Midjourney随着数据的多样化,传统模型常常面临处理效率低、泛化能力不足等挑战。而盘古5.5的推出,不仅大幅提升了模型的精度,还显著增强了其跨行业、跨场景的泛化能力。张平安强调,这一架构的成功实现,为各行各业的数据分析提供了新的解决方案,让人工智能的应用场景更加广泛。华为云的这一创新不仅为预测性分析的精确度打下了基础,同时也为企业在数字转型过程中提供了更多可能。随着大数据的不断涌现,盘古5.5将帮助更多企业抓住机遇,实现智能化转型,提升市场竞争力。在未来,华为云计划进一步扩展盘古大模型的应用领域,助力更多行业实现数字化升级。张平安坚信,随着技术的不断进步,盘古大模型将成为行业内不可或缺的智能分析工具。盘古大模型TripletTransformer华为Mi本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19132华为发布盘古大模型5.5:五大基础模型升级 深度思考模型将上线
2025年6月20日 18:00
华为发布盘古大模型5.5:五大基础模型升级 深度思考模型将上线AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 20, 202565在今日下午举行的华为开发者大会HDC2025主题演讲中,华为常务董事、华为云计算CEO张平安宣布正式发布盘古大模型5.5,标志着自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型迎来全面升级。盘古自然语言处理NLP大模型方面,全新的718B深度思考模型作为由256个专家组成的MoE大模型,在知识推理、工具调用、数学等领域的能力实现大幅提升,处于行业领先地位。盘古大模型基于昇腾云的全栈软硬件训练而成,彰显了昇腾架构打造世界一流大模型的实力。此外,盘古大模型5.5在高效长序列、低幻觉、快慢思考融合、Agent等特性上进行了升级,通过自适应快慢思考合一技术,使模型能根据问题难易程度自动切换思考模式,整体推理效率提升8倍。盘古深度研究DeepDiver借助长链难题合成、渐进式奖励等技术,在网页搜索、常识性问答等应用上展现出高效执行能力,如5分钟内完成超过10跳的复杂问答、生成万字以上专业调研报告,显著提升了工作效率。在盘古预测大模型领域,采用业界首创的triplet transformer统一预训练架构,对不同行业的数据进行统一编码和处理,极大提升了预测精度和跨行业、跨场景的泛化性。盘古科学计算大模型方面,华为云持续深化其与科学应用领域的结合。深圳气象局基于盘古升级了智霁大模型,实现AI集合预报,更直观地反映天气系统演变可能性,减少预报误差。重庆市气象局针对成渝地区降水特点,打造了天资12h气象大模型,提升灾害天气日内预报预警能力。深圳能源则采用盘古进行中短期风光水发电量预测,减少弃电现象,提升能源开发效率。盘古计算机视觉CV大模型方面,华为云发布了全新MoE架构的300亿参数视觉大模型,这是目前业界最大的视觉模型,全面支持多维度、泛视觉的感知、分析与决策。同时,盘古CV大模型通过跨维度生成模型,构建了工业场景稀缺的泛视觉故障样本库,极大提升了业务场景的可识别种类与精度。盘古多模态大模型方面,全新发布了基于盘古多模态大模型的世界模型,为智能驾驶、具身智能机器人的训练构建数字物理空间,实现持续优化迭代。在智能驾驶领域,盘古世界模型能生成大量训练数据,无需依赖高成本的路采,为智能驾驶的发展提供了有力支持。此外,在华为云盘古大模型5.5发布后,其进一步拓展应用场景,推出了五款具备深度思考能力的行业自然语言大模型。这五款大模型分别为盘古医学Thinking大模型、盘古金融Thinking大模型、盘古政务Thinking大模型、盘古工业Thinking大模型以及盘古汽车Thinking大模型,旨在为不同行业提供更专业、更智能的自然语言处理解决方案。据悉,这五款大模型很快将正式上线,届时将为各行业带来更加高效、精准的自然语言处理体验。盘古大模型华为开发者大会AI新词昇腾本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19131ChatGPT 新笔记工具发布:隐形记录,智能整理会议精华
2025年6月20日 18:00
ChatGPT 新笔记工具发布:隐形记录,智能整理会议精华AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 20, 202593OpenAI 旗下热门 AI 工具 ChatGPT 推出了一项备受期待的新功能笔记工具,专为会议记录、头脑风暴和个人笔记管理设计。这一功能目前仅在 ChatGPT 的 macOS 桌面应用程序中可用,为用户提供了一种高效、无缝的信息整理方式。隐形记录,智能整理ChatGPT 的新笔记工具主打隐形记录体验,用户只需在 macOS 桌面应用中点击聊天窗口右侧的圆形图标,即可启动录音模式。工具会在后台自动转录会议或讲座的音频内容,并实时分析提取关键信息,生成结构化的笔记。这些笔记会直接保存至 ChatGPT 的 Canvas 界面,方便用户随时查看和编辑。这一功能无需额外机器人加入会议,确保了会议的私密性和自然性。与传统笔记工具相比,ChatGPT 的笔记功能利用了其强大的自然语言处理能力,不仅能生成精确的转录文本,还能根据用户需求提炼关键点、行动项或总结报告。例如,用户可以通过提示词要求工具列出会议中的所有决定或总结关键讨论内容,从而快速获取结构化的信息输出。逐步开放,面向专业用户据 OpenAI 官方消息,该笔记工具已于2025年6月4日向 Team 用户先行开放,并于6月18日起扩展至 Pro、Enterprise 和 Edu 用户。这一分阶段的发布策略显示了 OpenAI 对功能稳定性和用户体验的重视。目前,该功能仅限于 macOS 平台,移动端和 Windows 版本的支持计划尚未公布。值得注意的是,ChatGPT 的笔记工具与 OpenAI 近期升级的记忆功能相结合,可参考用户的历史对话记录,提供更个性化的笔记生成体验。这意味着工具能够根据用户的工作习惯和偏好,自动调整笔记的格式和内容,进一步提升效率。市场反馈与竞品对比Twitter 上的讨论显示,用户对 ChatGPT 新笔记工具的反应总体积极。许多用户称赞其无缝的转录能力和智能总结功能,认为它在处理冗长会议记录时尤为高效。一位用户表示:相比手动记录,ChatGPT 的笔记工具让我能专注于会议本身,事后还能快速获取清晰的总结。然而,也有用户指出,与 Granola、Notion 等专业笔记工具相比,ChatGPT 的功能在某些场景下仍显基础。例如,Granola 提供了更强大的实时协作功能,而 Notion 则在文档管理和多平台支持上更胜一筹。尽管如此,ChatGPT 凭借其与 AI 模型的深度整合和灵活的提示词功能,仍为用户提供了独特的使用体验。更广泛的应用潜力除了会议记录,ChatGPT 的笔记工具还适用于多种场景。例如,学生可利用其整理讲座笔记,快速生成学习材料;研究人员则可通过上传文本或视频内容,提取关键信息并生成思维导图。此外,结合 OpenAI 的 API,该工具还可集成至 Slack、Google Docs 等工作流平台,进一步提升生产力。AIbase 认为,ChatGPT 的笔记工具不仅是对现有功能的扩展,更是 OpenAI 向更智能、代理式 AI 助手迈进的重要一步。未来,随着工具的跨平台支持和功能优化,其在教育、企业和个人知识管理领域的应用潜力将进一步释放。AI新词:ChatGPTAI新词:CanvasAI新词:隐形记录品牌产品词:macOS桌面应用程序本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19129华为发布全新鸿蒙智能体 首批50余款应用即将推出
2025年6月20日 18:00
华为发布全新鸿蒙智能体 首批50余款应用即将推出AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 20, 2025115今日下午,在华为开发者大会HDC2025主题演讲中,华为正式发布全新鸿蒙智能体,为消费者与鸿蒙系统、应用的交互带来全新可能。基于鸿蒙智能体,消费者与鸿蒙系统、应用的交互模式将发生根本性转变。鸿蒙智能体具备系统级安全可信、自主可控的个性化特质,能够实现多智能体间的高效协同以及多设备间的自然流转,从而真正将交互模式从传统的以用户指令为中心转变为以用户意图为中心。从官方公布的数据可知,首批50多个鸿蒙智能体即将上线,这些智能体广泛覆盖效率工具、教育医疗、娱乐互动、金融理财、购物种草、城市探索、生活服务等多个领域,能满足不同用户在各种场景下的需求。在分发入口方面,鸿蒙智能体提供了导航条、小艺语音对话等多种方式。以部分智能体为例,ChatExcel智能体让用户仅通过聊天就能轻松处理Excel和进行数据分析;大众点评智能体则配备了吃货小助理,用户想吃什么只需询问即可获得推荐;码上飞智能体更是降低了开发门槛,让人人都有机会成为鸿蒙开发者。此次全新鸿蒙智能体的发布,无疑将为鸿蒙生态的发展注入新的活力。华为开发者大会鸿蒙智能体鸿蒙系统HDC2025本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19128突破传统的健康监测,Ottai推出AI智能穿戴设备助力慢性病管理
2025年6月20日 18:00
突破传统的健康监测,Ottai推出AI智能穿戴设备助力慢性病管理AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 20, 202537近日,来自牛津的创新企业 Ottai 宣布推出一款颠覆性的 AI 智能穿戴设备,旨在彻底改变慢性病的管理方式。这款先进的生物传感器能够持续监测关键的健康指标,通过人工智能进行实时分析,为用户提供个性化的生活建议。与传统的慢性病监测方法不同,Ottai 的生物传感器摒弃了繁琐的手动输入和定期的实验室检测,转而采用持续监测和 AI 驱动的个性化反馈。这款设备集成了深度学习算法,能够处理大量的实时生物数据和健康记录,为用户提供切实可行的健康建议。用户不仅可以通过智能设备实时跟踪关键健康指标,例如血糖水平,还能及时识别高血糖和低血糖的状况。图源备注:图片由AI生成,图片授权服务商Midjourney这款生物传感器的一大亮点在于其语音激活功能。用户可以通过语音命令与设备互动,轻松记录健康数据和饮食习惯,同时还可以提出个性化问题,获取即时的、实用的健康建议。Ottai 的研究科学家王博士表示:Ottai 生物传感器标志着向可扩展、以患者为中心的护理迈出了关键一步,它结合了生物传感技术和 AI,为患者提供了一种动态、适应性的工具,以支持长期的慢性病管理。此外,这款生物传感器与 AI 驱动的应用程序无缝整合,不仅支持实时的血糖监测,还提供个性化的健康见解,帮助用户更好地管理糖尿病。用户可以通过 AI 算法获取关于生活方式、饮食和运动的建议,从而优化健康结果。Ottai 旨在通过其先进、易于使用的解决方案,赋予个人在慢性病管理中更大的主动权,使健康监测变得更加可及和个性化。OttaiAI智能穿戴设备生物传感器慢性病管理本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19127索恩的 千亿美元 人工智能机器人梦工厂将落户亚利桑那
2025年6月20日 18:00
索恩的 千亿美元 人工智能机器人梦工厂将落户亚利桑那AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 20, 202543在全球科技领域,软银创始人孙正义正酝酿一个大胆的计划。他希望与台湾半导体制造公司(TSMC)携手,打造一个价值高达1万亿美元的工业园区,地点选在美国亚利桑那州。这个新型的制造中心将专注于人工智能和机器人技术,可能成为孙正义最大的投资项目。根据知情人士透露,孙正义的设想是建立一个类似中国深圳的庞大制造基地,旨在将高科技制造业带回美国。这个工业园区的核心是将包括人工智能驱动的工业机器人在内的生产线,意图吸引科技巨头和初创公司共同参与这一前景广阔的事业。孙正义对于未来科技的愿景并不局限于机器人本身。他认为,人工智能将重新定义生产力,改变我们的工作和生活方式。他希望通过这个项目,将最新的技术和创新带入传统制造业,创造出一种全新的智能制造生态。与此同时,这一计划也回应了美国政府对于重振本土制造业的呼声。近年来,随着全球供应链的变化,越来越多的企业意识到,将生产线搬回美国不仅可以降低对外依赖,还能更好地控制产品质量和生产效率。孙正义的工业园区恰好抓住了这一趋势,可能会成为吸引全球投资者的重要目的地。软银的这一举措不仅是对科技未来的大胆预测,也是对美国制造业复兴的强有力支持。如果这一计划得以落实,亚利桑那州或许会成为未来全球科技创新的中心,推动整个行业的变革。软银TSMC人工智能机器人本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19126宇树科技近期已完成C轮融资交割
2025年6月20日 18:00
宇树科技近期已完成C轮融资交割AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 20, 202575据媒体报道,宇树科技已完成其 C 轮融资交割,标志着自去年9月以来的融资活动圆满结束。这轮融资由中国移动旗下基金、腾讯、阿里、蚂蚁金服、吉利资本等多家知名投资机构共同领投,绝大部分老股东也积极跟投。这一消息引起了市场的广泛关注,据最新消息,宇树科技的投前估值目前已超过100亿元人民币,有投资人表示,这一估值依然显得保守。图源备注:图片由AI生成,图片授权服务商Midjourney自2016年成立以来,宇树科技已完成了9轮融资。上一轮融资时,公司估值为80亿元,但在过去的半年中,宇树科技的表现引人瞩目,成为人形机器人领域最受关注的公司之一。随着融资的完成,业界也在猜测宇树科技是否会在未来选择上市。根据公司与合作伙伴的沟通,宇树科技已经将杭州宇树科技有限公司更名为杭州宇树科技股份有限公司,业内人士认为这可能是公司为上市做准备的信号。在与香港特区政府的交流中,宇树科技创始人王兴兴提到公司在香港有业务,并与多个合作伙伴探讨未来的合作机会。虽然王兴兴对在香港上市表示 有可能但不确定,但他对未来的发展充满信心。宇树科技人形机器人C轮融资中国移动本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19125昆仑万维发布并开源 Skywork-SWE-32B:开源软件工程智能体模型引领新风潮
2025年6月20日 15:00
昆仑万维发布并开源 Skywork-SWE-32B:开源软件工程智能体模型引领新风潮AIbase基地发布于AI新闻资讯·1分钟阅读·Jun 20, 202519.1k在软件工程领域,昆仑万维于6月20日正式发布了其自主研发的代码智能体基座模型 Skywork-SWE-32B,并将其开源。该模型在软件工程任务中表现卓越,成为业界在32B 参数规模下最强的代码修复能力模型。昆仑万维团队通过构建超过1万个可验证的 GitHub 仓库任务实例,创造了目前规模最大的可验证数据集,系统地验证了大模型在软件工程任务上的数据缩放定律。Skywork-SWE-32B 在 SWE-bench Verified 基准上取得了38.0% 的 pass@1准确率,这一成绩刷新了 Qwen2.5-Coder-32B 系列模型在 OpenHands 代码框架下的最佳记录。通过引入测试时扩展技术,该模型的表现进一步提升至47.0% 的准确率,不仅超过了目前在32B 参数规模以下的开源模型,也缩小了与一些闭源模型之间的性能差距。昆仑万维团队针对当前市场上 SWE 任务的主流数据集存在的问题,建立了一套三阶段的自动化流程来收集和验证训练数据。在数据采集阶段,他们通过 GitHub API 抓取了超过15万个开源仓库的信息,并通过一系列严格的筛选步骤,最终保留了23,389个任务样本。在验证阶段,团队使用统一命令生成和 Docker 环境构建技术,确保每个任务样本的有效性,最终生成了10,169条高质量样本。在智能体轨迹生成阶段,团队使用开源的 OpenHands 框架,结合商用大模型作为基座,对每个任务执行了多轮交互,全面记录智能体的解决过程。最终,他们构建出8,209条高质量的验证通过轨迹,为 Skywork-SWE-32B 的训练提供了坚实基础。Skywork-SWE-32B 的成功发布,为软件工程智能体的发展注入了新的活力,展现了其在处理复杂开发场景下的能力与潜力。博客地址https://quixotic-sting-239.notion.site/eb17f379610040ceb54da5d5d24065bdHuggingFace地址https://huggingface.co/Skywork/Skywork-SWE-32B划重点: Skywork-SWE-32B 模型在 SWE-bench Verified 基准上取得38.0% 的 pass@1准确率,刷新了现有32B 开源模型的最佳成绩。 引入测试时扩展技术后,模型的准确率提升至47.0%,显著缩小了与闭源模型的性能差距。 昆仑万维建立了自动化流程,构建出超1万条高质量、可验证的 SWE 任务数据集,为模型的训练奠定了基础。AI新词品牌产品词Skywork-SWE-32B昆仑万维本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19124小扎出手挖人!Meta 新目标锁定Ilya公司CEO
2025年6月20日 15:00
小扎出手挖人!Meta 新目标锁定Ilya公司CEOAIbase基地发布于AI新闻资讯·1分钟阅读·Jun 20, 202550在人工智能领域,扎克伯格(小扎)最近的动作引发了广泛关注。他不仅希望收购 Ilya Sutskever 的初创公司 安全超智能(SSI),而且在收购未果后,竟然转而挖角了 SSI 的 CEO 丹尼尔格罗斯(Daniel Gross)。据了解,丹尼尔格罗斯是 SSI 的创始团队之一,拥有辉煌的背景,曾担任苹果的机器学习总监以及 YC AI 项目的负责人。2023年,格罗斯还被《时代》杂志评选为 人工智能领域最具影响力的人物 之一。这次的挖角行动显示了 Meta 在 AGI(通用人工智能)领域的强烈决心。图源备注:图片由AI生成,图片授权服务商Midjourney除了格罗斯,Meta 还向前 GitHub 首席执行官纳特弗里德曼(Nat Friedman)伸出了橄榄枝,并计划投资他们共同管理的风险投资基金 NFDG。这个基金之前已经投资了 SSI 等一系列 AI 初创企业,显示出 Meta 在人才和资金方面的全方位布局。格罗斯的离职令外界感到意外,因为 SSI 在最近的融资中估值高达320亿美元。尽管如此,格罗斯还是选择了投身 Meta 的超级智能团队,而 Ilya 及其团队则拒绝了小扎的邀请。这让不少人开始怀疑,SSI 的高估值是否存在泡沫。小扎的猎头之路并非偶然。自从 Llama4模型遭到行业批评后,他意识到必须采取行动。他的策略就是用巨额薪水挖人,直接向竞争对手的顶尖人才发起挑战。Meta 计划组建一个约50人的超级智能团队,其中不乏来自谷歌和 OpenAI 的顶尖人才。当前 AI 人才的争夺愈演愈烈,而小扎的这一系列行动,正是他为 AGI 事业全力以赴的明证。未来,更多精彩的 抢人大战 可能还在后头。扎克伯格MetaAGIMidjourn本文来自AIbase日报扫码查看欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。由AIbase 日报组创作© 版权所有 AIbase基地 2024, 点击查看来源出处 -
信息源:AIBase 来源:https://www.aibase.com/zh/news/19123