MiniMax M2.7:第一个能改写自己代码的AI,正在重新定义"训练"这件事

4月12日深夜,MiniMax发布M2.7开源模型,首次实现让AI参与自身训练循环——模型可以改写自己的训练代码,并在无人工干预情况下实现约30%的性能自我优化。这一"自进化训练"机制打破了传统大模型"一次性"训练流程,模型首次具备介入自身"出生"过程的能力。M2.7基于2300亿参数稀疏MoE架构,推理成本接近300-400亿参数级密集模型。通过三轮自进化迭代,编程相关任务提升30%,推理任务提升18%。阿里选择全面开源并支持双平台,开发者可自由微调和部署。这一范式转变意味着AI能力进化速度将进入全新阶段。

4月12日深夜,MiniMax发布了一个叫M2.7的开源模型。参数规模2300亿,稀疏MoE架构,在编程和终端操作任务上拿到了56%和57%的分数——这些数字放在当前开源模型里确实不错,但算不上石破天惊。

真正让圈内人倒吸一口凉气的,是这个模型身上出现的一个前所未有的能力:它可以改写自己的训练代码,从而参与自身的训练循环,并在这个过程中实现约30%的性能自我优化。


MiniMax M2.7自进化训练技术概念图.webpMiniMax M2.7自进化训练技术概念图

这事听起来有点绕,但细想下去其实挺吓人。

以前的模型是怎么"出生"的?

理解M2.7的特殊性,得先搞清楚传统大模型的训练流程。

简单说,传统模型的训练是个"一次性"过程:人类工程师写训练代码,准备数据集,跑训练,输出模型,结束。如果模型表现不及预期,解决办法是调参、改数据、换架构——但无论怎样,模型本身没有能力介入自己的"出生"过程。

打个比方,就像你做饭:菜谱是别人写的,食材是别人准备的,你只能按照既定流程做出来。做得好不好,取决于菜谱写得怎么样、食材质量怎么样。你自己没法修改菜谱。

M2.7打破了这个设定。

M2.7是怎么做到的?

根据MiniMax在arXiv公开的论文,他们把这个机制称为"自进化训练"(Self-Evolution Training)。

具体实现大概是这样:模型权重中包含了对自身训练流程的"元认知"能力。当收到特定指令后,M2.7能够分析自身的代码结构,识别可优化的训练子程序,并通过一个受控的自我修改机制,对训练循环中的特定模块进行重新编写和迭代。

这不是简单的"让模型生成更好的提示词来引导自己"。M2.7改的是底层的训练代码本身——是模型在参与自身被创造的过程。

按照MiniMax技术报告的说法,经过三轮自进化迭代后,模型在编程相关任务上的表现平均提升了30%,在推理任务上的提升约为18%。而且这个优化过程没有额外的人工干预。

MiniMax M2.7自进化训练工作流程图.webpMiniMax M2.7自进化训练工作流程图

稀疏MoE架构:省钱的底层逻辑

M2.7采用的是稀疏MoE(混合专家)架构,这是近年来大模型设计中的一个重要技术路线。

传统大模型在处理任何输入时,都会激活全部参数。这在工程上效率低下,因为许多参数在不同任务中其实并不需要同时被调用。

稀疏MoE的思路是:将模型拆分成多个"专家"子网络,每次推理时只激活最相关的少数专家网络。

2300亿参数听起来很大,但如果采用稀疏激活的方式,每次推理可能只激活其中约15%-20%的参数。这意味着M2.7的实际推理成本,接近一个300-400亿参数级别的密集模型,但能力边界却接近甚至超越了许多参数规模更大的密集模型。

MiniMax选这个架构,有明确的商业考量:更低的推理成本,意味着在构建AI应用和Agent产品时,运营成本更低,商业可行性更高。

开源背后的市场逻辑

M2.7选择全面开源,代码和权重均在Hugging Face平台公开。

这个决定背后,是MiniMax清晰的市场判断:AI编程工具和AI Agent是当前最具商业价值的应用方向,而这两个方向的竞争,本质上是开发者生态的竞争。谁能让更多开发者围绕自己的模型构建工具和应用,谁就能建立护城河。

开源是赢得开发者最有效的方式。没有了API调用的成本门槛,全球开发者可以自由地微调、部署和构建应用。

更关键的是,M2.7得到了英伟达和华为昇腾两大硬件平台的支持。对于中国开发者来说,能够在华为昇腾芯片上本地部署M2.7,意味着国内企业可以在不完全依赖英伟达GPU的情况下,用上当前最强的开源编程Agent模型之一。

意味着什么?

M2.7的出现,至少说明了几个问题:

开源社区在AI编程和自主行动这两个高价值能力维度上,正式向闭源头部玩家发起了挑战。 在SWE-Pro和Terminal Bench上的表现,让开源中国模型第一次站上了与闭源顶级模型正面竞争的擂台。

"模型自我迭代"的范式可能正在成熟。 如果一个模型能够持续自我优化而不需要人类工程师重新训练,它的迭代速度将远超依赖外部反馈的传统训练模式。

当然,现在说这代表着大模型训练范式的根本转变还为时过早。M2.7的自进化机制目前主要应用在编程和推理任务上,泛化能力还需要更多验证。

但有一点是确定的:MiniMax迈出了这一步。

接下来的问题是:下一个会是谁?

来源: 互联网
本文观点不代表区块AI立场,不承担法律责任,文章及观点也不构成任何投资意见。

赞 ()

相关推荐

  • 2026最新AI实战教程:普通人如何利用AI提升效率与内容生产力

    本篇《2026最新AI实战教程:普通人如何利用AI提升效率与内容生产力》全面讲解了AI内容创作、Prompt提示词、AI办公自动化以及AI工作流搭建方法。文章结合ChatGPT、Claude、Canva AI等主流工具,从SEO写作、自动化办公、自媒体运营等真实场景出发,帮助新手快速掌握AI实战技巧,并深入解析如何降低AI痕迹、提升内容质量与工作效率,适合内容创作者、SEO站长与互联网从业者阅读。

    2026年05月25日 11点32分
  • 2026最新AI智能体深度解析:AI Agent如何重塑未来工作与内容生产

    本篇《2026最新AI智能体深度解析:AI Agent如何重塑未来工作与内容生产》全面讲解了AI智能体(AI Agent)的核心概念、工作原理、应用场景以及未来发展趋势。文章重点分析AI内容运营、办公自动化、AI客服、AI编程等真实落地场景,并深入解析Prompt提示词、AI工作流与智能体平台生态,帮助普通用户理解AI智能体如何提升效率、改变未来互联网工作模式。

    2026年05月25日 11点18分
  • 2026最新AI智能体教程:什么是AI Agent?普通人如何用AI智能体提升效率

    本篇《2026最新AI智能体教程:什么是AI Agent?普通人如何用AI智能体提升效率》详细解析了AI智能体(AI Agent)的核心概念、工作原理、应用场景以及未来发展趋势。文章从AI内容运营、办公自动化、AI客服、AI编程等多个真实场景出发,帮助新手理解AI智能体如何自动执行任务、提升工作效率,并深入讲解Prompt提示词、AI工作流以及普通人学习AI Agent的实战方法,适合AI新手、内容运营人员以及互联网从业者阅读。

    2026年05月24日 17点56分
  • 2026最新AI实战教程:从零开始学会AI内容创作与自动化办公

    本篇《AI实战教程:从零开始学会AI内容创作与自动化办公(2026版)》详细讲解了AI内容创作、Prompt提示词、SEO写作、办公自动化以及AI工作流搭建方法。文章结合ChatGPT、Claude、Canva AI等主流工具,从实际应用场景出发,帮助新手快速掌握AI写作、自动化办公和网站运营技巧,同时分享了AI去AI化写作、SEO优化以及内容运营中的常见问题与解决方案,适合想学习AI实战的新手与内容创作者阅读。

    2026年05月24日 16点46分
  • 2026 AI生活实验室:从被动控制到主动服务 全龄普惠智慧人居新范式

    2026 年,随着大模型技术迭代成熟、智能传感设备成本大幅下降、全屋互联生态逐步打通,智慧人居正式告别高端楼盘专属标签,加速向普通家庭普及。AI 生活实验室作为连接前沿 AI 技术与大众日常生活的核心枢纽,已从传统智能家电展示厅升级为集技术测试、场景优化、产品孵化、科普体验于一体的综合性创新平台。本文系统阐述 AI 生活实验室区别于传统智能家居的核心差异,深度解析其四大底层建设逻辑、四大核心技术支撑、六大高频刚需应用场景,剖析行业现存痛点与三大落地建设路径,展望未来 AI 智能体普及、生态标准统一、全域智慧互联的发展趋势,为地产物业、智能家居企业、社区运营者布局智慧人居赛道提供专业、可落地的实践参考。

    2026年05月14日 18点50分
  • 2026 AI智能体零售电商应用|全域获客+智能运营+供应链优化实战指南

    2026 年零售电商行业进入 "存量竞争 + 全域融合" 的新阶段,传统电商面临获客成本飙升、转化率持续走低、运营效率低下、供应链响应滞后、客户体验同质化等核心痛点,单纯依靠流量红利的增长模式已难以为继。AI 智能体凭借自主决策、全链路闭环执行、多模态用户洞察、多智能体协同的核心能力,正在深度重构人、货、场的关系,从获客引流、转化成交、客户服务到供应链管理,全方位赋能零售电商全流程。本文结合 2026 年最新行业数据与落地案例,深度拆解 AI 智能体在零售电商领域的六大核心应用场景,梳理不同规模电商主体的差异化落地路径,配套避坑指南与风险管控方案,为电商平台、品牌商家、中小卖家推进智能化转型、实现降本增效、提升核心竞争力提供可落地的实战指导。

    2026年05月14日 18点44分
  • AE剪辑教程2026:从零基础到专业特效师的完整入门指南

    本文为 2026 年最新版 After Effects(AE)完整剪辑教程,系统讲解 AE 软件的核心功能、基础操作与进阶技巧。内容涵盖 AE 界面布局、图层管理、关键帧动画、蒙版与遮罩、常用特效制作等核心知识点,同时提供高效工作流与快捷键大全,帮助新手快速掌握 AE 剪辑技能,解决学习过程中遇到的常见问题。无论你是想制作短视频特效、影视片头还是动态海报,本教程都能为你提供全面的指导。

    2026年05月13日 19点56分
  • 2026 AI本地生活变现全攻略:零基础同城入局+商家变现实战指南

    本地生活是2026年普通人零成本、低门槛、高落地的AI变现核心赛道,无需远途奔波、无需大额囤货、无需高深技术,依托AI工具赋能线下商家,就能快速实现同城变现。相较于线上虚拟变现,本地生活变现现金流更快、信任更强、复购更稳,餐饮、美业、健身、教培、生鲜、休闲娱乐等全行业都有刚需缺口。但多数普通人面临“不会对接商家、不会做流量、不会落地交付、不会谈合作”等痛点,空有想法无法落地。本文立足2026同城商业实操环境,拆解AI本地生活核心变现逻辑,筛选6类适合个人零基础做的盈利模式,详解商家对接、流量打造、AI交付、回款盈利全流程,配套工具清单、谈单话术与避坑规则,打造纯落地、可复制、当天就能起步的AI本地生活变现指南,适合上班族、宝妈、自由职业者、返乡创业者做主业或副业。

    2026年05月13日 16点10分
  • AI赋能智慧人居新生态:AI生活实验室建设逻辑、应用场景与未来趋势

    数字经济与人工智能深度下沉,推动人居生活从传统居家模式迈向智慧化、主动化、全龄化全新阶段。AI 生活实验室作为智慧人居落地的核心载体,以大模型、物联网、多模态感知、边缘计算为技术底座,重构家庭起居、健康康养、亲子成长、安防节能全维度生活场景。本文从 AI 生活实验室建设逻辑、核心技术支撑、全场景应用落地、行业现存痛点、落地建设路径及未来发展趋势六大维度展开深度论述,系统拆解 AI 如何重构日常居家生态,为地产物业、智能家居企业、社区运营者布局智慧人居提供专业参考与落地思路。

    2026年05月13日 15点45分
  • 2026:AI智能体在工业制造领域的深度应用

    2026 年工业 4.0 进入深化落地阶段,传统工业制造面临生产效率偏低、能耗过高、质量管控薄弱、供应链协同不畅、设备运维滞后等核心痛点,单纯的自动化设备升级已无法满足智能制造的发展需求。AI 智能体凭借自主决策、全流程闭环执行、多设备协同、实时数据分析的核心能力,深度融入工业制造全链路,从生产车间到供应链协同,从设备运维到质量管控,全方位重构工业制造模式。本文结合 2026 年工业 AI 落地最新案例,深度拆解 AI 智能体在工业制造领域的核心应用场景、价值优势与部署路径,分析当前落地难点并提供解决方案,为制造企业推进智能制造转型、实现降本增效、提升核心竞争力提供可落地、可复制的实战指南。

    2026年05月13日 15点26分
  • 2026 AI自媒体全流程实战教程:文案+配图+剪辑+涨粉变现完整攻略

    2026 年自媒体行业早已告别纯人工单打独斗的时代,借助 AI 工具可以一站式完成文案撰写、封面配图、短视频剪辑、账号运维、引流涨粉、商业变现全链路工作。很多新手想做自媒体,却卡在不会写文案、不会作图、不会剪辑、不懂运营变现,耗费大量时间还没流量。本文为专业完整版 AI 自媒体实战教程,从零开始拆解全套可复制实操方法,不用专业技能、不用花钱雇人,靠 AI 就能批量产出内容、稳定起号、实现持续变现,适合个人副业、博主起号、矩阵账号运营学习参考。

    2026年05月13日 15点16分
  • 2026 AI生活实验室:从概念样板间到全龄普惠的智慧生活生态

    2026 年人工智能产业全面告别 "百模大战" 参数竞赛,进入 "场景为王、价值兑现" 的落地深水区。AI 生活实验室作为连接前沿 AI 技术与大众日常生活的核心桥梁,已从早期智能家电展示厅升级为集技术研发、用户测试、产品孵化、社区服务于一体的综合性创新生态。本文系统梳理 AI 生活实验室的三阶段发展历程与四大核心价值,深度解析 "端 - 边 - 云 - 智" 一体化技术架构,重点拆解适老化康养、儿童友好成长、普惠型刚需三大核心场景,剖析安全合规体系与三大商业化落地模式,指出行业现存挑战并展望未来发展趋势,为科技企业、家居品牌及社区运营方布局 AI 生活赛道提供专业参考。

    2026年05月12日 14点57分
  • 2026 AI智能体金融科技应用|全链路风控+智能运营+财富管理实战指南

    2026 年金融科技进入 "智能体驱动" 的 3.0 时代,传统金融行业面临运营成本高、风控效率低、客户服务同质化、合规压力大、普惠金融落地难等核心痛点,单纯的数字化系统升级已无法满足行业高质量发展需求。AI 智能体凭借自主决策、全流程闭环执行、多模态数据融合、多智能体协同的核心能力,正在深度重构银行、证券、保险、支付等金融领域的业务模式与服务体系。本文结合 2026 年最新行业数据与落地案例,深度拆解 AI 智能体在金融领域的五大核心应用场景,梳理不同规模金融机构的差异化落地路径,配套风险管控方案与避坑指南,为金融机构推进智能化转型、实现降本增效、防控金融风险、服务实体经济提供可落地的实战方案。

    2026年05月12日 14点37分
  • 2026 AI办公自动化实战教程:零基础打造个人高效工作流

    2026 年,AI 办公自动化已从企业级应用下沉到个人职场,通过 AI 工具联动与自动化工作流搭建,可替代人工完成 90% 以上的重复性办公工作,大幅提升工作效率。但多数职场人面临 "只会单一工具、不会搭建工作流、自动化落地难" 的痛点,无法真正释放 AI 的生产力价值。本文打造一套零基础友好的 AI 办公自动化实战教程,摒弃复杂代码与专业术语,聚焦 "低代码 / 无代码" 工具,拆解从工具选型、工作流设计到场景落地的全流程实操步骤,覆盖文档处理、邮件管理、数据统计、任务协作四大高频办公场景,提供可直接复制的工作流模板与指令,帮助职场人快速搭建专属高效工作流,实现从 "手动办公" 到 "自动化办公" 的跨越。

    2026年05月12日 14点28分

发表回复

评论列表

点击查看更多