5月29日,上海大模型独角兽企业阶跃星辰(StepFun)发布并开源了Step 3.7 Flash模型。距上一代Step 3.5 Flash发布仅三个多月,基座模型的迭代节奏之快可见一斑。
在大模型行业,“Flash”通常意味着轻量、快速且低成本。阶跃星辰连续两代基座模型均主打Flash版本,由此可见,阶跃星辰正在走一条有别于单纯追求参数规模的差异化路线。
据阶跃星辰研发团队介绍,Step 3.7 Flash专为生产级智能体场景打造,旨在速度、成本、可靠执行与复杂任务处理能力之间实现更优平衡。
记者获悉,该模型采用稀疏 MoE(混合专家)架构,总参数量为1960亿,其中视觉模块参数18 亿,激活参数仅110 亿,最高生成速度可达每秒400 词元,尤其适合高频、多轮的智能体应用场景,能显著提升任务完成效率。
相较于千问、DeepSeek最新模型超1.6万亿参数,Step 3.7 Flash总参数量仅为十分之一。但小参数不等于能力低,Step 3.7 Flash特别针对智能体的核心需求,重点优化多项关键能力,比如原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排,以及智能体生态兼容适配,实现了“以小博大”的效果。
基准测试显示,Step 3.7 Flash能力与旗舰模型差距并不明显。
当前,智能体正从演示阶段快速迈向真实的企业生产环境,这对基础模型提出了全新要求,不只追求峰值智能,更要实现可规模化落地的高效智能。这意味着模型不仅要回答问题,还要理解复杂输入、主动检索信息、稳定调用工具,并在多轮长程任务中保持执行一致性。
具体而言,Step 3.7 Flash能够直接处理用户界面、图表、文档、图片等各类应用,将复杂视觉信息转化为结构化结果和可执行任务,并在信息不充分时主动发起搜索进行交叉验证。
在生产级智能体最核心的工具调用可靠性方面,Step 3.7 Flash进行了针对性优化,可在长程多轮工作流中稳定调用API(第三方应用接口)、浏览器、终端、办公等工具,显著降低执行偏离和任务失败的风险。
基准测试显示,Step 3.7 Flash在多项复杂视觉任务评测中展现出媲美更大规模旗舰模型的能力水平,在多轮智能体工作流中的任务轨迹一致性表现尤为突出。
此外,阶跃星辰还对主流Agent框架和工具调用协议进行了兼容优化,模型可稳定接入Claude Code、OpenClaw、Hermes Agent等主流编程与智能体工具,并支持云端与本地部署,降低开发者接入及工作流编排成本。
随着各行各业加速推进智能体落地,Step 3.7 Flash的设计理念也折射出“Flash”版本模型的角色转变,正从单纯的轻量替代品,逐步演进为支撑生产级智能体规模化运行的基础设施。
原标题:《上海基座模型再升级,参数仅为deepseek十分之一,能力如何以小博大?》
栏目主编:李晔
本文作者:解放日报 查睿