随着人工智能技术的飞速迭代,大模型如雨后春笋般涌现,文本生成、文生图、语音处理等生成式应用已融入日常生活。与此同时,部分企业正将目光转向轻量化小模型。这类模型以低成本、上线快和易调试的特点,为中小企业和个人用户提供了一把打开AI大门的钥匙,在性价比上展现出独特优势。
青岛自然语义公司联合创始人孙燕群认为,满足特定市场需求是小模型兴起的关键价值。他比喻道:“正如交通领域需要高铁、飞机等大型工具,也离不开私家轿车、公交车等小型工具,不同场景和人群需求各异。”今年3月,该公司研发的Euler模型通过备案,参数量仅2.5B(25亿),是典型的轻量化小模型代表。相较于大模型动辄千亿级参数,小模型的特点和应用前景引发业界关注。
在行业内,小模型虽无明确定义,但孙燕群指出,参数量低于100B的模型通常被视为较小规模。实际应用中,笔记本电脑端微调时参数量一般控制在3B左右。小模型在算力消耗和使用成本上优势显著:训练推理所需硬件资源较少,成本更低;可在手机、电脑或物联网设备上实时运行;结构简单,开发者易于调试和问题定位。随着大模型竞争加剧,企业如微软、英伟达相继发布小型语言模型,国内企业也在发力端侧小模型研发。例如,北京面壁智能今年推出汽车智能座舱助手,广东佛山移动牵头成立AI小模型产业联合体,助力企业智能化升级。
孙燕群坦言,小模型能力虽不如大模型,但实现了与科技巨头的错位竞争。Euler已服务中小企业,如与山东档案馆合作开发档案模型,或为青岛仪器公司定制内网技术模型。自然语义最初目标并非小模型,2019年底计划做大模型时,因发展方向不明和高算力GPU资源短缺而搁置。国外大模型发布后,高算力GPU价格飙升,公司仅用10多台设备构建集群,支撑7B参数模型。通过创新分词方式和向量计算优化,工程师们让3B参数模型达到150B模型60%的能力。
中国信息通信研究院王蕴韬解释,小模型“瘦身”后性能不减,得益于剪枝、量化、知识蒸馏等成熟技术。他强调,小模型发展前景广阔,未来将释放更大潜力。AI终端应用形态将成为主战场,例如离线办公、文档摘要、私密对话等场景;手机、车载设备受益于处理器技术演进;垂直领域如金融、医疗中,6B以下定制模型成本低、上线快,可在特定任务超越通用大模型。市场更关注问题解决能力而非模型细节,可信且与场景深度结合的小模型至关重要。
从用户端看,小模型性价比优势明显。北京某互联网公司算法工程师张先生表示,本地部署大模型面临硬件限制:专业GPU芯片价格高昂,手机、机器人等终端芯片无法支撑,电池也难以满足高耗电。这些资源受限环境更适和小模型施展。王蕴韬分析,未来将是大小模型混合的系统范式:云端大模型处理通用推理,端侧小模型负责即时响应和私域数据。小模型并非“大模型的低配版”,而是资源受限环境和专用任务的高性价比解法,通过端云混合部署和数据精调,企业能让“小身材”跑出“大能量”,在AI商业落地中收获确定性收益。