|
OpenAI宣布将发布开源大模型
|
3月31日,OpenAI首席执行官萨姆�奥特曼(Sam Altman)在社交媒体X平台宣布:OpenAI将在未来几个月内发布一个“强大的带有推理能力的全新开放权重(open-weight)模型”。 这是自2019年发布GPT-2以来,OpenAI时隔六年首次宣布新的开放模型计划。 回顾过往,OpenAI虽然以“开放”命名,但自从GPT-3开始,逐步转向封闭。尤其是ChatGPT问世后,OpenAI模型只能通过其自家平台或者微软Azure等合作伙伴访问或使用API接口。用户无法在自己的硬件上自行部署运行GPT-3、4、4o、4.5等,无法对它们进行修改或二次开发。 或许是随着DeepSeek等开放模型迅速崛起,OpenAI压力逐渐增大。在今年2月1日的OpenAI o3-mini产品发布后,奥特曼公开承认DeepSeek削弱了OpenAI在AI领域的领先地位。他认为,OpenAI在开源AI方面一直站在历史的错误一边,“我们需要想出一个不同的开源策略”。 2月18日,奥特曼在X平台上发起对OpenAI下一个开源项目的民意调查,投票结果偏向于“做一个虽然体积小、但仍需要GPU运行的o3-mini级别模型”,这也预示了这次开放模型可能是o3-mini级别模型,或者是一个与o3-mini类似,但有所不同的模型。因此,即便是开放模型,OpenAI依旧会保留一些“秘方”——例如模型训练数据、预训练细节或者关键架构组件等。换句话说,这是一个开放权重模型,但不是一个完全开源的模型。 事实上,由于AI模型不仅包括代码,还涉及数据、参数和权重等,开源模型的定义并不像开源软件般清晰,目前尚未形成统一定义。 Linux基金会提出的模型开放性框架(MOF)把开放模型分为了三个逐步扩展的层级——第三级“开放模型”、第二级“开放工具”和第一级“开放科学”。 Deepseek、Qwen2.5等模型只通过了MOF第三级评估,第三级“开放模型”开放范围包括模型架构、模型参数(最终参数)、模型卡、数据卡、技术报告和评估结果,距离最开放的第一级“开放科学”仍有空间。
|
|