“狂飙”过后大模型该走向何方

自从一年前ChatGPT突然爆火，到不久前文生视频大模型Sora以霸屏之势吸引全球舆论关注，与AI大模型相关的议题越来越多地被大众所讨论。为了抢抓机遇，国内不少科技企业争相上线生成式AI。

有报告显示，截至2023年10月，国内公开的AI大模型数量已经达到238个，仅次于美国。过去5年世界上参数量超过百亿的大模型大约有45个，其中9个出现在中国。

狂热之下不乏担忧，“狂飙突进”的大模型还面临哪些突出问题？有何危害？未来将走向何方？

我国大模型发展势头正猛，很多科技企业有敏锐性，敢于探索和创新，值得肯定。但在一路“狂飙”过后，不难发现其在“野蛮生长”过程中产生的一些乱象。

一味盲目跟风。可以说，质量和数量的矛盾始终伴随着大模型的“井喷式”发展。一些企业一味追逐热点，“能不能用不重要，但首先要拥有”“人工智能时代，没有大模型的科技企业就意味着落伍”，在不具备强大的研发和投资能力的情况下，盲目开发低质量产品，没多久便被用户弃用，落入“昙花一现”的尴尬境地。

研发涉嫌模仿。仍有一些大模型因涉嫌“微调国外底座模型”而备受舆论争议。在这个快速发展但充满不确定性的领域里，一些企业更愿意选择“站在巨人肩膀上”，以降低失败风险。去年，一家公司创办的大模型就曾陷入“套壳”风波。尽管该公司坚决否认抄袭，却承认其使用Meta发布的开源大模型LLaMA架构的事实，称只是在此基础上进行研发。

应用效果欠佳。大模型同质化、缺乏多样性成为饱受诟病的问题。不少大模型采用同样的数据集、训练方法等，输出雷同的问题答案。此外，高质量语料短缺也严重制约着大模型的发展。AI写作、AI设计、AI社交等应用被吹上了天，人工智能看似“无所不能”，然而面对“是谁提出了新三民主义”“最近5年中国的GDP数据是多少”等具体问题时，不少大模型表现欠佳。

西桔智慧

评论

发表回复取消回复

“狂飙”过后大模型该走向何方

评论

发表回复 取消回复

发表回复取消回复