2023-02-21 20:55:44 来源: 证券日报网
本报记者 刘钊 见习记者 熊悦
近期,ChatGPT火爆网络,引发各大公司抢滩新兴赛道,国内类ChatGPT模型的技术进展及产品发布也备受关注。
(相关资料图)
2月20日,复旦大学自然语言处理实验室邱锡鹏教授团队发布了国内对话式大型语言模型。该模型以大热电影《流浪地球》中超级量子计算机“MOSS”命名,目前已处于内测阶段。2月21日当天,与MOSS有关的多个话题冲上微博热搜,网民讨论热烈。
受上述消息影响,今日早盘,复旦复华一字涨停。截至收盘,报6.78元/股,涨停板上封单超11万手。
对于股价涨停,复旦复华回应市场关切表示,“MOSS为复旦大学研发,与本公司无关。目前公司的主营业务为生物医药、软件和园区三大板块,未参与MOSS研发。”
相关概念股热度大涨
上述内测平台一经公开便引发大量用户尝试,据多位用户向《证券日报》记者反映,2月21日当天系统一度无法登录。复旦大学自然语言处理实验室也公开回应称,“MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。MOSS只是想在百亿规模参数上探索和验证ChatGPT的技术路线,并且实现各种对话能力。”
作为国内自研类ChatGPT尝试,有关该模型的诸多技术细节有待公开。不过资本市场上,相关概念股再度“狂欢”。受上述消息影响,今日早盘,复旦复华一字涨停。截至收盘,报6.78元/股,涨停板上封单超11万手。此外,恒宝股份涨停,云从科技涨超5%,鸿博股份涨近5%,神州数码、金财互联、三六零、中科金财等跟涨。
此外,“MOSS”相关商标也出现抢注现象。某企业查询平台显示,目前MOSS商标申请信息共74条,已有32个商标被成功注册,申请人包括进出口、电子商务、高新技术等领域的多家公司及多个自然人,商标国际分类包括科学仪器、珠宝钟表、教育娱乐等。此外,目前仍有3个MOSS商标正在注册申请中。
中国版ChatGPT问世?
据邱锡鹏介绍,MOSS是一个像ChatGPT一样的对话语言模型,能够按照用户的指令执行各种自然语言任务,包括回答问题、生成文本、总结文本、生成代码等。其开发的基本步骤包括自然语言模型的基座训练、理解人类意图的对话能力训练两个阶段。
在对话能力训练阶段,OpenAI收集数十万条人类指令,让专业标注员写出指令回复,并将其输入模型基座,以帮助ChatGPT逐步理解各种指令。复旦团队则采用不同的技术路线,让MOSS和人类以及其他对话模型都进行交互,从而显著提升模型的学习效率和研发效率,短时间内完成对话能力训练。据悉,实验室将于今年3月份发布MOSS源码。
那么,这个被外界称为中国版类ChatGPT的MOSS能否堪比ChatGPT?与后者相比,其优势和缺陷又有哪些?
邱锡鹏公开表示:“MOSS与ChatGPT的差距主要在自然语言模型基座预训练这个阶段。MOSS的参数量比ChatGPT小一个数量级,在任务完成度和知识储备量上,还有很大提升空间。”
根据研发团队成员孙天祥在公开平台的说法,MOSS参数量为百亿级别,因此推理能力、事实性知识不足是难以克服的缺陷,但该缺陷会随着参数量增长迅速缓解。MOSS中文理解和生成较弱,随着中文数据的增多,下一版本的MOSS将会大幅度增强。“总体来说,MOSS作为比ChatGPT小一个数量级的模型,能力还落后很多,但不可否认的是MOSS确实具备一定的类似能力,随着参数和数据增长到类似量级,我个人看好能够达到ChatGPT水准。”
相关业内人士告诉《证券日报》记者,MOSS的优点在于这个是国内自研的类ChatGPT聊天机器人,在国内NLP自然语言处理以及人工智能领域应该可以起到领头羊的作用。并且MOSS是开源的,意味着其后模型的源代码、可能还有论文都会公开,由此吸引更多人才入局,进一步对相关技术的研发起到加速作用。
深度科技研究院院长张孝荣对记者表示,MOSS的出现对于国产机器人技术的发展起到了极好的推动作用。自然语言处理是AI发展的重大难关,尽管ChatGPT获得了一定进展,但仍然需要众多机构和资源一起参与,攻克技术难点。当下流行的聊天机器人技术,需要构建巨大语言模型、大算力和大型语料库。ChatGPT虽然领先,但依然属于弱人工智能范畴,还在实验室阶段,难以大规模商用。
张孝荣进一步表示,复旦MOSS由于算力不足,刚刚开通测试不到一天,由于访问压力过大而服务器崩溃。谷歌聊天机器人在首秀当日翻车,微软直接引入GPT技术改造搜索引擎招来许多差评。“市场很火爆,但相关技术尚未成熟,投资需谨慎。”
(编辑 乔川川)