AI专家:大模型同质化严重,面临十大科学挑战
今年2月,复旦大学邱锡鹏团队发布MOSS,成为国内首个发布的类ChatGPT模型,而从ChatGPT诞生至今已过去9个多月,大模型又面临哪些挑战?
在24日下午上海市科协举办的青年科学家论坛上,复旦大学MOSS系统负责人邱锡鹏表示,大语言模型是当前自然语言处理的主流范式,它可以涌现出丰富的知识和能力,但也带来了一些挑战和问题。在他看来,大语言模型的研究需要多方面的合作和创新,需要开放和共享的技术平台和评测标准。
呼吁业界开放共享技术
【资料图】
“大模型确实给我们的研究带来非常多的问题,一方面是同质化非常严重,另外就是赛道拥挤,大家原来把各切一块的研究范式都往一个赛道挤。还有就是评价困难。”
邱锡鹏解释,现在大家做的东西总体上比较雷同,比如说像预训练,虽然有创新性的东西但总体不多,目前的“千模大战”在创新性上并没有多少差异。而在评价方面,大家都说自己做得好,但又没有好的比较方法。因为对大模型、生成式人工智能的客观评价方法并不是特别有效,导致每个人都要自己建一套评价标准,这就没有一个比较方法,从而给整个研究带来一定的困难。
“现在很多人认为大模型变成工程性问题了,是不是还有科学价值?”在他看来,ChatGPT发布至今已经过去9个多月了,大家都感觉好像很明白它了,事实上很多观念的地方还是不明白。目前业界对整个技术路线是有一些掌握,这离不开学术界一直在发论文探讨。邱锡鹏说,现在有做大模型的团队只宣布做出来的效果,并未公开究竟是怎么做的,但大模型的研究只有保证技术的公开度才能使大家都参与进来,让技术持续不断往前迭代。“当然这涉及到很多算力问题和能耗问题,希望可以有更好的优化方法,使大模型普惠化,使所有人降低门槛,所有人都参与进来进行研究。”
十大科学挑战
谈到大语言模型面临的挑战和问题,邱锡鹏总结了包括模型架构、幻觉、多模态的延展、知识来源、自动化评价、平民化等十个科学挑战。
他说,大模型之所以称为大模型,是因为可以涌现出丰富的知识和能力。目前大家熟知的Transformer架构非常强大,但缺点也明显,当文章长度变得更长得时候,它的复杂度就变得非常高,因此也限制了模型的进一步扩大。“我们要找到一种可能比Transformer更有效的架构,才能支持未来模型的进一步扩大。”
邱锡鹏还特别强调了大模型的平民化问题,因为平民化能让资源不多的研究者也能使用大模型。
他认为,大模型总的来讲不仅仅是工程问题,从迭代周期来看的话,大家需要的算力比较多的是预训练阶段,这个阶段也有很多东西可以做。但是如果往后看,包括像对齐、优化、指令微调等方面需要的算力没有想象中那么大。“随着将来大模型普惠化、平民化的工作,大家在3090显卡上就可以开展关于大模型的研究。我总体上会觉得大模型的研究,不管是学术界还是工业界的科研单位,里面都有很多科学问题,还是值得关注的,这不仅仅是一个简单的工程问题。”
关于MOSS的下一步计划,邱锡鹏透露,后面会追求一些创新性,在一些新架构上做一些探索,比如不断加强像推理、代码这些能力。
关键词:
-
AI专家:大模型同质化严重,面临十大科学挑战
2023-08-25 -
暴雨、大暴雨!湖北发布风险提示
2023-08-25 -
破茧(七)
2023-08-25 -
中国石油大庆石化降能耗控成本积势赋能提质增效
2023-08-25 -
《航海王热血航线》新世界乌索普技能介绍一览
2023-08-25 -
俄罗斯飞机失事哀悼日 普京向坠机事件遇难者家属表示哀悼 基本情况讲解
2023-08-25 -
一市原副检察长被查!纪委监委最新通报
2023-08-25 -
2023广西高龄补贴标准新消息:年龄划分、补贴金额一次讲清楚!
2023-08-25 -
追星被骗35万元 小粉丝何以成了“鲜嫩的韭菜”
2023-08-25 -
广深铁路:融资净买入49.15万元,融资余额2.21亿元(08-24)
2023-08-25 -
李大霄:加快中长期资金入市,长线投资人会有好结果
2023-08-25 -
带你云打卡!鄂尔多斯市北京展演活动展区
2023-08-24 -
美股开盘涨跌不一,英伟达涨超6%,股价再创历史新高
2023-08-24 -
北辰实业2023上半年扭亏为盈 股东应占利润1.33亿
2023-08-24 -
漳州发展定增方案获受理 加速推进新能源业务转型升级
2023-08-24 -
音乐入门先学什么(音乐入门)
2023-08-24 -
油类污染物以什么形式存在于水中?
2023-08-24 -
法老将进八强,王欣瑜对手产生,王雅繁横扫晋级,袁悦白卓璇止步
2023-08-24 -
采纳股份:8月23日融资净买入23.05万元,连续3日累计净买入362.35万元
2023-08-24 -
《学爸》:讲故事的能力,撑不起触摸现实的野心
2023-08-24 -
国际实业净利降91%拟募3亿扩产 控股股东质押率70%退出定增认购
2023-08-24 -
海正生材(688203)8月23日主力资金净卖出165.24万元
2023-08-24 -
将星陨落 瓦格纳叛军总司令乘坐飞机被俄罗斯防空系统击落
2023-08-24 -
领益智造(002600):8月23日北向资金减持429.92万股
2023-08-24 -
美地产商欲低价收购灾区地皮 毛伊岛当地居民:不会离开
2023-08-23 -
张凯丽不愧是专业运动员出身,太适合穿短裤了
2023-08-23 -
日本核污染水排海操作分几步? 基本情况讲解
2023-08-23 -
知乎:2023年Q2营收同比增25% 平均月活达到1.09亿
2023-08-23 -
中央气象台:强降雨来袭!四川重庆陕西河南湖北等地警惕山洪地质灾害
2023-08-23 -
2023《资产评估实务一》易错易混知识点:资产减值
2023-08-23
-
守住网络直播的伦理底线
2021-12-16 -
石窟寺文化需要基于保护的“新开发”
2021-12-16 -
电影工作者不能远离生活
2021-12-16 -
提升隧道安全管控能力 智慧高速让司乘安心
2021-12-16 -
人民财评:提升消费体验,服务同样重要
2021-12-16 -
卫冕?突破?旗手?——武大靖留给北京冬奥会三大悬念
2021-12-16 -
新能源车险专属条款出台“三电”系统、起火燃烧等都可保
2021-12-16 -
美术作品中的党史 | 第97集《窗外》
2021-12-16 -
基金销售业务违规!浦发银行厦门分行等被厦门证监局责令改正
2021-12-16 -
保持稳定发展有支撑——从11月“成绩单”看中国经济走势
2021-12-16