智源AI研究院回应大模型论文学术争议
“我们已经注意到对《A Roadmap for Big Model》一文的智源争议质疑,正在对相关情况进行核实,研究院智源研究院鼓励学术创新和学术交流,模型对学术不端零容忍,论文有关进展将尽快通报。学术”4月13日,智源争议北京智源人工智能研究院回复大脑(Google Brain)的研究院著名科学家Nicholas Carlini对一项中外合作大型学术论文涉嫌剽窃的指控。
此前4月8日,模型Nicholas Carlini公开撰文,论文指控一篇于今年3月26日刊登在论文预印网站Arxiv的学术论文《关于“大模型”的路线图》(“A Roadmap for Big Model”)一文涉嫌严重抄袭。
该文是智源争议前不久国内外多家高校和企业共同完成的长达200页的学术综述论文,有多达100名作者,研究院分别来自于清华大学、模型北京大学等国内高校,论文哥伦比亚大学、学术蒙特利尔大学等国外高校,字节跳动、华为、、等企业以及中科院和北京智源等机构。
Nicholas Carlini在文章《机器学习研究中的一个抄袭案例》(“A Case of Plagarism in Machine Learning Research”)中则详细列举了该论文存在大段抄袭其他论文的嫌疑,证据是大规模的文本重叠,疑似被剽窃的论文也包括他自己的论文“Deduplicating Training Data Makes Language Models Better”。
Nicholas Carlini在文章中解释,他们是在阅读这篇论文时发现很多语句都非常的熟悉,然后通过使用论文查重工具发现了更多的证据,进而准确定位《关于“大模型”的路线图》论文中和已有论文中存在剽窃嫌疑的文本内容。
澎湃记者发现,这篇被质疑的论文目前已经被其发表网站Arxiv在页面上备注了该文和Nicholas Carlini的论文有“文本重叠”(text overlap)。
此前3月31日,北京智源社区撰文以《如何炼大模型?200页pdf100+位作者19家单位!北京智源清华唐杰等发布》介绍该篇论文:
“随着以深度学习为代表的AI技术的快速发展,智能模型的训练应用模式逐渐由‘大炼模型’向‘炼大模型’转变。大模型研究在近年来发展迅速,模型的参数量以惊人的速度扩展。北京智源人工智能研究院最近发布的《A Roadmap for Big Model》由悟道大模型研究项目负责人,智源学术副院长,清华大学计算机系教授唐杰牵头,从大模型基础资源、大模型构建、大模型关键技术与大模型应用探索4个层面出发,对15个具体领域的16个相关主题进行全面介绍和探讨。非常值得关注。”
《关于“大模型”的路线图》中的研究主体“大模型”是近几年人工智能的热门关注领域。人工智能发展到今天,GPT和BERT等参数量巨大的模型被人们开发出来,他们在计算机视觉和自然语言处理等领域取得了前所未有的成就。同时,因为大模型参数量巨大,最近学术界开始将它们当作一类特别的人工智能模型进行研究。
在一篇去年发布的,由斯坦福教授李飞飞等领衔的约百名作者署名论文将此类模型称为“基础模型”(Foundation Model),这篇由清华主要参与的论文关注与此相同含义的“大模型”(Big Model)的未来研究路径。在清华的论文中,作者们介绍到“之前论文提及的'基础模型'在中文语境中也被称为‘大模型’”(“The mentioned foundation model is known as the BMs, and it is called Big Model in the Chinese context.” )。
这起“涉嫌抄袭”事件在国外社交媒体上引起热议。滑铁卢大学教授Gautam Kamath表示,对于一篇有如此多作者的文章,他很惊讶没有一个作者注意到相似之处并且去改正它。
- ·刘强东发布京东全员信:副总监级别以上降薪10%-20% 捐款一亿扩充“员工子女救助基金”
- ·“中国空间站欢迎国外航天员朋友们的加入”
- ·山西省举办煤炭清洁高效利用和碳减排项目银企对接会
- ·日立瞄准时速1200公里“超级高铁”开发出模拟系统
- ·三星Galaxy Tab S8 FE平板电脑爆料:搭载LCD屏,支持手写笔
- ·平安期货:七国集团拟封杀俄罗斯黄金 黄金多头主力竟是全球央妈?
- ·美国SEC史上最大金额审计罚单!安永49名审计人员CPA考试作弊,将支付1亿美元罚款
- ·新阶段银行数字化风控体系建设
- ·俄罗斯卢克石油宣布董事会主席因重病去世,俄媒称其“在医院坠亡”
- ·陕西6月28日新增2例境外输入无症状感染者
- ·安徽泗县昨日新增无症状感染者13例及初筛阳性10例
- ·死亡升至50人!美国出现“一场可怕的人间悲剧”
- ·FTX欠前50大债权人近31亿美元,拟出售或重组部分业务
- ·又一家工业机器人龙头官宣涨价
- ·快讯:国产软件概念股走强 用友网络涨停
- ·外媒:私募巨头KKR退出对东芝的潜在竞购