简繁互换
设为首页
设为收藏
手机版
东南网 / 新闻频道 / 天下 / 环球新闻 / 正文

硅谷手记|AI抄袭背后的硅谷“不光彩文化”

2024-06-05 09:30 新华网 责任编辑:陈曦

新华社旧金山6月3日电 硅谷手记|AI抄袭背后的硅谷“不光彩文化”

新华社记者吴晓凌 黄堃

“‘作假,直至成功’,这是硅谷不光彩的文化。”美国斯坦福大学人工智能实验室主任克里斯托弗·曼宁3日就该校某些研究人员抄袭中国清华大学等机构成果的行为这样评论说。他在社交媒体上还指出,该研究团队应该深刻认识自己的错误。

5月29日,斯坦福大学一个研究团队发布名为Llama3-V的大模型,声称只要500美元的预训练成本,就能用它获得比肩GPT-4V等著名大模型的效果。这一消息在社交媒体和人工智能学术界被广泛转发。

但业内人士很快发现,该大模型涉嫌抄袭清华大学等机构发布的 MiniCPM-Llama3-V 2.5大模型。它们都是基于开源的Llama3大模型,但清华团队进行了独特的训练,包括利用“清华简”(清华大学收藏的一批战国竹简)训练它识别古代中国文字的能力。测试显示,斯坦福大学这个团队发布的大模型居然也能识别“清华简”。

“已经比较确信,斯坦福这个团队‘套壳’了我们的大模型研究成果。”清华大学计算机系长聘副教授刘知远对新华社记者说。

“我们从‘清华简’逐字扫描并标注的数据集从未公开,而Llama3-V展现出了一模一样的识别‘清华简’能力,连做错的样例都一样。”刘知远是清华这个大模型团队成员。他介绍说,在质疑声发酵后,对方已经在网上删除了此前发布的数据库和宣传文章,“从证据和对方反应来看,抄袭性质已比较确定”。

曼宁发声批评后,斯坦福该团队的两名成员夏尔马和加格也在社交媒体上正式道歉,并表示要完全撤下Llama3-V模型。

在当前的人工智能热潮中,这个事件引发广泛关注。有观点认为美国的人工智能全面领先,但该事件说明,虽然美国科技仍然整体领先,但远非全能,也不应迷信美国单方宣布的“重大成果”。

斯坦福大学所处的硅谷地区被认为是美国科技创新的重镇,既孕育了许多先进技术,也有“作假,直至成功”等被津津乐道的负面文化。

比如,从斯坦福大学退学创业的伊丽莎白·霍姆斯曾吹嘘有颠覆性检测技术可“抽指血查癌症”,一度成为全球闻名的科技创业明星,但后来被发现造假并因欺诈投资者罪名获刑。放眼整个美国科技领域,近年来波音客机事故频发等暴露了更多、更大的问题。

在人工智能领域,前段时间还有个“著名”事件,在用中文问谷歌人工智能模型“双子座”Pro版(Gemini Pro)它是谁时,它会回答自己是“文心一言”,这个问题很快被谷歌消除。业界人士认为,其原因可能是谷歌在训练大模型的中文时“参考”了中国百度公司的大模型“文心一言”相关数据。

可见,中国科技近年来快速发展,一些独特的优势越来越引人注目,被美国同行“参考”甚至抄袭。

“中国人工智能研究的国际影响力越来越大”,刘知远说,“这次抄袭事件也从侧面反映了我们的创新成果正在受到国际关注”。他说,从横向来看,中国研究与国际顶尖成果仍有显著差距,但从纵向来看,中国已快速成长为人工智能科技创新的重要推动者。




本网转载内容出于更直观传递信息之目的。该内容版权归原作者所有,并不代表本网赞同其观点和对其真实性负责。如该内容涉及任何第三方合法权利,请点击投诉按钮,我们会及时反馈并处理完毕。
投诉
新闻中心
  • 快讯
  • 国内
  • 国际
  • 娱乐
  • 体育
点击加载更多>>>
点击加载更多>>>
点击加载更多>>>
点击加载更多>>>
点击加载更多>>>

关注东南网微信

扫码关注,了解福建

排行榜
  • 日排行
  • 周排行
  • 月排行
关于我们 | 广告服务 | 网站地图 | 网站公告
国新办发函[2001]232号 闽ICP备案号(闽ICP备05022042号) 互联网新闻信息服务许可证 编号:35120170001 网络文化经营许可证 闽网文〔2019〕3630-217号
信息网络传播视听节目许可(互联网视听节目服务/移动互联网视听节目服务)证号:1310572 广播电视节目制作经营许可证(闽)字第085号
网络出版服务许可证 (署)网出证(闽)字第018号 增值电信业务经营许可证 闽B2-20100029 互联网药品信息服务(闽)-经营性-2015-0001
福建日报报业集团拥有东南网采编人员所创作作品之版权,未经报业集团书面授权,不得转载、摘编或以其他方式使用和传播
职业道德监督、违法和不良信息举报电话:0591-87095151 举报邮箱:jubao@fjsen.com 福建省新闻道德委举报电话:0591-87275327 全国非法网络公关工商部门举报:010-88650507(白)010-68022771(夜)