AI开源争议:Yi-34B模型涉LLaMA架构 贾扬清披露内情

   时间:2023-11-14 17:55 来源:虎科技

【虎科技】11月14日消息,创新工场的李开复于近期创立了AI大模型初创公司“零一万物”,旨在推动开放研究和商用应用。该公司发布了两个开源大模型,Yi-34B和Yi-6B,声称充分开放学术研究,并允许免费商用申请。

然而,在Yi-34B的Hugging Face开源主页上,开发者ehartford提出质疑,称该模型使用了meta LLaMA架构,仅修改了两个张量名称,分别为input_layernorm和post_attention_layernorm。

ehartford表示,开源社区很可能重新发布Yi大模型,并将张量重新命名以符合LLaMA架构。他呼吁该公司在模型被广泛采用之前考虑将这一更改应用到官方模型中,引发了广泛讨论。

IT之家发现,今日网络上流传着一张原阿里首席AI科学家贾扬清朋友圈的截图,内容称某国内大厂新模型实际上采用了LLaMA的架构,仅仅为了区分,修改了代码中的命名,并更改了一些变量名。

截至IT之家发稿时,零一万物官方尚未就此事作出回应。

贾扬清于今年3月宣布离开阿里巴巴,与美国合作伙伴共同创立了名为Lepton AI的新型AI公司,旨在打造高效的AI应用平台。

 
 
更多>同类内容
推荐图文
推荐内容
点击排行
 
智快科技微信账号
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群