为啥大语言模型都跟羊驼干上了?
作者:Jian Shuo Wang 发表于:2023-05-09 18:57 · 未分类这是我猜想。
大语言模型(Large Language Modal)简称 LLM。
LLM 发音困难。两个 LL 跟绕口令一样挑战舌头。大家想给它加点原音,帮助发音。
有人加了 A,就是LLaMA。而 llama 在西班牙语里正好是羊驼🦙。
在西班牙,发音为 /yama/,在南美为 /jama/,而英语国家发成 /lama/。
Stanford 在 LLaMA 基础上微调出来的模型,跟着叫 Alpaca。这个词西班牙语里面也是羊驼🦙。
不过 Alpaca 是这样的:

它就是我们所熟知的萌萌的小可爱,摸起来跟猫一样,小小的,毛软软的,捏它的脸它也不生气,性格和猫类似,温暖稳定,让人忍不住想带一只回家养。

Llama 是完全不同的品种。肉眼很容易分辨。是这样的:


像驴子一样,个头高大,臭烘烘的,让人敬而远之。
秘鲁人饲养它们的用途也不一样,可爱的 Alpaca 主要是要剪毛,而壮实的 Llama 用来驼东西。

UC Berkeley 等大学最近放出来的模型 Vicuna 也顺理成章的用了羊驼的另外一个品种,西班牙语是 vicuña (ña 读作 nia)。这个是野生的,也是秘鲁的国家标志。
我猜测,如果名字再不够用,以后的大模型还会叫做 guanaco,这些也是羊驼的种类。
就这样,阴错阳差的,大语言模型行业变成了羊驼饲养业。