论「LLM 浓度」,大模型还是弟弟
首先需要说明的是,「LLM」这个缩写,在英文中既可以指代现在火热的「大语言模型 Large Language Model」;同时,在教育领域,它通常指的是「Legum Magister」或「Master of Laws」,即法学硕士。
而对于像 Google 浏览器配备的机器翻译功能,最常见的难题就是歧义和对上下文的理解。
机器翻译通常依赖大量的文本数据来学习如何翻译词语和短语。如果大多数 「LLM」出现在与法律相关的上下文中,翻译系统可能会学习到 「LLM」通常指的是 「法学硕士」。除非系统能够识别出特定的技术上下文,否则它可能不会选择 「大型语言模型」作为翻译。
即便现在大语言模型带动的生成式 AI 如此火热,但其实像 LLM 这类词汇在非技术人群中的普及度不高,这意味着翻译系统在其训练数据中,可能没有足够的实例来学习这种特定的上下文使用。
也就是说,LLM 作为「大语言模型」在机器翻译中的重要程度,还没有其作为「法学硕士」的程度高。
有图为证。
过去一年 AI LLM 和 Law LLM 关键词热度对比|Google Trends
以「AI LLM」(人工智能,大语言模型)和「Law LLM」(法律,法学硕士)为关键词,截取两个关键词过去一年 Google Trends 的对比图,可以轻易看出,AI LLM 这一词从去年 11 月 ChatGPT 推出后才开始逐渐升温,而此时代表真正的法学硕士的 Law LLM 热度一直在「50 分」左右。
而在 2023 年 3 月中旬,AI LLM 迎来了自己的第一波热度高潮,当时发生了什么?答案是美国当地时间 3 月 14 日,OpenAI 正式推出了 ChatGPT-4,彻底引爆了 AI 市场。
到今年 5 月末,AI 在热度上彻底战胜 Law|Google Trends
可以看到此后,只用了 2 个月时间,到 5 月末、 6 月初,代表 AI LLM 的曲线不断上扬,彻底在搜索热度上超过 Law LLM,并且趋势一直延续到现在。
关于 AI 的关键词都处于飙升的状态|Google Trends
通过全球热力图可以看到,对于 AI LLM 的关注,中国网友是相当热情的——生成式 AI 、 OpenAI 和 ChatGPT 等关键词一直处于「飙升」状态。
虽然在近期热度上,AI 压制了「法学高材生」,但由于「大语言模型」在绝对数量级上处于下风,依然是「弟弟」,所以机器翻译中还是默认 LLM 为「法学硕士」。
还能改吗?怎么改?
所以,LLM 大语言模型这个「法学硕士」的帽子,就没办法摘下来了?
那倒也未必,不过确实需要一些时日,其中一些关键因素,可能会加快澄清误会的速度:
技术术语的普及度
如果「大型语言模型」(Large Language Model)这一术语在网页、学术论文、新闻报道和社交媒体中的使用频率显著增加,搜索引擎更有可能学习到这一含义。
搜索引擎算法的改进
随着搜索引擎算法的不断优化,它们在理解上下文和消除歧义方面的能力也在提高。这可能会加快正确翻译「LLM」这一术语的过程。
用户反馈和行为
用户在使用搜索引擎时的行为和反馈也会影响算法。如果用户经常搜索与大型语言模型相关的内容,并在搜索结果中选择与之相关的链接,搜索引擎会逐渐学习并调整其算法。
技术领域的发展
随着大型语言模型在技术领域的应用越来越广泛,与之相关的内容和讨论也会增加,这有助于提高搜索引擎对这一术语的识别能力。
Techmeme 上的赞助商广告 LLM 被直接翻译成法学硕士|Techmeme
以目前 AI 的热度来看,LLM 被统一翻译成「大语言模型」的未来,可能不会太久就会到来。而时间和进度,很可能就掌握在所有网友手中。
不过,这对于真正的法律界和教育界可能也是个小问题,如果 LLM 就是「AI 大语言模型」的观念深入人心,那未来有人想凭借 LLM 来搜索当地「法学硕士」考试的同学,可能会在网上多绕一会儿了。而法律专业学校在做搜索引擎优化时候,也得多花点力气了。
在这个信息爆炸的时代,术语的含义也在不断演变。从「法学硕士」到「大语言模型」,LLM 的双重身份让我们见证了语言的多样性和技术的进步。让我们拭目以待,看看这个小小的缩写将如何在我们的语言和技术中继续演化。