AI大语言模型LLM,为啥老被翻译成“法学硕士”?


但凡偷懒一点,喜欢用浏览器或者翻译插件来看英语新闻的同学,估计都免不了在 AI 大模型火热的当下,被满篇的“法学硕士”晃得眼花。

并不是大语言模型 LLM(Large Language Model)真的和法学有强关联,而只是一个缩写词的歧义解释而已。

为什么大模型掀起的新一波 AI 浪潮已如此汹涌,而浏览器和翻译软件,还是坚持将 LLM 翻译成“法学硕士”?大模型这“硕士帽”什么时候能摘掉?

一、论“LLM 浓度”,大模型还是弟弟

首先需要说明的是,“LLM”这个缩写,在英文中既可以指代现在火热的“大语言模型 Large Language Model”;同时,在教育领域,它通常指的是“Legum Magister”或“Master of Laws”,即法学硕士。

而对于像 Google 浏览器配备的机器翻译功能,最常见的难题就是歧义和对上下文的理解。

机器翻译通常依赖大量的文本数据来学习如何翻译词语和短语。如果大多数 “LLM”出现在与法律相关的上下文中,翻译系统可能会学习到 “LLM”通常指的是 “法学硕士”。除非系统能够识别出特定的技术上下文,否则它可能不会选择 “大型语言模型”作为翻译。

即便现在大语言模型带动的生成式 AI 如此火热,但其实像 LLM 这类词汇在非技术人群中的普及度不高,这意味着翻译系统在其训练数据中,可能没有足够的实例来学习这种特定的上下文使用。

也就是说,LLM 作为“大语言模型”在机器翻译中的重要程度,还没有其作为“法学硕士”的程度高。

有图为证:

过去一年 AI LLM 和 Law LLM 关键词热度对比。图源:Google Trends

以“AI LLM”(人工智能,大语言模型)和“Law LLM”(法律,法学硕士)为关键词,截取两个关键词过去一年 Google Trends 的对比图,可以轻易看出,AI LLM 这一词从去年 11 月 ChatGPT 推出后才开始逐渐升温,而此时代表真正的法学硕士的 Law LLM 热度一直在“50 分”左右。

而在 2023 年 3 月中旬,AI LLM 迎来了自己的第一波热度高潮,当时发生了什么?答案是美国当地时间 3 月 14 日,OpenAI 正式推出了 ChatGPT-4,彻底引爆了 AI 市场。

到今年 5 月末,AI 在热度上彻底战胜 Law。图源:Google Trends

可以看到此后,只用了 2 个月时间,到 5 月末、6 月初,代表 AI LLM 的曲线不断上扬,彻底在搜索热度上超过 Law LLM,并且趋势一直延续到现在。

通过全球热力图可以看到,对于 AI LLM 的关注,中国网友是相当热情的——生成式 AI 、 OpenAI 和 ChatGPT 等关键词一直处于“飙升”状态。

虽然在近期热度上,AI 压制了“法学高材生”,但由于“大语言模型”在绝对数量级上处于下风,依然是“弟弟”,所以机器翻译中还是默认 LLM 为“法学硕士”。

二、还能改吗?怎么改?

所以,LLM 大语言模型这个“法学硕士”的帽子,就没办法摘下来了?

那倒也未必,不过确实需要一些时日,其中一些关键因素,可能会加快澄清误会的速度:

1. 技术术语的普及度

如果“大型语言模型”(Large Language Model)这一术语在网页、学术论文、新闻报道和社交媒体中的使用频率显著增加,搜索引擎更有可能学习到这一含义。

2. 搜索引擎算法的改进

随着搜索引擎算法的不断优化,它们在理解上下文和消除歧义方面的能力也在提高。这可能会加快正确翻译“LLM”这一术语的过程。

3. 用户反馈和行为

用户在使用搜索引擎时的行为和反馈也会影响算法。如果用户经常搜索与大型语言模型相关的内容,并在搜索结果中选择与之相关的链接,搜索引擎会逐渐学习并调整其算法。

4. 技术领域的发展

随着大型语言模型在技术领域的应用越来越广泛,与之相关的内容和讨论也会增加,这有助于提高搜索引擎对这一术语的识别能力。

Techmeme 上的赞助商广告 LLM 被直接翻译成法学硕士。图源:Techmeme

以目前 AI 的热度来看,LLM 被统一翻译成“大语言模型”的未来,可能不会太久就会到来。而时间和进度,很可能就掌握在所有网友手中。

不过,这对于真正的法律界和教育界可能也是个小问题,如果 LLM 就是“AI 大语言模型”的观念深入人心,那未来有人想凭借 LLM 来搜索当地“法学硕士”考试的同学,可能会在网上多绕一会儿了。而法律专业学校在做搜索引擎优化的时候,也得多花点力气了。

在这个信息爆炸的时代,术语的含义也在不断演变。从“法学硕士”到“大语言模型”,LLM 的双重身份让我们见证了语言的多样性和技术的进步。让我们拭目以待,看看这个小小的缩写将如何在我们的语言和技术中继续演化。