GPT-5 不会真正突破，24 年 AGI 不会实现！全网 AI 大佬 24 年最全预测

新智元报道

编辑：Aeneas 桃子

【新智元导读】经过 23 年的生成式 AI 之年，24 年 AI 会有哪些新突破？大佬预测，即使 GPT-5 发布，LLM 在本质上仍然有限，在 24 年，基本的 AGI 也不足以实现。

23 年是当之无愧的「生成式 AI 之年」。

24 年，AI 技术会有哪些突破？

英伟达高级科学家 Jim Fan 称，2024 年将是视频年。尽管机器人和具身智能体才刚刚起步，但我认为视频 AI 将在未来 12 个月内迎来突破性进展的时刻。

OpenAI 联创 Greg Brockman 则预测：2024 年，AI 的能力、安全性、潜在影响的积极性上，都会是突破性的一年。

当然，从更长远的角度看，这只是又一个指数级的一年，让每个人的生活都比今天更好。

新的一年，人工智能还会像 2023 年一样，大放异彩吗？

AI 大佬 2024 预测

Meta 的研究员 Martin Signoux 对 2024 年 AI 做出了 8 大预测，就连 LeCun 大佬表示深度赞同。

首先，人工智能智能眼镜蔚然成风。随着多模态技术的兴起，领先的人工智能公司将加倍努力开发人工智能可穿戴设备。还有什么比眼镜外形更适合承载人工智能助手呢？

ChatGPT 之于人工智能助手，就像谷歌之于搜索一样。2023 年，ChatGPT 开始大放异彩，Bard、Claude、Llama、Mistral 和数以千计的衍生产品相继问世。

随着产品化的继续推进，ChatGPT 将不再是这个领域的唯一参考标准，其估值也将面临修正。

大模型模型再见，多模态模型你好。LMM 将不断涌现，并在多模态评估、多模态安全、多模态这个、多模态那个的争论中取代 LLM。此外，LMM 是迈向真正通用人工智能助手的垫脚石。

没有重大突破，但各方面都有改进。新模型不会带来真正的突破（GPT-5)，LLM 在本质上仍然有限，而且容易产生幻觉。我们不会看到任何飞跃，使它们在 2024 年可靠到足以「解决基本的 AGI」。

在 RAG、数据整理、更好的微调、量化等方面的改进，将使 LLM 在许多用例中变得足够强大 / 有用，从而推动各行业各种服务的采用。

小模型（SLM）已经出现，但成本效益和可持续发展的考虑将加速这一趋势。量化技术也将大大提高，从而推动消费服务的设备集成浪潮。

开源模型击败 GPT-4，开源与封闭之争逐渐平息。回顾过去 12 个月开源社区的活力和进步，很明显，开源模型将很快缩小性能差距。

基准仍然是一个难题。没有一套基准、排行榜或评估工具能够成为模型评估的一站式服务。相反，我们将看到一系列改进（如 HELM）和新举措（如 GAIA），尤其是在多模态方面。

与现有风险相比，存在的风险不会引起太多讨论。虽然 X 风险成为 2023 年的头条新闻，但公众讨论将更多地关注与偏见、假新闻、用户安全、选举诚信等相关的现有风险和争议。

Lightning AI 的创始人 William Falcon 对 2024 年的预测是：

– 1B 模型性能将优于 70B。

– 在 CPU 上部署模型几乎是免费的，而不是 API 服务。

– 数据质量将使性能提升 10 倍。

– 开源模型的组合将击败最好的私有模型。

– 编译器将使模型（训练和推理）的速度至少提高 80%。

– 立法将支持内容创建者，而非模型开发者。

开源工具平台 LlamaIndex 的创始人 Jerry Liu 表示，

– RAG 将继续成为一个大焦点

– 每个 AI 工程师仍然需要强大的软件工程基础。

– 向量数据库开始开发类 SQL 接口并支持多模态

– 多模态模型在文档处理中得到更多使用（但首先，计算成本 / 延迟需要降低）

– 类似 GPT-4 的全部能力成为开源，并且更快 / 更便宜。

– 如果是这种情况，智能体的开发会重新蓬勃发展。

– 提示和以前一样重要，但提示工程的重要性会下降

2023 年，ChatGPT 访问量全球居首

过去一年里，AI 无处不在，甚至重新定义了整个行业。

在线内容写作公司 Writerbuddy AI 使用 SEO 行业著名的工具 SEMrush，通过抓取 AI 工具数据，研究了 3000 + 种 AI 工具。

结果发现，从 2022 年 9 月-2023 年 8 月，排名前 50 的 AI 工具，产生了超过 240 亿次的惊人访问量，平均每月增长 2.363 亿次。

其中，ChatGPT 独占了 140 亿流量，占分析流量的 60%。

以下是报告中的关键发现：

– AI 行业平均每月增长 2.363 亿次访问量。分析的 50 个人工智能工具经历了 10.7 倍的增长率，平均每月访问量增加 2.363 亿次。

– 过去 12 个月中，AI 应用每月平均访问量达到 20 亿次。过去 6 个月，每月平均访问量激增至 33 亿次。

– ChatGPT、Character AI 和 Google Bard 的访问量分别净增长了 18 亿次、4.634 亿次和 6800 万次。

– 访问量最高 AI 聊天机器人：ChatGPT 处于绝对领先地位，占 AI 聊天机器人类别总访问量的 76.31%。紧随其后的是 Character AI，以 19.86% 的访问量位居第二。

– Craiyon、Midjourney 和 Quillbot 面临最大的流量下降。

– 美国贡献了 55 亿人次访问量，占总访问量的 22.62%，而欧洲国家合计贡献了 39 亿人次访问量。

– AI 聊天机器人工具最受欢迎，访问量达到 191 亿次。

– 超过 63% 的 AI 工具用户通过移动设备访问。存在性别差异，69.5% 为男性用户，30.5% 为女性用户

除了风靡全球的 ChatGPT，23 年的这些技术也很惊艳

23 年过去了，这一年的关键词，无疑就是「生成式 AI」。

22 年底 ChatGPT 的推出，以及 23 年 3 月发布的 GPT-4，让全世界见识到了大语言模型的广泛可用性，让 23 年变成了属于文本、音频和视频生成式 AI 的一年。

除了今年的「宠儿」ChatGPT 之外，其他公司的锋芒也不应被忽视，比如放出了第一个开源语言模型的公司，和几家新的 AI 初创公司，包括在年底发布了目前可用的最佳开源语言模型 Mixtral 8x7B 的 Mistral。

除此之外，还有以下这些让人印象深刻的技术。

斯坦福小镇和机器猫

「斯坦福小镇」，展示了令人印象深刻的文本和编码任务的应用。

团队创建了一个受模拟人生启发的沙盒环境，其中的 25 名 AI 智能体，每个都有属于自己的职业和个性，可以自主互动。

这些智能体表现出了可信的个人和紧急社交行为，包括做计划、参加情人节派对。这项工作展示了基于 LLM 的智能体如何相互交互，并产生了有趣的结果。

这一想法已被其他研究和开源项目所采用，例如 Auto-GPT 和 BabyAGI，而 OpenAI 则通过 Assistant API，将其大大简化。

GPT-4 等基础模型，也已用于机器人技术，取得了一些进展，比如谷歌的机器人 RT-2 和 RoboCat。

RT-2 是一种用于机器人控制的 AI 模型，可以从机器人和网络数据中学习。该模型可以处理文本和图像输入，并利用其广泛的网络知识来执行尚未经过明确训练的任务。

在 6000 多次机器人测试中，RT-2 在未经训练的任务中的成功率，几乎是其前身的两倍。

另一方面，RoboCat 是一种 AI，可以生成训练数据，以改善机器人的控制。

其他公司的技术，如英伟达的多模态 VIMA 模型，也在机器人技术中使用了基础模型。

DreamerV3 和 FunSearch

在强化学习领域，研究者们也取得了不少重要成果。

一个例子是 DreamerV3，它可以处理完全不同的问题，而无需任何调整。

在没有人类模型的情况下，DreamerV3 就会学习如何在 Minecraft 中开采钻石。

今年早些时候，DeepMind 还展示了 AdA（Adaptive Agent），这是 DeepMind 的一个基础强化学习模型。

AdA 遵循基础模型的经典配方，在具有大量数据的任务上进行了训练。AdA 之所以意义重大，是因为它表明了，强化学习中的扩展可以使模型在其他任务上表现更好。

在各个科学领域，深度学习展现出越来越多的作用。

DeepMind 开发了 AlphaTensor，一种用于快速矩阵乘法的新算法。

同时，DeepMind 最新版本的 AlphaFold 蛋白质结构预测系统，克服了之前版本的许多弱点，为计算结构预测开辟了新的可能性。

此外，Google DeepMind 还展示了 FunSearch，这是首次使用代码生成语言模型与进化搜索算法相结合，为数学问题找到以前未知的解决方案。

OthelloGPT、Q-Star 和 AI 法案

2023 年，也是 AI 监管的一年，和对 AI 存在主义风险发出警告的一年。

这种趋势无疑也会刺激业界研究，好让人类更好地理解 LLM 的内部工作原理。

这期间有一些有趣的论文，比如 OthelloGPT，微软的 GPT-4 体现了 AGI 火花，以及谷歌关于大模型「顿悟」的论文。

提示工程领域提供了对 LLM 的见解。

François Chollet 将提示工程解释为寻找正确的向量程序和 Promptbreeder，这表明，提示在未来可能会变得更加自动化。

在年末，传起了关于 Q-Star 的谣言，伴随着人们的 AI 的恐惧、AGI 的炒作、以及短短几天多次反转的 OpenAI 宫斗闹剧。

在 2024 年，或许我们会看到猜测变少，谈判变多。

AI 训练使用的数据，在哪些范畴内是合理的？最近纽约时报对 OpenAI 发起的诉讼，引起了全社会范围内的广泛探讨。

类似的辩论，也将在欧盟上演，在今年年底前，欧盟各国就《欧盟人工智能法案》达成一致。这一法案的细节将在明年决定，并且对欧洲的人工智能市场产生重大影响。

2024 AI 展望

在经历了爆炸性的 2023 年之后，2024 年的人工智能领域又将会有哪些进展？

毋庸置疑，在这个新的一年里，我们仍将看到领先的 AI 在许多新的创造性方式中应用，推动整个行业的进步。

Copilot AI 登台：智能体时代来临

OpenAI 在首届开发者大会上发布的 GPTs、Assitants 等工具，微软产品全线更名 Copilot 等等，智能体在今年迎来了大爆发。

这些工具已经开始在一个又一个行业产生影响，但我们迄今所看到的与即将到来的相比微不足道。

今年早些时候，来自普林斯顿、谷歌团队发表的 ReAct 论文展示了大模型如何有效地学习如何使用工具，并推动了这方面的大量研究。

OpenAI、Anthropic 在内的公司已经花了一年的时间来调整自家模型，以便更好地使用这种技术。

比如，OpenAI 的函数调用，以及 Anthropic 的 Claude XML 支持。

项目地址：https://react-lm.github.io/

还有一些研究机构专门训练了专门的大模型，比如伯克利的 Gorilla LLM。

另外，开源代码库 Langchain、Rivet 等都让智能体变得容易得多。

看得见，AI 智能体比以往任何时候都更容易开发，成本也更低。它们在发挥人类聪明才智的同时，还能深入连接对用户和公司最重要的数据。

2024 年，我们将看到「智能体时代」的到来，这是通过软件满足需求和与技术互动的一个全新方向的开端。

多模态大模型突破视觉障碍

ChatGPT 能够理解和表达人类自然语言，这是吸引用户和开发者的突破性功能。

但是，2024 年将看到 AI 视觉可能会更加重要，影响更加深远。

文字固然强大，但图像、视频、音频能以更集中的方式传递信息和情感。思想的空间表达是一种非常强大的工具，可以简单地传达复杂的概念。

LLM 不仅能对文本数据进行训练，还能对视觉数据进行训练，多模态能力更加明显。

我们已经看到，Ai Pin、Apple Vision 等可穿戴设备的发展，它们有望为我们的日常生活提供帮助。

例如，它们可以提供与交流的人的背景信息、与工作相关的视觉提示，或完成任务的实时建议。

创新将走向何方？速度有多快？现在还很难说，但能够解读图像和视频并对环境中的物理变化做出即时反应，为智能人工智能只能以如何帮助人类增添了一个极其重要的维度。

AI 操控达到危险级别

AI 爆发为各个领域带来翻天，覆地的变化的同时，也让我们看到 AI 生成虚假信息给生活带来了困扰。

在人类历史上，大规模影响和操纵 AI 从未如此强大，也从未如此普及。

人工智能已经让人们几乎无法辨别「真实」的社交互动与内容，因为图像，甚至视频都可以很轻而易举地生成。

未来一年，人工智能操纵可能会大行其道，从自动勒索和欺诈到阴谋论的传播。

总而言之，2024 年，人工智能将给世界带来许多令人难以置信的东西，但它也将以新的方式挑战我们。

知友预测

关于此话题的畅想，也上了知乎热榜。

知友「引线小白」预测，在 24 年，模型效果会进一步突破，可能只要 7B 的模型推理资源，就能与现在的 GPT-4 持平。

随着部署成本大幅下降，24 年可能就会成为 AI Agent 元年，出现一个爆款。

多模态进多模态出一统江湖的模型，有可能出现。

第一部 AI 电影，也有望在 24 年出现。

清华自动化系在读博士认为，「多模态大模型取得进一步突破，图片和视频生成能力进一步提升。更多的人力工作，特别是需要部分创造力的工作被取代。部分领域大模型的涌现能力进一步凸显，表现出一些更加具有创造性的行为。」

AI 架构师「春阳 CYang」预估，2024 年应该是 AI 大模型应用落地的元年。

2023 一整年，虽然大模型火爆，但真正能够落地的产品还很少，只集中在改写文案等浅层的应用上。

但现在，有很多大模型领域的创意产品在落地了，可以期待一波。

程序员 @小五哥预测道 ——

大语言模型将在手机端运算推理；Agent 将代替人做一些更实用的事情；最令人开心的是，人形机器人很可能帮我们洗衣、拖地、做饭、收拾房间了！

参考资料：

https://writerbuddy.ai/blog/ai-industry-analysis
https://x.com/gdb/status/1741529664856764556?s=20
2023/https://www.zhihu.com/question/635190738
https://www.zhihu.com/question/635190738/answer/3327969527
https://www.zhihu.com/question/635190738/answer/3334551780

本文来自微信公众号：新智元（ID：AI_era）