GPT-5 不会真正突破,24 年 AGI 不会实现!全网 AI 大佬 24 年最全预测

  新智元报道  

编辑:Aeneas 桃子

【新智元导读】经过 23 年的生成式 AI 之年,24 年 AI 会有哪些新突破?大佬预测,即使 GPT-5 发布,LLM 在本质上仍然有限,在 24 年,基本的 AGI 也不足以实现。

23 年是当之无愧的「生成式 AI 之年」。

24 年,AI 技术会有哪些突破?

英伟达高级科学家 Jim Fan 称,2024 年将是视频年。尽管机器人和具身智能体才刚刚起步,但我认为视频 AI 将在未来 12 个月内迎来突破性进展的时刻。

OpenAI 联创 Greg Brockman 则预测:2024 年,AI 的能力、安全性、潜在影响的积极性上,都会是突破性的一年。

当然,从更长远的角度看,这只是又一个指数级的一年,让每个人的生活都比今天更好。

新的一年,人工智能还会像 2023 年一样,大放异彩吗?

AI 大佬 2024 预测

Meta 的研究员 Martin Signoux 对 2024 年 AI 做出了 8 大预测,就连 LeCun 大佬表示深度赞同。

首先,人工智能智能眼镜蔚然成风。随着多模态技术的兴起,领先的人工智能公司将加倍努力开发人工智能可穿戴设备。还有什么比眼镜外形更适合承载人工智能助手呢?

ChatGPT 之于人工智能助手,就像谷歌之于搜索一样。2023 年,ChatGPT 开始大放异彩,Bard、Claude、Llama、Mistral 和数以千计的衍生产品相继问世。

随着产品化的继续推进,ChatGPT 将不再是这个领域的唯一参考标准,其估值也将面临修正。

大模型模型再见,多模态模型你好。LMM 将不断涌现,并在多模态评估、多模态安全、多模态这个、多模态那个的争论中取代 LLM。此外,LMM 是迈向真正通用人工智能助手的垫脚石。

没有重大突破,但各方面都有改进。新模型不会带来真正的突破(GPT-5),LLM 在本质上仍然有限,而且容易产生幻觉。我们不会看到任何飞跃,使它们在 2024 年可靠到足以「解决基本的 AGI」。

在 RAG、数据整理、更好的微调、量化等方面的改进,将使 LLM 在许多用例中变得足够强大 / 有用,从而推动各行业各种服务的采用。

小模型(SLM)已经出现,但成本效益和可持续发展的考虑将加速这一趋势。量化技术也将大大提高,从而推动消费服务的设备集成浪潮。

开源模型击败 GPT-4,开源与封闭之争逐渐平息。回顾过去 12 个月开源社区的活力和进步,很明显,开源模型将很快缩小性能差距。

基准仍然是一个难题。没有一套基准、排行榜或评估工具能够成为模型评估的一站式服务。相反,我们将看到一系列改进(如 HELM)和新举措(如 GAIA),尤其是在多模态方面。

与现有风险相比,存在的风险不会引起太多讨论。虽然 X 风险成为 2023 年的头条新闻,但公众讨论将更多地关注与偏见、假新闻、用户安全、选举诚信等相关的现有风险和争议。

Lightning AI 的创始人 William Falcon 对 2024 年的预测是:

– 1B 模型性能将优于 70B。

– 在 CPU 上部署模型几乎是免费的,而不是 API 服务。

– 数据质量将使性能提升 10 倍。

– 开源模型的组合将击败最好的私有模型。

– 编译器将使模型(训练和推理)的速度至少提高 80%。

– 立法将支持内容创建者,而非模型开发者。

开源工具平台 LlamaIndex 的创始人 Jerry Liu 表示,

– RAG 将继续成为一个大焦点

– 每个 AI 工程师仍然需要强大的软件工程基础。

– 向量数据库开始开发类 SQL 接口并支持多模态

– 多模态模型在文档处理中得到更多使用(但首先,计算成本 / 延迟需要降低)

– 类似 GPT-4 的全部能力成为开源,并且更快 / 更便宜。

– 如果是这种情况,智能体的开发会重新蓬勃发展。

– 提示和以前一样重要,但提示工程的重要性会下降

2023 年,ChatGPT 访问量全球居首

过去一年里,AI 无处不在,甚至重新定义了整个行业。

在线内容写作公司 Writerbuddy AI 使用 SEO 行业著名的工具 SEMrush,通过抓取 AI 工具数据,研究了 3000 + 种 AI 工具。

结果发现,从 2022 年 9 月-2023 年 8 月,排名前 50 的 AI 工具,产生了超过 240 亿次的惊人访问量,平均每月增长 2.363 亿次。

其中,ChatGPT 独占了 140 亿流量,占分析流量的 60%。

以下是报告中的关键发现:

– AI 行业平均每月增长 2.363 亿次访问量。分析的 50 个人工智能工具经历了 10.7 倍的增长率,平均每月访问量增加 2.363 亿次。

– 过去 12 个月中,AI 应用每月平均访问量达到 20 亿次。过去 6 个月,每月平均访问量激增至 33 亿次。

– ChatGPT、Character AI 和 Google Bard 的访问量分别净增长了 18 亿次、4.634 亿次和 6800 万次。

– 访问量最高 AI 聊天机器人:ChatGPT 处于绝对领先地位,占 AI 聊天机器人类别总访问量的 76.31%。紧随其后的是 Character AI,以 19.86% 的访问量位居第二。

– Craiyon、Midjourney 和 Quillbot 面临最大的流量下降。

– 美国贡献了 55 亿人次访问量,占总访问量的 22.62%,而欧洲国家合计贡献了 39 亿人次访问量。

– AI 聊天机器人工具最受欢迎,访问量达到 191 亿次。

– 超过 63% 的 AI 工具用户通过移动设备访问。存在性别差异,69.5% 为男性用户,30.5% 为女性用户

除了风靡全球的 ChatGPT,23 年的这些技术也很惊艳

23 年过去了,这一年的关键词,无疑就是「生成式 AI」。

22 年底 ChatGPT 的推出,以及 23 年 3 月发布的 GPT-4,让全世界见识到了大语言模型的广泛可用性,让 23 年变成了属于文本、音频和视频生成式 AI 的一年。

除了今年的「宠儿」ChatGPT 之外,其他公司的锋芒也不应被忽视,比如放出了第一个开源语言模型的公司,和几家新的 AI 初创公司,包括在年底发布了目前可用的最佳开源语言模型 Mixtral 8x7B 的 Mistral。

除此之外,还有以下这些让人印象深刻的技术。

斯坦福小镇和机器猫

「斯坦福小镇」,展示了令人印象深刻的文本和编码任务的应用。

团队创建了一个受模拟人生启发的沙盒环境,其中的 25 名 AI 智能体,每个都有属于自己的职业和个性,可以自主互动。

这些智能体表现出了可信的个人和紧急社交行为,包括做计划、参加情人节派对。这项工作展示了基于 LLM 的智能体如何相互交互,并产生了有趣的结果。

这一想法已被其他研究和开源项目所采用,例如 Auto-GPT 和 BabyAGI,而 OpenAI 则通过 Assistant API,将其大大简化。

GPT-4 等基础模型,也已用于机器人技术,取得了一些进展,比如谷歌的机器人 RT-2 和 RoboCat。

RT-2 是一种用于机器人控制的 AI 模型,可以从机器人和网络数据中学习。该模型可以处理文本和图像输入,并利用其广泛的网络知识来执行尚未经过明确训练的任务。

在 6000 多次机器人测试中,RT-2 在未经训练的任务中的成功率,几乎是其前身的两倍。

另一方面,RoboCat 是一种 AI,可以生成训练数据,以改善机器人的控制。

其他公司的技术,如英伟达的多模态 VIMA 模型,也在机器人技术中使用了基础模型。

DreamerV3 和 FunSearch

在强化学习领域,研究者们也取得了不少重要成果。

一个例子是 DreamerV3,它可以处理完全不同的问题,而无需任何调整。

在没有人类模型的情况下,DreamerV3 就会学习如何在 Minecraft 中开采钻石。

今年早些时候,DeepMind 还展示了 AdA(Adaptive Agent),这是 DeepMind 的一个基础强化学习模型。

AdA 遵循基础模型的经典配方,在具有大量数据的任务上进行了训练。AdA 之所以意义重大,是因为它表明了,强化学习中的扩展可以使模型在其他任务上表现更好。

在各个科学领域,深度学习展现出越来越多的作用。

DeepMind 开发了 AlphaTensor,一种用于快速矩阵乘法的新算法。

同时,DeepMind 最新版本的 AlphaFold 蛋白质结构预测系统,克服了之前版本的许多弱点,为计算结构预测开辟了新的可能性。

此外,Google DeepMind 还展示了 FunSearch,这是首次使用代码生成语言模型与进化搜索算法相结合,为数学问题找到以前未知的解决方案。

OthelloGPT、Q-Star 和 AI 法案

2023 年,也是 AI 监管的一年,和对 AI 存在主义风险发出警告的一年。

这种趋势无疑也会刺激业界研究,好让人类更好地理解 LLM 的内部工作原理。

这期间有一些有趣的论文,比如 OthelloGPT,微软的 GPT-4 体现了 AGI 火花,以及谷歌关于大模型「顿悟」的论文。

提示工程领域提供了对 LLM 的见解。

François Chollet 将提示工程解释为寻找正确的向量程序和 Promptbreeder,这表明,提示在未来可能会变得更加自动化。

在年末,传起了关于 Q-Star 的谣言,伴随着人们的 AI 的恐惧、AGI 的炒作、以及短短几天多次反转的 OpenAI 宫斗闹剧。

在 2024 年,或许我们会看到猜测变少,谈判变多。

AI 训练使用的数据,在哪些范畴内是合理的?最近纽约时报对 OpenAI 发起的诉讼,引起了全社会范围内的广泛探讨。

类似的辩论,也将在欧盟上演,在今年年底前,欧盟各国就《欧盟人工智能法案》达成一致。这一法案的细节将在明年决定,并且对欧洲的人工智能市场产生重大影响。

2024 AI 展望

在经历了爆炸性的 2023 年之后,2024 年的人工智能领域又将会有哪些进展?

毋庸置疑,在这个新的一年里,我们仍将看到领先的 AI 在许多新的创造性方式中应用,推动整个行业的进步。

Copilot AI 登台:智能体时代来临

OpenAI 在首届开发者大会上发布的 GPTs、Assitants 等工具,微软产品全线更名 Copilot 等等,智能体在今年迎来了大爆发。

这些工具已经开始在一个又一个行业产生影响,但我们迄今所看到的与即将到来的相比微不足道。

今年早些时候,来自普林斯顿、谷歌团队发表的 ReAct 论文展示了大模型如何有效地学习如何使用工具,并推动了这方面的大量研究。

OpenAI、Anthropic 在内的公司已经花了一年的时间来调整自家模型,以便更好地使用这种技术。

比如,OpenAI 的函数调用,以及 Anthropic 的 Claude XML 支持。

项目地址:https://react-lm.github.io/

还有一些研究机构专门训练了专门的大模型,比如伯克利的 Gorilla LLM。

另外,开源代码库 Langchain、Rivet 等都让智能体变得容易得多。

看得见,AI 智能体比以往任何时候都更容易开发,成本也更低。它们在发挥人类聪明才智的同时,还能深入连接对用户和公司最重要的数据。

2024 年,我们将看到「智能体时代」的到来,这是通过软件满足需求和与技术互动的一个全新方向的开端。

多模态大模型突破视觉障碍

ChatGPT 能够理解和表达人类自然语言,这是吸引用户和开发者的突破性功能。

但是,2024 年将看到 AI 视觉可能会更加重要,影响更加深远。

文字固然强大,但图像、视频、音频能以更集中的方式传递信息和情感。思想的空间表达是一种非常强大的工具,可以简单地传达复杂的概念。

LLM 不仅能对文本数据进行训练,还能对视觉数据进行训练,多模态能力更加明显。

我们已经看到,Ai Pin、Apple Vision 等可穿戴设备的发展,它们有望为我们的日常生活提供帮助。

例如,它们可以提供与交流的人的背景信息、与工作相关的视觉提示,或完成任务的实时建议。

创新将走向何方?速度有多快?现在还很难说,但能够解读图像和视频并对环境中的物理变化做出即时反应,为智能人工智能只能以如何帮助人类增添了一个极其重要的维度。

AI 操控达到危险级别

AI 爆发为各个领域带来翻天,覆地的变化的同时,也让我们看到 AI 生成虚假信息给生活带来了困扰。

在人类历史上,大规模影响和操纵 AI 从未如此强大,也从未如此普及。

人工智能已经让人们几乎无法辨别「真实」的社交互动与内容,因为图像,甚至视频都可以很轻而易举地生成。

未来一年,人工智能操纵可能会大行其道,从自动勒索和欺诈到阴谋论的传播。

总而言之,2024 年,人工智能将给世界带来许多令人难以置信的东西,但它也将以新的方式挑战我们。

知友预测

关于此话题的畅想,也上了知乎热榜。

知友「引线小白」预测,在 24 年,模型效果会进一步突破,可能只要 7B 的模型推理资源,就能与现在的 GPT-4 持平。

随着部署成本大幅下降,24 年可能就会成为 AI Agent 元年,出现一个爆款。

多模态进多模态出一统江湖的模型,有可能出现。

第一部 AI 电影,也有望在 24 年出现。

清华自动化系在读博士认为,「多模态大模型取得进一步突破,图片和视频生成能力进一步提升。更多的人力工作,特别是需要部分创造力的工作被取代。部分领域大模型的涌现能力进一步凸显,表现出一些更加具有创造性的行为。」

AI 架构师「春阳 CYang」预估,2024 年应该是 AI 大模型应用落地的元年。

2023 一整年,虽然大模型火爆,但真正能够落地的产品还很少,只集中在改写文案等浅层的应用上。

但现在,有很多大模型领域的创意产品在落地了,可以期待一波。

程序员 @小五哥预测道 ——

大语言模型将在手机端运算推理;Agent 将代替人做一些更实用的事情;最令人开心的是,人形机器人很可能帮我们洗衣、拖地、做饭、收拾房间了!

参考资料:

  • https://writerbuddy.ai/blog/ai-industry-analysis

  • https://x.com/gdb/status/1741529664856764556?s=20

  • 2023/https://www.zhihu.com/question/635190738

  • https://www.zhihu.com/question/635190738/answer/3327969527

  • https://www.zhihu.com/question/635190738/answer/3334551780

本文来自微信公众号:新智元 (ID:AI_era)

Published by

风君子

独自遨游何稽首 揭天掀地慰生平