启明创投&未尽研究发布《生成式AI》报告 提出“十大前瞻”

风君子博客7月7日消息,在2023世界人工智能大会(WAIC)启明创投论坛“生成式AI与大模型:变革与创新”上,启明创投携手未尽研究,共同发布报告《生成式AI》| State of Generative AI 2023。

2022年和2023年,是生成式人工智能技术取得突破的两年,过去半年最重要的研究方向,是破解和理解大模型神秘而又令人兴奋的智能“涌现”。大模型既需要超越对下一个词的预测能力,也需要一个更丰富、更复杂的“慢思考”深层机制,来监督“快思考”预测下一个词的机制。长期来看,人才对人工智能未来的影响,超过了算力。

基于研究,报告对未来一至三年的大语言模型、多模态模型和商业竞争态势,做出了十点前瞻:

大语言模型

1. 2024年中国将出现比肩GPT-4的多语言通用大模型;

2. 超长上下文(Long Context)将引领下一次LLM技术突破;

3. 在出现更有前景的大语言模型之前,为实现垂直领域更好的效果,以下三种方式将共存:
I)在不改变数据分布的情况下,利用更多通用数据进行通用大模型预训练,不特别引入行业数据,
ii)利用行业专属数据微调(Fine-Tuning)通用大模型,
iii)利用行业数据占比更高的数据集进行垂直模型预训练。

多模态模型

4. 当前CLIP + Diffusion的文生图模型是过渡态,未来2年内将出现一体化的模型结构;

5. 下一代Text-to-Image模型将具备更强的可控性,它将结合底层模型能力和前端控制方式,对模型的设计将注重与控制方式的结合;

6. 2025年之前,Video和3D等模态将迎来里程碑式的模型,大幅提高生成效果;

7. 以PALM-E为代表的具身智能(Embodied AI)展现出在机器人的感知、理解和决策等方向上的巨大潜力,但当前训练和可靠性存在较大挑战;

8. 短期内Transformer正成为多个模态的主流网络结构,但压缩整个数字世界的通用方法尚未出现,Transformer并不是人工智能技术的终点。

商业机会

9. 3年内,颠覆式的AI应用的核心驱动力来自于底层模型的创新,两者无法解耦,模型的作用将大于产品设计的作用;

10. 当前生成式AI市场处于技术主导的早期阶段,存在千亿美元市值的平台性企业的机会。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注