风君子博客4月28日消息,Sora爆火后,掀起了全球竞逐AI视频生成的热潮。近日,国内一支AI生成的视频短片引发关注。该视频来自生数科技联合清华大学最新发布的视频大模型Vidu。
根据官方介绍,该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
比如,输入“画室里的一艘船驶向镜头”这样一句简单的指令,Vidu就可以生成效果逼真、镜头连贯的一段视频。视频的整体质感可以与Sora相媲美。
除了可以生成复杂、细节丰富的场景,Vidu还可以虚构场景以及想象超现实主义的画面,具有多镜头语言,更好地理解生成熊猫、龙等富有中国文化特色的形象等。
据证券时报报道,基于在机器学习和多模态大模型的长期积累,生数科技团队在两个月时间里突破了长视频表示与处理的多项关键技术,成功研发推出Vidu视频大模型。
公开资料显示,生数科技成立于2023年3月,核心团队来自清华大学人工智能研究院,此外还包括来自北京大学和阿里巴巴、腾讯、字节跳动等科技公司的多位技术人才。截至2024年3月,生数科技员工总数超70人,其中近90%为研发人员。
生数科技由清华系AI公司瑞莱智慧RealAI、蚂蚁集团和百度发起的BV百度风投联合孵化创立,致力于打造可控多模态通用大模型。去年3月,生数科技开源了全球首个基于U-ViT框架的多模态扩散大模型UniDiffuser。
去年6月,生数科技获得蚂蚁集团、BV百度风投、卓源资本的近亿元天使轮融资;8月,完成了数千万元天使+轮融资,本轮融资由锦秋基金独家投资。
2024年3月,生数科技完成新一轮数亿元融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。
证券时报报道称,在三轮融资总计数亿元人民币的资本加持下,生数科技已成为目前国内多模态大模型中估值最高的初创公司之一。(周小白)