风君子博客10月9日,美图公司举办15周年生日会并发布自研AI视觉大模型MiracleVision(奇想智能)3.0版本。面世100天后,美图AI视觉大模型MiracleVision3.0将全面应用于美图旗下影像与设计产品,并将助力电商、广告、游戏、动漫、影视五大行业。
美图视觉大模型的100天进化:奇思妙想与智能创作
在美图公司15周年生日会现场,美图公司创始人、董事长兼首席执行官吴欣鸿发布了自研AI视觉大模型MiracleVision3.0版本。
美图公司创始人、董事长兼首席执行官吴欣鸿
吴欣鸿介绍说,三个月前,MiracleVision绘画水平还停留在初级阶段,如今3.0版本已经能描绘出真实细腻的画面细节,目前用户可以访问AI视觉创作工具“WHEE”官网体验。
吴欣鸿将自己15岁的绘画作品与面世100天的美图视觉大模型生成作品进行对比,他认为训练AI与人类学画有很多共通之处,通过充分学习不同的绘画风格和技巧,AI能创作出具有独特性的原创作品。
美图公司将自研AI视觉大模型MiracleVision(奇想智能)的核心能力拆解为“奇思妙想”和“智能创作”两大特性。
在“奇思妙想”层面,MiracleVision通过“提示词智能联想”功能降低大众的使用门槛,当用户输入关键词,MiracleVision可自动补充相关表述,如光影效果、质感、风格、图片质量等,推动创作平权。此外,MiracleVision通过“提示词精准控制”功能来满足更加专业的设计要求,如使用“近景”、“远景”、“顺光”、“逆光”等描述控制最终生成效果。
在“智能创作”层面,MiracleVision通过“深化创作”功能,可以进一步丰富作品细节和提升表现力。通过“AI画面扩展”功能让作品尺寸更大、细节更丰富。通过“局部修改”功能,对部分画面进行精准修改与调整。通过“分辨率提升”功能生成高清大图,让细节表现、色彩展示、物体辨识更加的精准和生动。
助力电商、广告、游戏、动漫、影视五大行业
在吴欣鸿看来,AI视觉大模型带来的不仅仅是更好的视觉呈现,还有对工作流的效率提升,但目前大模型与工作流的结合仍在探索阶段,抓住应用场景的核心需求更为重要。
吴欣鸿介绍说,MiracleVision将落地电商、广告、游戏、动漫、影视五大行业,希望能帮助五大行业“工作流提效”。
在电商行业,从涂鸦生成线稿、线稿上色、商品图、模特试穿图,再到电商物料输出,全程可通过MiracleVision实现。
在广告行业,MiracleVision覆盖创意脑暴、创意深化、平面排版、多尺寸延展、线下投放预览的全工作流,助力客户在广告物料制作环节提效。
在游戏行业,MiracleVision可以包揽场景设计、角色设计、道具设计、UI图标、宣发物料等流程,拓宽设计师想象空间的同时助力游戏行业降本。
在动漫行业,MiracleVision打通了概念设计、故事板生成、线稿上色、动漫补帧、视频转动漫等流程,支持创意到物料成品的快速落地。
在影视行业,MiracleVision的高可控性可充分满足概念场景设计、分镜设计、人物造型、道具设计、宣发物料的效果要求,极大提升影视行业设计环节的效率。
吴欣鸿表示,MiracleVision将充分发挥奇思妙想、智能创作的能力,在上述五大行业深耕,持续助力更多的设计场景。
视觉大模型应用普及将在2026-2030年走向成熟期
活动现场,吴欣鸿还分享了对于AI视觉大模型的思考。“AI视觉大模型的本质,是无穷无尽的视觉创意库。应用层相当于内容提取器,根据用户的需求,从这个巨大的创意库中提取所需要的内容,让用户在特定场景中使用。AI视觉大模型和应用之间相辅相成,大模型为应用提供技术支撑,应用反哺大模型的效果迭代。”
吴欣鸿表示,目前AI视觉大模型在生产端的三个待解决的问题是:垂直领域的极致效果、工作流整合、变现能力。随着AI视觉大模型和生产端的磨合,这三个问题会被逐步解决。
在吴欣鸿看来,视觉大模型应用普及将经历三个阶段:2024年之前为探索期,2024-2025年为高速发展期,2026-2030年为成熟期,随着视觉大模型在生产端的应用走向成熟,视觉大模型将助力千万设计场景,引领美学的升级与社会经济增长。
此外,美图公司还公布了6月19日发布的影像生产力工具最新数据:AI视觉创作工具“WHEE”的优质AI效果生成数已超过550万张,打造的设计师生态也初见成效;AI口播视频工具“开拍”月活跃用户数已突破35万;桌面端AI视频编辑工具“WinkStudio”已累计服务近10万名视频创作者;主打AI商业设计的“美图设计室”正助力近百万中小电商卖家降本增效;美图AI助手“RoboNeo”每天帮助近万名用户自动修图,比传统修图效率提升35%;AI数字人生成工具“DreamAvatar”于8月底上线并主打“AI演员”数字人服务。