谷歌新推出了弱监督看图说话模型 SimVLM,能够轻松实现零样本学习(zero-shot)任务迁移。 从文字描述图像到回答图片相关问题,模型无需微调也能样样精通。 ...

关注我们的公众号

微信公众号