现实困境:
一.对大量数据的需求
1.数据太少深度网络学不好,容易发生过拟合
2.小模型也能从大数据中受益
3.模型训练大都采用监督学习的方法,需要人工标注
二.数据收集和标注的困难
1.人力,物力,财力
2.难以贴近真实应用场景,或者存在隐私和版权的问题
3.不同人标注的不一致性,多次检查增加工作量
4.增加新的类别需要增加新的标注
——————————————————–
弱监督学习:
基本思路:
1.用容易获得的标注替代较难获得的标注:图像类别vs物体边框
2.选择最需要做精细标注的样例
3.模型训练和自动标注交替进行
问题:
1.相比于用完全的监督信息训练的检测器,基于弱监督信息训练的检测器往往精度只有其一半
2.仍然需要标注部分物体边框