萧萧发自凹非寺
量子位报道公众号 QbitAI
斯坦福最经典的计算机视觉课程 CS231n——全称是面向视觉识别的卷积神经网络。
今天更新啦。
作为计算机视觉和深度学习领域的经典课程,CS231n 由李飞飞团队打造,从课程设计到内容选择,都以入门为导向。
然而,自从 2017 年后,这门课程的录制版就没再更新过,在李飞飞的社交媒体下面,不时能听见网友吐槽的声音:
我们很喜欢您的课程,但这个领域发展得非常快,为什么 2017 年后的视频课就不再上传了?
现在,这门课程的录制视频终于更新了,想要入门计算机视觉的小伙伴,可以收藏学习~(文末附视频链接)
那么,CS231n 课程都讲了些什么?
22 节课,入门计算机视觉
CS231n 是斯坦福开设的一门视觉识别课程,在了解计算机视觉的基础上,理解深度学习在这个行业的应用。
作为一门研究机器人如何「看」的领域,计算机视觉的应用范围非常广泛,像自动驾驶汽车识别行人、图像搜索引擎自动分类等等。
而深度学习的出现,极大地提高了计算机视觉的应用效果。
这门课从理论到实践一键通,学习后,不仅能实现、训练和调试神经网络,还能掌握计算机视觉的前沿研究。
课程的重点在于解决图像识别的问题,为了达成这个目标,将会讲授反向传播算法、训练和微调神经网络的实用技巧。
这次更新的录制课,在内容和形式上都紧跟 AI 领域新潮流。
从模式到内容紧跟潮流
从 2017 年的录制课视频来看,一共只有 16 讲的内容。
这次「升级版」的 22 讲内容,不仅细化了目前比较热门的生成模型(如 GAN)的介绍课程,将它从一课时变成了两课时,而且还更新了Transformers、3D、视频处理等近年兴起的行业热门。
例如,在 17 课的 3D 视觉课程中,就介绍了将神经网络应用于 3D 结构的方法。
在这门课程里,不仅有关于 3D 数据的不同表示形式的讨论,还有对深度图、隐函数、点云等理论知识的介绍。
除此之外,对于 3D 形状这个新领域,神经网络好坏的度量标准也有所体现。
△ 3D 视觉课程 PPT
至于第 18 课的视频处理,课时则主要介绍了 CNN 在视频分类中的应用方法,以及视频识别中的通用技术等。
△ 视频处理课程 PPT
不仅如此,这次的录制视频也更贴合在线课程的形式。
2017 年的录制版 CS231n 课程,只有 PPT 界面显示、或是偶尔出现教授讲课的界面:
虽然也有 PPT 和音频同步,但如果想找某个想看的部分,就只能在滚动条上反复拖拉。
更新后的视频课,具体画风是这样的:
不仅更有现场代入感了,而且在导师讲课时,也能通过他的手势跟上知识点所在的位置。
每一节课、每一页的 PPT 都会呈现在视频下方,具体对某个知识点感兴趣、或是想要听哪一节的 PPT,都可以直接点击视频观看。
是不是已经有些跃跃欲试、准备好投身知识的海洋了?
来看看下面的课程表吧。
课程一览
CS231n 更新后的课程表如下,对里面的部分知识点感兴趣的话,可以戳下方传送门进行学习~
课时1:课程介绍
课时2:图像分类
课时3:线性分类器
课时4:优化算法
课时5:神经网络
课时6:反向传播
课时7:卷积结构
课时8:卷积神经网络(CNN)架构
课时9:硬件/软件知识
课时 10:训练神经网络(1)
课时 11:训练神经网络(2)
课时 12:循环神经网络
课时 13:注意力机制
嘉宾讲座:对抗性机器学习
课时 14:可视化和理解
课时 15:目标检测
课时 16:图像分割
课时 17:3D 视觉
课时 18:视频处理
课时 19:生成模型(1)
课时 20:生成模型(2)
课时 21:强化学习
课时 22:回顾/总结
传送门:
网课链接:
http://leccap.engin.umich.edu/leccap/site/jhygcph151x25gjj1f0
PPT 下载:
https://www.youtube.com/playlist?list=PL5-TkQAfAZFbzxjBHtzdVCWE0Zbhomg7r