1、图像处理基础:这是计算机视觉的基础,包括图像的读取、保存、滤波、边缘检测、图像平滑、形态学变换、轮廓检测等。这里会用到OpenCV等图像处理库。
2、图像特征提取:这是计算机视觉中的核心概念之一,涉及边缘检测(Sobel、Canny算法)、角点检测(Harris角点检测、Shi-Tomasi)、尺度不变特征变换(SIFT)和加速鲁棒特征(SURF)等。
3、概率与统计:在计算机视觉中,概率和统计模型用于图像分类、物体检测等问题,重点包括贝叶斯定理、最大似然估计、概率分布等。
4、微积分:微积分在计算机视觉中的应用主要在于梯度下降、反向传播等,涉及偏导数、链式法则、梯度计算等内容。
5、矩阵运算:线性代数中的矩阵运算、特征向量与特征值、奇异值分解(SVD)等是计算机视觉中的重要工具。
6、Python编程:作为计算机视觉主流语言,Python的使用尤为重要,尤其是结合NumPy和Matplotlib等库进行图像数据的处理和可视化。
7、深度学习:这是近年来计算机视觉领域的重要突破,学习内容包括神经网络基础(感知器、前馈神经网络、多层感知器等)、卷积神经网络(CNN)、神经网络架构(如LeNet、AlexNet、VGG、ResNet等)等。
8、高级计算机视觉技术:包括卷积神经网络进阶(残差网络、Inception网络等)、物体检测与分割(R-CNN、Faster R-CNN、YOLO、Mask R-CNN等)、生成对抗网络(GAN)等。
9、视觉Transformer与自监督学习:这是当前计算机视觉领域的研究热点,视觉Transformer(ViT)和自监督学习等技术的应用越来越广泛。
10、项目实践与应用:包括图像分类、目标检测、图像分割、人脸识别、自动驾驶等实际应用项目。