# CNN
-
目标检测 从古典走进R-CNN
这篇文章介绍了古典目标检测方法。首先讨论了目标检测是回归还是分类的问题,解释了回归任务和分类任务的区别。接着,介绍了Region Proposals和Selective Search算法,详细说明了古典目标检测的流程和IoU(Intersection over Union)的概念。 文章深入分析了R-CNN及其改进方法SPP-net,指出Fast R-CNN中ROI池化是SPP的一个特例,并解释了其Loss构成和训练集构成。然后,介绍了Faster R-CNN的结构,详细说明了其包含的四个Loss和RPN部分的功能,以及NMS(非极大值抑制)技术。
-
卷积神经网络优化
这篇文章详细介绍了几种经典的卷积神经网络结构及其关键技术。首先,讨论了AlexNet网络结构,并解释了连续使用小卷积核和1x1卷积核的作用,以及使用1x1卷积核代替全连接层的优势。接着,介绍了Dropout技术的使用方法和原因。 文章还探讨了数据增强技术,并详细讲解了VGG16网络拓扑结构及其变形。随后,介绍了Inception系列网络,包括Inception-V1、Inception-V2和Inception-V3,并回顾了1x1卷积核的作用,讨论了解决超深度网络训练问题的策略。 接着,分析了ResNet残差网络,解释了残差单元的作用及其优化方法。最后,介绍了DenseNet的结构特点,包括block、grow rate和transition,以及MobileNet的深度可分离卷积和Relu6的三种解释,并对V1和V2的改进进行了说明。
-
Faster R-CNN代码实战
这篇文章介绍了Faster R-CNN的代码实战步骤,包括数据集处理、训练过程和模型构建。首先讨论了combined_roidb和RoIDataLayer的使用,然后详细讲解了create_architecture、build_network、Build head和Build RPN的实现,以及3*3和111卷积层的添加。接着,介绍了Build proposals的实现。最后,总结了整个训练过程和_add_losses的作用,全面展示了Faster R-CNN的实现和训练流程。
-
CV领域的对比学习综述(下)
这篇文章继续综述计算机视觉(CV)领域的对比学习方法,特别是近年来的新进展。首先介绍对比学习的发展历程,特别是不再使用负样本的方法,如BYOL,探讨其整体思路和网络架构,以及BYOL对批量归一化层知道负样本的回应。 接着,介绍SimSiam的整体架构和实验结果。文章还讨论了对比学习与Transformer的结合,重点介绍MoCo v3和DINO的整体框架。最后,总结第四阶段的研究进展,并对CV领域的对比学习方法进行了全面总结,展示了其最新的发展动态和应用成果。
-
CV领域的对比学习综述(上)
这篇文章综述了计算机视觉(CV)领域的对比学习方法。首先介绍了对比学习的发展历程和百花齐放的研究现状,重点讨论了InstDisc的研究动机和网络架构。接着,介绍了InvaSpread、CPC和CMC的整体思路,并总结了第一阶段的进展。 文章进一步分析了CV领域的两大对比学习方法:MoCo和SimCLR,及其改进版本MoCo v2和SimCLR v2,以及SwAV的网络架构和实验结果。最后,讨论了CPC和CMC的延伸工作,并总结了第二阶段的研究进展,通过这些内容,全面展示了对比学习在CV领域的最新发展和成果。
-
ConVIRT论文详解(医疗图片)
这篇文章详细解析了ConVIRT论文,特别针对医疗图片的应用。首先介绍前言和整体架构,解释了ConVIRT的设计理念和工作流程。接着,介绍使用的数据集及其特点。文章还描述了实验部分,包括分类任务和Zero-shot任务的具体实验设置和结果。最后,讨论了超参数设置,提供了优化模型性能的详细方法。通过这些内容,全面展示了ConVIRT在医疗图像处理中的应用和实验结果。
-
CNN卷积神经网络
这篇文章介绍了卷积神经网络(CNN)中的卷积层和池化层。讨论了卷积层、卷积核、彩色图片卷积、权值共享问题及卷积核的扫描方式。详细解释了Padding模式(SAME和VALID)及其补零公式,并通过代码实现卷积层,包括导包、导入数据、创建卷积核和网络结构。还介绍了池化层的目的、作用及对输入的影响,通过代码实现池化层并展示结果。最后简要介绍了经典的CNN架构LeNet5。通过这些内容,全面展示了CNN的核心组件及其在图像处理中的应用。
-
CLIP论文详解
CLIP算是在跨模态训练无监督中的开创性工作,本文详细解析了CLIP模型,从整体架构到具体实验结果,深入探讨了其在预训练、零样本学习、表示学习以及泛化能力等方面的表现。论文首先介绍了CLIP的整体架构和预训练过程,随后分析了在大范围数据集上的实验结果及其在few-shot和zero-shot任务中的表现对比。进一步讨论了CLIP模型学习的表示与人类对比的结果,并探究了其局限性和存在的不足之处。