最近更新:
分类: AI 30 个神经网络
AI 教程网络
文章分组
基础、实践、扩展三个阶段,按文章顺序排列。
图文教程
这里可以当作一个小模型拆解来看:先确认它解决什么问题,再看数据如何进入网络,最后检查输出和评估方式。这篇先建立整体地图:它解决什么问题、核心模块是什么、适合放在哪类任务里。
这里可以当作一个小模型拆解来看:先确认它解决什么问题,再看数据如何进入网络,最后检查输出和评估方式。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
LSTM 的重点不在名字,而在门控如何筛掉旧信息、写入新信息,再把当前状态交给下一步。读这类文章时,把每个时间步画出来,比只看公式更容易理解。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
LSTM 的重点不在名字,而在门控如何筛掉旧信息、写入新信息,再把当前状态交给下一步。读这类文章时,把每个时间步画出来,比只看公式更容易理解。这篇重点看实现。不要只复制代码,要把环境、输入形状、模型调用和输出解释逐项确认。
BERT 可以理解成先读完整句子,再按任务换一个小输出头。它的价值来自上下文表示,不是简单把词向量换大一点。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
BERT 可以理解成先读完整句子,再按任务换一个小输出头。它的价值来自上下文表示,不是简单把词向量换大一点。这篇重点看训练。数据处理、损失函数、优化器和日志要连成闭环,训练结果才可复盘。
ResNet 的关键是让信息有一条更短的路回传。残差连接不是装饰,它决定了深层网络能不能稳定训练。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
ResNet 的关键是让信息有一条更短的路回传。残差连接不是装饰,它决定了深层网络能不能稳定训练。这篇重点看评估。速度、精度、显存和可复现设置要一起记录,单个指标不能代表全部。
VGG 的优势是结构清楚,适合作为理解卷积网络的基线。它不一定最高效,但很适合拿来解释特征逐层变抽象的过程。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
VGG 的优势是结构清楚,适合作为理解卷积网络的基线。它不一定最高效,但很适合拿来解释特征逐层变抽象的过程。这篇重点看评估。速度、精度、显存和可复现设置要一起记录,单个指标不能代表全部。
U-Net 的价值在于一边压缩语义,一边把浅层细节接回解码器。做分割任务时,这条跳连通常决定边界是否干净。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
U-Net 的价值在于一边压缩语义,一边把浅层细节接回解码器。做分割任务时,这条跳连通常决定边界是否干净。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
Faster R-CNN 是两阶段检测思路:先找可能有目标的区域,再细分类别和位置。它适合追求精度的检测场景。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
Faster R-CNN 是两阶段检测思路:先找可能有目标的区域,再细分类别和位置。它适合追求精度的检测场景。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
GAN 是两个网络互相较劲:生成器负责骗过判别器,判别器负责找出破绽。真正的难点通常是训练稳定性。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
GAN 是两个网络互相较劲:生成器负责骗过判别器,判别器负责找出破绽。真正的难点通常是训练稳定性。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
RNN 把序列按时间步展开,用隐藏状态保存上下文。理解它时,先把数据在每一步如何传递画清楚。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
CNN 通过卷积核在局部区域提取特征,再逐层组合成更抽象的表示。图像任务里,它仍然是很多模型的基础部件。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
RNN 把序列按时间步展开,用隐藏状态保存上下文。理解它时,先把数据在每一步如何传递画清楚。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
RNN 把序列按时间步展开,用隐藏状态保存上下文。理解它时,先把数据在每一步如何传递画清楚。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
Transformer 把序列建模从一步步递推,变成一次性看清 token 之间的关系。理解它时,先看注意力矩阵如何分配信息。这篇重点看评估。速度、精度、显存和可复现设置要一起记录,单个指标不能代表全部。
Transformer 把序列建模从一步步递推,变成一次性看清 token 之间的关系。理解它时,先看注意力矩阵如何分配信息。这篇重点看评估。速度、精度、显存和可复现设置要一起记录,单个指标不能代表全部。
Inception 的思路是让网络同时看不同尺度的特征,再把结果拼起来。它适合解释多分支结构怎样控制计算量。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
Inception 的思路是让网络同时看不同尺度的特征,再把结果拼起来。它适合解释多分支结构怎样控制计算量。这篇重点看训练。数据处理、损失函数、优化器和日志要连成闭环,训练结果才可复盘。
MobileNet 的核心是把普通卷积分解成更轻的两步。它关注的是能不能在算力有限的设备上稳定运行。这篇先建立整体地图:它解决什么问题、核心模块是什么、适合放在哪类任务里。
MobileNet 的核心是把普通卷积分解成更轻的两步。它关注的是能不能在算力有限的设备上稳定运行。这篇重点看评估。速度、精度、显存和可复现设置要一起记录,单个指标不能代表全部。
DenseNet 让后面的层直接拿到前面很多层的输出,强调特征复用。它的好处是信息流顺,代价是内存要认真看。这篇先建立整体地图:它解决什么问题、核心模块是什么、适合放在哪类任务里。
DenseNet 让后面的层直接拿到前面很多层的输出,强调特征复用。它的好处是信息流顺,代价是内存要认真看。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
介绍 YOLO 在分割任务中的应用,讲清目标检测、边界框、类别预测和图像分割的关系,适合计算机视觉入门学习。
YOLO 把检测做成一次前向预测,适合实时场景。理解它时,要把框、类别、置信度和 NMS 放在同一张图里看。这篇重点看实现。不要只复制代码,要把环境、输入形状、模型调用和输出解释逐项确认。
SegNet 关注语义分割中的编码解码过程,尤其是如何把压缩后的语义信息还原到像素级输出。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
SegNet 关注语义分割中的编码解码过程,尤其是如何把压缩后的语义信息还原到像素级输出。这篇重点看评估。速度、精度、显存和可复现设置要一起记录,单个指标不能代表全部。
VAE 不是简单压缩图片,它学习的是一个可采样的潜在空间。重建质量和潜空间规整性需要一起看。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
VAE 不是简单压缩图片,它学习的是一个可采样的潜在空间。重建质量和潜空间规整性需要一起看。这篇重点看训练。数据处理、损失函数、优化器和日志要连成闭环,训练结果才可复盘。
Xception 把 Inception 的多分支思想推向深度可分离卷积。看它时,要分清空间卷积和通道混合分别做什么。这篇先建立整体地图:它解决什么问题、核心模块是什么、适合放在哪类任务里。
Xception 把 Inception 的多分支思想推向深度可分离卷积。看它时,要分清空间卷积和通道混合分别做什么。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
EfficientNet 的核心是同时缩放深度、宽度和分辨率,而不是只把某一项盲目加大。这篇先建立整体地图:它解决什么问题、核心模块是什么、适合放在哪类任务里。
EfficientNet 的核心是同时缩放深度、宽度和分辨率,而不是只把某一项盲目加大。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
图神经网络处理的是关系数据。重点不是把表格换个形状,而是让节点通过边交换信息。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
图神经网络处理的是关系数据。重点不是把表格换个形状,而是让节点通过边交换信息。这篇重点看评估。速度、精度、显存和可复现设置要一起记录,单个指标不能代表全部。
胶囊网络尝试用向量表达部件和整体的关系。它关心的不只是有没有特征,还关心特征的姿态和组合方式。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
胶囊网络尝试用向量表达部件和整体的关系。它关心的不只是有没有特征,还关心特征的姿态和组合方式。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
注意力机制回答的是当前信息该看哪里。无论用于文本还是图像,都可以先把 Q、K、V 的关系画清楚。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
注意力机制回答的是当前信息该看哪里。无论用于文本还是图像,都可以先把 Q、K、V 的关系画清楚。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
自监督学习的关键是从数据本身制造监督信号。它适合标注少、原始数据多的场景。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
自监督学习的关键是从数据本身制造监督信号。它适合标注少、原始数据多的场景。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
深度置信网络属于较早期的深度模型思路。理解它有助于看清逐层预训练和现代端到端训练之间的差异。这篇先建立整体地图:它解决什么问题、核心模块是什么、适合放在哪类任务里。
深度置信网络属于较早期的深度模型思路。理解它有助于看清逐层预训练和现代端到端训练之间的差异。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
孪生网络适合判断两个输入像不像。它的重点是共享编码器和距离学习,而不是普通分类头。这篇重点看训练。数据处理、损失函数、优化器和日志要连成闭环,训练结果才可复盘。
孪生网络适合判断两个输入像不像。它的重点是共享编码器和距离学习,而不是普通分类头。这篇先建立整体地图:它解决什么问题、核心模块是什么、适合放在哪类任务里。
ResNeXt 在 ResNet 的残差框架里加入分组卷积,让网络用更多并行路径提特征。理解它时,要同时看深度、宽度和分组数。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
ResNeXt 在 ResNet 的残差框架里加入分组卷积,让网络用更多并行路径提特征。理解它时,要同时看深度、宽度和分组数。这篇重点看评估。速度、精度、显存和可复现设置要一起记录,单个指标不能代表全部。
Pix2Pix 适合有成对样本的图像翻译任务。它不是凭空生成,而是学输入图到目标图之间的映射。这篇先建立整体地图:它解决什么问题、核心模块是什么、适合放在哪类任务里。
Pix2Pix 适合有成对样本的图像翻译任务。它不是凭空生成,而是学输入图到目标图之间的映射。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
CycleGAN 的亮点是不用一一配对的数据,也能学习两个视觉域之间的转换。循环一致性约束是防止内容乱跑的关键。这篇先建立整体地图:它解决什么问题、核心模块是什么、适合放在哪类任务里。
CycleGAN 的亮点是不用一一配对的数据,也能学习两个视觉域之间的转换。循环一致性约束是防止内容乱跑的关键。这篇先建立整体地图:它解决什么问题、核心模块是什么、适合放在哪类任务里。
轻量级 CNN 不是简单把层数减少,而是在精度、速度、功耗和模型大小之间做取舍。这篇重点看评估。速度、精度、显存和可复现设置要一起记录,单个指标不能代表全部。
轻量级 CNN 不是简单把层数减少,而是在精度、速度、功耗和模型大小之间做取舍。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
空间变换网络让模型学会先把输入对齐,再做后续识别或生成。它适合输入姿态变化明显的任务。这篇重点看结构。先把数据流、关键模块和输出层画清楚,再回头看公式或代码。
空间变换网络让模型学会先把输入对齐,再做后续识别或生成。它适合输入姿态变化明显的任务。这篇重点看应用场景。先判断任务是否真的匹配这个网络,再看数据规模、部署成本和效果边界。
空间变换网络让模型学会先把输入对齐,再做后续识别或生成。它适合输入姿态变化明显的任务。这篇先建立整体地图:它解决什么问题、核心模块是什么、适合放在哪类任务里。
神经风格迁移要同时守住内容结构和风格纹理。效果图好看不够,还要看速度、显存和可复现设置。这篇重点看评估。速度、精度、显存和可复现设置要一起记录,单个指标不能代表全部。