Liuyangfei Blog

保留最后的尊严

Pytorch教程系列(一)

翻译

以下内容是翻译自papersapce上的Pytorch教程系列,目的是为了自己学习时候记录进度督促自己,另一方面也可供需要的人汲取。 pytorch 101 第一部分:理解图,自动微分和自动求导 提前准备: 链式法则 一点深度学习基础 PyTorch 1.0 可以在这里获得所有的代码。 自动微分 许多pytorch系...

GAN

GAN学习中的体会记录

接触GAN的时候还是在大四做毕业设计的时候,由于当时是从通信工程学院转到了现在的人工智能学院,所以毕业设计就跟着这边的老师做了,当时老师布置的题目就是实现论文Semantic Segmentation using Adversarial Networks 这是16年的一篇cvpr上的文章,也是首次将GAN运用在图像的语义分割上。这篇文章的实现难度对于当时还没有接触过深度学习和python的我...

CartoonGAN: Generative Adversarial Networks for Photo Cartoonization

用GAN生成卡通图象

动机:提出一种可以将真实世界的场景迁移到动漫中的网络 贡献: 提出了一个可以映射的网络结构,使用不成对的图像训练,超过目前的水平。 提出了一个简单有效的损失函数。 使用初始化网络的方法提高训练。 CartoonGAN 网络框架由两个CNNs组成,一个是生成器,另一个是判别器。 ​ 生成器的作用是将一张真实世界的图像映射到卡通图像,生成网络以一个flat conv...

loss

语义分割中的loss函数

Log loss log loss 就是keras中的binary_crossentropy() 对上式进行拆分可以得到 经过拆分后可以发现,predict与target越接近,损失越小,最终的损失是两类损失的加权 和。缺点就是当正样本数量远小于负样本数量时,使得训练的模型偏向于预测背景,因为这会获得更小的损失。 Dice loss Dice loss 常用来解决前景区域...

LEDNET: A LIGHTWEIGHT ENCODER-DECODER NETWORK FOR REAL-TIME SEMANTIC SEGMENTATION

实时语义分割的轻量级网络

动机: 计算资源限制了CNN在移动设备上做dense estimation tasks。 解决方法:设计轻量级网络兼顾分割精度和效率 模型压缩方法(network compression):通过压缩预训练模型来减少inference时的计算量,常用的方法有hashing,pruning和quantization以及稀疏编码理论。 卷积分离方法(con...

Effetive use of dilated convolutions for segmentation small object instances in remote sensing imagery

用dilated convolutions 来做遥感影像中的小目标的分割

动机: 解决遥感影像中目标小和拥挤的问题。 方法: 提出local feature extraction module(LFE)。dilation factors 扩大的卷积不能联合局部特征,LFE采用dilation factors缩小的卷积。 网络: 整个网络分为三个模块。 三个模块: The front-end module: 为了满足大感受野,同时保持分辨率,采用了...

Dual Attention Network For Scene Segmentation

用双注意力模型做场景分割

动机: 在实际应用中,需要区别一些易混淆的类别,比如field和grass 目前的方法: 1. 利用多尺度信息融合: 主要操作: combine feature maps generated by different dilated convolution and pool operation。 enlarge the kernel size ...