论文阅读UniNeXt: Exploring A Unified Architecture for Vision Recognition

vision

pytorch/vision: 一个基于 PyTorch 的计算机视觉库，提供了各种计算机视觉算法和工具，适合用于实现计算机视觉应用程序。

项目地址：https://gitcode.com/gh_mirrors/vi/vision

免费下载资源

栗子甜酒

443人浏览 · 2023-06-09 10:07:23

栗子甜酒 · 2023-06-09 10:07:23 发布

包含self-attention和卷积在内的分类架构

在摘要中作者指出以往的设计并没有统一结构，如果把以往的spatial token mixer加入uninext，准确率结果的排名会发生变化，不同的结构可能会造成比较结果的差异。

我对“以往的设计并没有统一结构”保留意见，我记得在metaformer的后续论文中有一篇关于统一结构的文章，并比较了不同spatial token mixer的差异，等我找到了插个链接。UniFormer: Unifying Convolution and Self-attention for Visual Recognition这篇，有代码

uninext的整体结构如下，金字塔结构和stem部分没什么特别的，EC和HdC应该是本篇文章的核心，PC部分标蓝了没有展开，个人觉得应该是地方不够了吧，不过后文作者也展开了。

EC(Embedded Convolution)嵌入式卷积动机有两个主要方面。首先，它增强了模型的归纳偏差，这对于学习和泛化至关重要。其次，EC 与所有令牌混合器兼容，提供了跨各种架构的灵活性和易于实现。对于注意力，直接在值上执行深度卷积，而不是在窗口转换之后，使其普遍适用于所有类型的注意力。。。。。不知道这个注意力跟以往的注意力有什么区别，后文说了在比较的时候不使用额外的绝对位置编码或相对位置编码，只使用最普通的自注意力，现在卷积和注意力同时使用都不使用位置编码了，作者也做了实验，不加就能达到最佳效果

HdC(High-dimensional Convolution)高维卷积，作者从其他研究中发现在MLP中添加一个轻量级的3×3深度卷积可以提高性能，并继承和扩展了这种卷积嵌入机制。首先，使用 MLP 的第一个线性层映射特征维度以获得高维特征 F。然后使用 3×3 深度卷积进行空间局部融合来编码高维隐式特征，从而提高效率。。。。。真是语言的艺术，学会了放文章里。这不就是普通的FFN层只进行了通道扩张四倍再缩放回去，这加了个dw卷积就变成新东西了，想贴代码，还没出来，比较好奇这个dw卷积换成普通卷积会不会也有效果

  ‘VIT的FFN’


self.net=nn.Sequential(
            nn.Linear(dim,hidden_dim),
            nn.GELU(),
            nn.Dropout(dropout),
            nn.Linear(hidden_dim,dim),
            nn.Dropout(dropout)
        )

PC(Post Convolution)后卷积也是一个dw卷积，在FFN后边又加了一个卷积。

这篇文章里我最感兴趣的图是这张，虽然其他文章里也有描述感受野的图片，不过那种集中在相关性，好奇这种图片怎么作

不知道这篇文章最大的亮点在哪里，觉得没有什么新颖之处，不过还是很有启发性的，它真的有在认真指导我怎么集成现有的工作，组装灌水成新工作。

GitHub 加速计划 / vi / vision

15.85 K

6.89 K

下载

pytorch/vision: 一个基于 PyTorch 的计算机视觉库，提供了各种计算机视觉算法和工具，适合用于实现计算机视觉应用程序。

最近提交(Master分支：2 个月前 )

945bdad7 2 天前

f68bac9d 3 天前

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m