欢迎来到皮皮网网首页

【ava底层源码】【iosqq源码】【opencapwap 源码】sp 源码

来源:页面升级HTML源码 时间:2024-11-28 20:06:13

1.3d稀疏卷积——spconv源码剖析(五)
2.3d稀疏卷积——spconv源码剖析(三)
3.Android中dip,dp,sp,pt和px的区别详解
4.软件sp和cc是源码什么意思
5.3d稀疏卷积——spconv源码剖析(一)

sp  源码

3d稀疏卷积——spconv源码剖析(五)

       介绍在构建的Rulebook指导下执行特定的稀疏卷积计算,关注于类SparseConvolution,源码其代码位于spconv/conv.py。源码

       Fsp.indice_subm_conv和Fsp.indice_conv经过spconv/functional.py中的源码SubMConvFunction和SparseConvFunction对象转换,最终会调用spconv/ops.py模块中的源码indice_conv等函数。

       专注于子流线卷积接口:indice_subm_conv,源码ava底层源码其代码位于spconv/functional.py。源码

       通过Python接口调用底层C++函数可能不够直观,源码因此使用torch.autograd.Function封装算子底层调用,源码该类表示PyTorch中的源码可导函数,具备前向推理和反向传播实现时,源码即可作为普通PyTorch函数使用。源码

       值得注意的源码是,Function类在模型部署中具有优势,源码若定义了symbolic静态方法,源码此Function在执行torch.onnx.export()时,iosqq源码可依据symbolic定义规则转换为ONNX算子。

       apply方法是torch.autograd.Function的一部分,此方法负责在前向推理或反向传播时的调度工作。通过将indice_subm_conv = SubMConvFunction.apply简化为indice_subm_conv接口,简化了算子使用,屏蔽了SubMConvFunction的具体实现。

       SubMConvFunction的前向传播方法forward调用spconv/ops.py的indice_conv函数。在src/spconv/all.cc文件中,通过PyTorch提供的OP Register对底层C++API进行注册。

       通过torch.ops.load_library加载.so文件,使用torch.ops.spconv.indice_conv调用src/spconv/spconv_ops.cc文件中的indiceConv函数。

       深入探索src/spconv/spconv_ops.cc文件中的indiceConv函数。

       代写部分代码内容...

3d稀疏卷积——spconv源码剖析(三)

       构建Rulebook

       下面看ops.get_indice_pairs,位于:spconv/ops.py

       构建Rulebook由ops.get_indice_pairs接口完成

       get_indice_pairs函数具体实现:

       主要就是完成了一些参数的校验和预处理。首先,opencapwap 源码对于3d普通稀疏卷积,根据输入shape大小,kernel size,stride等参数计算出输出输出shape,子流行稀疏卷积就不必计算了,输出shape和输入shape一样大小

       准备好参数之后就进入最核心的get_indice_pairs函数。因为spconv通过torch.ops.load_library加载.so文件注册,所以这里通torch.ops.spconv.get_indice_pairs这种方式来调用该函数。

       算子注册:在src/spconv/all.cc文件中通过Pytorch提供的OP Register(算子注册的方式)对底层c++ api进行了注册,可以python接口形式调用c++算子

       同C++ extension方式一样,OP Register也是Pytorch提供的一种底层扩展算子注册的方式。注册的算子可以通过 torch.xxx或者 tensor.xxx的方式进行调用,该方式同样与pytorch源码解耦,增加和修改算子不需要重新编译pytorch源码。用该方式注册一个新的算子,流程非常简单:先编写C++相关的nandwrite 源码算子实现,然后通过pytorch底层的注册接口(torch::RegisterOperators),将该算子注册即可。

       构建Rulebook实际通过python接口get_indice_pairs调用src/spconv/spconv_ops.cc文件种的getIndicePairs函数

       代码位于:src/spconv/spconv_ops.cc

       分析getIndicePairs直接将重心锁定在GPU逻辑部分,并且子流行3d稀疏卷积和正常3d稀疏卷积分开讨论,优先子流行3d稀疏卷积。

       代码中最重要的3个变量分别为:indicePairs,indiceNum和gridOut,其建立过程如下:

       indicePairs代表了稀疏卷积输入输出的映射规则,即Input Hash Table 和 Output Hash Table。这里分配理论最大的内存,它的shape为{ 2,kernelVolume,numAct},2表示输入和输出两个方向,kernelVolume为卷积核的volume size。例如一个3x3x3的卷积核,其volume size就是mariadb 源码(3*3*3)。numAct表示输入有效(active)特征的数量。indiceNum用于保存卷积核每一个位置上的总的计算的次数,indiceNum对应中的count

       代码中关于gpu建立rulebook调用create_submconv_indice_pair_cuda函数来完成,下面具体分析下create_submconv_indice_pair_cuda函数

       子流线稀疏卷积

       子流线稀疏卷积是调用create_submconv_indice_pair_cuda函数来构建rulebook

       在create_submconv_indice_pair_cuda大可不必深究以下动态分发机制的运行原理。

       直接将重心锁定在核函数:

       prepareSubMGridKernel核函数中grid_size和block_size实则都是用的整形变量。其中block_size为tv::cuda::CUDA_NUM_THREADS,在include/tensorview/cuda_utils.h文件中定义,大小为。而grid_size大小通过tv::cuda::getBlocks(numActIn)计算得到,其中numActIn表示有效(active)输入数据的数量。

       prepareSubMGridKernel作用:建立输出张量坐标(通过index表示)到输出序号之间的一张哈希表

       见:include/spconv/indice.cu.h

       这里计算index换了一种模板加递归的写法,看起来比较复杂而已。令:new_indicesIn = indicesIn.data(),可以推导得出index为:

       ArrayIndexRowMajor位于include/tensorview/tensorview.h,其递归调用写法如下:

       接着看核函数getSubMIndicePairsKernel3:

       位于:include/spconv/indice.cu.h

       看:

       上述写法类似我们函数中常见的循环的写法,具体可以查看include/tensorview/kernel_utils.h

       NumILP按默认值等于1的话,其stride也是gridDim.x*blockDim.x。索引最大值要小于该线程块的线程上限索引blockDim.x * gridDim.x,功能与下面代码类似:

       参考: blog.csdn.net/ChuiGeDaQ...

Android中dip,dp,sp,pt和px的区别详解

       ã€€dip: device independent pixels(设备独立像素). 一般我们为了支持多种分辨率如WVGA、HVGA和QVGA 推荐使用这个,不依赖像素。

       ã€€ã€€dp: dip是一样的,谷歌官方推荐使用这个

       ã€€ã€€px: pixels(像素). 不同设备显示效果相同,一般我们HVGA代表x像素,这个用的比较少。pt: point,是一个标准的长度单位,1pt=1/英寸,用于印刷业,非常简单易用;

       ã€€ã€€sp: scaled pixels(放大像素). 主要用于字体显示best for textsize。

       ã€€ã€€3、度量单位的换算公式

       ã€€ã€€åœ¨android源码包TypedValue.java中,我们看如下函数:

       ã€€ã€€ä»£ç å¦‚下:

       ã€€ã€€public static float applyDimension(int unit, float value,

       ã€€ã€€DisplayMetrics metrics)

       ã€€ã€€{

       ã€€ã€€switch (unit) {

       ã€€ã€€case COMPLEX_UNIT_PX:

       ã€€ã€€return value;

       ã€€ã€€case COMPLEX_UNIT_DIP:

       ã€€ã€€return value * metrics.density;

       ã€€ã€€case COMPLEX_UNIT_SP:

       ã€€ã€€return value * metrics.scaledDensity;

       ã€€ã€€case COMPLEX_UNIT_PT:

       ã€€ã€€return value * metrics.xdpi * (1.0f/);

       ã€€ã€€case COMPLEX_UNIT_IN:

       ã€€ã€€return value * metrics.xdpi;

       ã€€ã€€case COMPLEX_UNIT_MM:

       ã€€ã€€return value * metrics.xdpi * (1.0f/.4f);

       ã€€ã€€}

       ã€€ã€€return 0;

       ã€€ã€€}

       ã€€ã€€è¯¥å‡½æ•°åŠŸèƒ½ï¼šæ˜¯æŠŠå„单位换算为像素。

       ã€€ã€€metrics.density:默认值为DENSITY_DEVICE / (float) DENSITY_DEFAULT;

       ã€€ã€€metrics.scaledDensity:默认值为DENSITY_DEVICE / (float) DENSITY_DEFAULT;

       ã€€ã€€metrics.xdpi:默认值为DENSITY_DEVICE;

       ã€€ã€€DENSITY_DEVICE:为屏幕密度

       ã€€ã€€DENSITY_DEFAULT:默认值为

软件sp和cc是什么意思

       软件SP是一种软件产品的简写,是英文单词“service pack”的缩写。它是一组微软公司推出的升级补丁,用于提供操作系统的安全性和稳定性。通常情况下,软件SP会把多种更新、修补、补丁和安全修复程序打包成一个升级文件,用户可以通过安装该文件来更新其计算机上的操作系统。

       软件CC是一些软件程序经过编译后生成的可执行文件的后缀名。在编译时,源代码会被转化为计算机可识别的二进制代码,并将其转换为可执行文件。这些可执行文件最终会使用软件CC的后缀名来命名。常见的软件CC有C++、Java、Python等,这些编译器通过转换源代码为机器码,使得程序具有了运行的能力。

       软件SP和CC在计算机软件领域中具有非常广泛的应用。软件SP通过打包多种更新和修复程序,可以快速成批更新操作系统,提高了计算机的安全性和稳定性,减少了计算机遭受黑客攻击和崩溃的几率。而软件CC则是编译器生成的可执行文件后缀名,是许多编程语言的标志。程序员们在编写代码时,需要使用到相关软件CC将源代码编译成可执行文件,便于程序的调试和运行。

3d稀疏卷积——spconv源码剖析(一)

       本文主要阐述卷积的基本理论,并以spconv源码为例进行解析。首先,介绍2D与3D卷积的基础知识及其分类。随后,深入探讨3D稀疏卷积的工作原理。

       2D卷积涉及卷积核在二维图像空间上的滑动操作。它分为单通道卷积与多通道卷积。单通道卷积在输入图像的单一通道上进行,得到特征图。多通道卷积在同一图像中不同通道上进行,每个通道得到一个对应的新通道,最终通过相加生成特征图。

       3D卷积在此基础上扩展到三维空间,涉及单通道与多通道情况。三维单通道卷积在立方体上进行,而三维多通道卷积则处理拥有多个通道的三维图像。

       2D与3D卷积计算涉及输入层、输出层与参数关系的数学公式。考虑偏置参数与计算量,FLOPS(浮点运算量)也在此阶段被计算。

       稀疏卷积分为SC(Sparse Convolution)与VSC(Valid Sparse Convolution)两种类型。SC卷积计算激活站点并丢弃非激活站点,而VSC卷积在SC的基础上进行了简化。

       卷积神经网络对三维点云数据处理时,面临计算量增加的问题,而SC与VSC卷积利用稀疏性实现高效处理。构建输入与输出哈希表,对点云数据进行快速访问。GetOffset()函数用于定位卷积操作的位置,Rulebook用于存储原子操作规则,指导稀疏卷积过程。

       稀疏卷积的关键在于构建输入、输出哈希表以及建立两者之间的联系,实现对稀疏数据的有效处理。spconv库中的get_indice_pairs函数通过调用getIndicePairs实现这一过程。