1.[3D游戏开发实践] Cocos Cyberpunk 源码解读-开篇
2.3d稀疏卷积——spconv源码剖析(三)
3.Unity3D MMORPG核心技术:AOI算法源码分析与详解
4.3d稀疏卷积——spconv源码剖析(五)
5.[3D游戏开发实践] Cocos Cyberpunk 源码解读-目录结构
[3D游戏开发实践] Cocos Cyberpunk 源码解读-开篇
Cocos Cyberpunk是游源游戏源码Cocos引擎官方团队精心打造的一款完整开源第三人称射击类3D游戏,旨在展示引擎的游源游戏源码重度3D游戏制作能力,增强社区的游源游戏源码学习动力。此游戏支持Web、游源游戏源码iOS、游源游戏源码Android等多平台发布。游源游戏源码js 斗地主源码
本系列文章将对Cocos Cyberpunk的游源游戏源码源码进行深入解读,帮助读者提高学习效率,游源游戏源码加速在3D游戏开发领域的游源游戏源码进步。
如需获取源码,游源游戏源码请访问工程源码免费下载页面。游源游戏源码
麒麟鸽,游源游戏源码即我,游源游戏源码将在此系列文章中,游源游戏源码分享如何在3D游戏开发过程中充分利用Cocos Cyberpunk的游源游戏源码技术资产,包括但不限于:
完整TPS游戏核心
尽管角色控制尚有提升空间,Cocos Cyberpunk已具备完整的射击游戏逻辑,可作为学习资源或项目开发的基础。
机型适配机制
3D游戏对设备性能要求较高,Cocos Cyberpunk中实现了机型分档和性能开关策略,帮助开发者在不同设备上调整画质和保持帧率。
自定义管线
借助Cocos Creator 3.7提供的全新自定义管线,Cocos Cyberpunk实现了一个良好的隔离性解决方案,可直接复用或作为研究新管线的案例。
加强版反射探针
预先烘焙的反射探针,简化了物体反射周围景物的grip外挂源码实现,且性能优化显著,是不可多得的实用特性。
静态遮挡剔除(PVS-SOC)
通过预存可见关系,Cocos Cyberpunk实现了快速渲染物体的机制,尤其适用于建筑密集的场景,显著提升了效率。
更多技术资产
考虑到时间有限,Cocos Cyberpunk中未使用光照探针和LOD,但未来我将寻找合适案例进行分享。我相信,此项目还蕴含更多技术宝藏等待挖掘。
在接下来的文章中,我将深入研究以上技术点,并与大家共同探讨学习,期望能为你的3D游戏开发之路提供助力。
3d稀疏卷积——spconv源码剖析(三)
构建Rulebook
下面看ops.get_indice_pairs,位于:spconv/ops.py
构建Rulebook由ops.get_indice_pairs接口完成
get_indice_pairs函数具体实现:
主要就是完成了一些参数的校验和预处理。首先,对于3d普通稀疏卷积,根据输入shape大小,kernel size,stride等参数计算出输出输出shape,子流行稀疏卷积就不必计算了,输出shape和输入shape一样大小
准备好参数之后就进入最核心的get_indice_pairs函数。因为spconv通过torch.ops.load_library加载.so文件注册,neox 引擎源码所以这里通torch.ops.spconv.get_indice_pairs这种方式来调用该函数。
算子注册:在src/spconv/all.cc文件中通过Pytorch提供的OP Register(算子注册的方式)对底层c++ api进行了注册,可以python接口形式调用c++算子
同C++ extension方式一样,OP Register也是Pytorch提供的一种底层扩展算子注册的方式。注册的算子可以通过 torch.xxx或者 tensor.xxx的方式进行调用,该方式同样与pytorch源码解耦,增加和修改算子不需要重新编译pytorch源码。用该方式注册一个新的算子,流程非常简单:先编写C++相关的算子实现,然后通过pytorch底层的注册接口(torch::RegisterOperators),将该算子注册即可。
构建Rulebook实际通过python接口get_indice_pairs调用src/spconv/spconv_ops.cc文件种的getIndicePairs函数
代码位于:src/spconv/spconv_ops.cc
分析getIndicePairs直接将重心锁定在GPU逻辑部分,并且子流行3d稀疏卷积和正常3d稀疏卷积分开讨论,优先子流行3d稀疏卷积。
代码中最重要的3个变量分别为:indicePairs,indiceNum和gridOut,其建立过程如下:
indicePairs代表了稀疏卷积输入输出的映射规则,即Input Hash Table 和 Output Hash Table。这里分配理论最大的内存,它的shape为{ 2,kernelVolume,numAct},2表示输入和输出两个方向,kernelVolume为卷积核的volume size。例如一个3x3x3的卷积核,其volume size就是(3*3*3)。numAct表示输入有效(active)特征的数量。indiceNum用于保存卷积核每一个位置上的android 教程源码总的计算的次数,indiceNum对应中的count
代码中关于gpu建立rulebook调用create_submconv_indice_pair_cuda函数来完成,下面具体分析下create_submconv_indice_pair_cuda函数
子流线稀疏卷积
子流线稀疏卷积是调用create_submconv_indice_pair_cuda函数来构建rulebook
在create_submconv_indice_pair_cuda大可不必深究以下动态分发机制的运行原理。
直接将重心锁定在核函数:
prepareSubMGridKernel核函数中grid_size和block_size实则都是用的整形变量。其中block_size为tv::cuda::CUDA_NUM_THREADS,在include/tensorview/cuda_utils.h文件中定义,大小为。而grid_size大小通过tv::cuda::getBlocks(numActIn)计算得到,其中numActIn表示有效(active)输入数据的数量。
prepareSubMGridKernel作用:建立输出张量坐标(通过index表示)到输出序号之间的一张哈希表
见:include/spconv/indice.cu.h
这里计算index换了一种模板加递归的写法,看起来比较复杂而已。令:new_indicesIn = indicesIn.data(),可以推导得出index为:
ArrayIndexRowMajor位于include/tensorview/tensorview.h,其递归调用写法如下:
接着看核函数getSubMIndicePairsKernel3:
位于:include/spconv/indice.cu.h
看:
上述写法类似我们函数中常见的循环的写法,具体可以查看include/tensorview/kernel_utils.h
NumILP按默认值等于1的话,其stride也是gridDim.x*blockDim.x。索引最大值要小于该线程块的线程上限索引blockDim.x * gridDim.x,功能与下面代码类似:
参考: blog.csdn.net/ChuiGeDaQ...
Unity3D MMORPG核心技术:AOI算法源码分析与详解
Unity3D是一款强大的游戏开发引擎,尤其适用于构建MMORPG。MMORPG的核心之一是AOI算法,它让服务器能高效管理玩家与NPC,确保游戏流畅性与稳定性。本文将深入解析AOI算法原理与实现。
AOI(Area of Interest)算法,即感知范围算法,通过划分游戏世界区域并设定感知范围,让服务器能及时通知区域内其他玩家与NPC。这一策略减少不必要的水产软件源码计算和通信,增强游戏性能与稳定性。
划分区域与计算感知范围是AOI算法的关键。常用方法有格子划分法与四叉树划分法。
格子划分法将世界划分为固定大小的格子,玩家与NPC进入格子时,服务器通知格子内其他对象。此法实现简单,但需合理设置格子大小与数量以优化游戏性能与体验。
四叉树划分法则将世界分解为矩形区域,递归划分至每个区域只含一个对象。此法精度高,适应复杂场景,但实现复杂,占用资源较多。
感知范围计算有圆形与矩形两种方式。圆形计算简单,适用于圆形对象,但不处理非圆形对象,且大范围感知导致性能损失。矩形计算复杂,适处理非圆形对象,但同样占用更多资源。
实现AOI算法,步骤包括划分区域、添加与删除对象、更新位置、计算感知范围与优化算法。
代码示例采用格子划分法与圆形感知范围,使用C#编写。此代码可依据需求修改与优化,适应不同游戏场景。
总结,AOI算法是管理大量玩家与NPC的关键技术。在Unity3D中实现时,需选择合适划分与计算方式,并优化调整以提升游戏性能与稳定性。本文提供的解析与代码示例能帮助开发者深入理解与应用AOI算法。
3d稀疏卷积——spconv源码剖析(五)
介绍在构建的Rulebook指导下执行特定的稀疏卷积计算,关注于类SparseConvolution,其代码位于spconv/conv.py。
Fsp.indice_subm_conv和Fsp.indice_conv经过spconv/functional.py中的SubMConvFunction和SparseConvFunction对象转换,最终会调用spconv/ops.py模块中的indice_conv等函数。
专注于子流线卷积接口:indice_subm_conv,其代码位于spconv/functional.py。
通过Python接口调用底层C++函数可能不够直观,因此使用torch.autograd.Function封装算子底层调用,该类表示PyTorch中的可导函数,具备前向推理和反向传播实现时,即可作为普通PyTorch函数使用。
值得注意的是,Function类在模型部署中具有优势,若定义了symbolic静态方法,此Function在执行torch.onnx.export()时,可依据symbolic定义规则转换为ONNX算子。
apply方法是torch.autograd.Function的一部分,此方法负责在前向推理或反向传播时的调度工作。通过将indice_subm_conv = SubMConvFunction.apply简化为indice_subm_conv接口,简化了算子使用,屏蔽了SubMConvFunction的具体实现。
SubMConvFunction的前向传播方法forward调用spconv/ops.py的indice_conv函数。在src/spconv/all.cc文件中,通过PyTorch提供的OP Register对底层C++API进行注册。
通过torch.ops.load_library加载.so文件,使用torch.ops.spconv.indice_conv调用src/spconv/spconv_ops.cc文件中的indiceConv函数。
深入探索src/spconv/spconv_ops.cc文件中的indiceConv函数。
代写部分代码内容...
[3D游戏开发实践] Cocos Cyberpunk 源码解读-目录结构
在深入解读Cocos Cyberpunk源码之前,首先,让我们打开scene-game-start场景,启动游戏预览,进入游戏场景。点击START按钮,游戏正式开始。漫游摄像机将带你漫游整个场景,再次点击START,可以进入游戏。
在电脑端按ESC键或手机端点击设置按钮,查看操作说明。接下来,让我们浏览Cocos Cyberpunk项目的目录结构。在左下角的Assets窗口中,我们可以看到项目文件的分层。
首先,animations目录中仅包含用于场景漫游的摄像机动画文件。LightFX目录存储了光照贴图,这些是光照烘焙系统自动生成的,无需手动修改。res目录是整个游戏资源的集中地,包括动画、特效、模型、shader、UI、音效等资源。
resources目录则存放动态加载的资源,当前内容较少,随着游戏的完善,资源将会增多。scene目录包含了环境反射探针文件,与场景文件名对应的文件夹存放反射贴图。scene-development目录则包含一些用于单元测试的开发场景。
scripts目录存放所有游戏逻辑脚本,而src目录可能包含项目开发过程中的测试文件。test目录同样是用于测试的,存放的文件与项目无关。scene目录则是游戏主场景,而scene-game-start则为游戏启动场景,进行UI逻辑初始化,并加载游戏主场景。
自定义管线以编辑器扩展的形式存在,可将其移至项目中。管线对应自定义管线,通过在场景中新建节点并添加pipeline/graph/pipeline-graph.ts组件来查看可视化管线图。实时探针相关组件在反射探针节点上挂载,提供实时更新功能。
反射探针节点上的ReflectionUtils脚本组件实现了实时更新探针的逻辑,适用于需要实时探针的项目。此外,Cocos Cyberpunk还实现了SphereProjection修正,使得反射更符合物体形状。
静态遮挡剔除机制在Cocos Cyberpunk中实现,通过将可见关系预存入空间格子,渲染时直接查表获得渲染列表,极大提升效率。这一部分主要在scene场景中的static-occlusion-culling结点中处理。
机型适配策略在Cocos Cyberpunk中实现,根据设备性能选择渲染效果,确保流畅帧率。处理了不同设备上的效果调整,包括性能开关策略、机型分档策略,主要在href-settings.ts、gpu.ts和gpu-mobiles.ts文件中实现。
游戏逻辑方面,Cocos Cyberpunk包含完整的TPS游戏逻辑,init节点包含了特效、UI、对象池等节点,挂载的init.ts脚本组件确保游戏逻辑在主场景加载后持续运行。接下来,我们将对游戏逻辑相关源码进行深入解读。