【新主页源码】【工控编程源码】【源码笔记12】ai写源码-皮皮网

【新主页源码】【工控编程源码】【源码笔记12】ai写源码

时间:2024-11-25 00:38:04 来源：饭卡管理源码

1.Autoware.io源码编译安装
2.大神用Python做个AI出牌器，写源实现财富自由附源码
3.腾讯T2I-adapter源码分析（1）-运行源码跑训练
4.AI五分钟上线一个微信小程序
5.AI辅助编程插件：Sourcegraph Cody
6.AI与PDE（七）：AFNO模型的写源源代码解析

ai写源码

Autoware.io源码编译安装

要编译安装Autoware.io，首先请确保已安装ROS1，写源如Ubuntu .版本的写源Melodic。以下步骤将指导你完成依赖安装及源码编译过程。写源

安装依赖

1. 对于CUDA的写源新主页源码支持（可选但建议），你需要下载CUDA .0，写源链接位于developer.nvidia.com/cuda。写源安装时，写源遇到驱动安装询问时选择n，写源后续步骤默认安装即可。写源

2. 安装cudnn，写源从developer.nvidia.com/rd...获取并进行安装。写源在cuda目录下进行软链接配置，写源并通过验证测试。写源

其他依赖安装

3. 安装eigen3.3.7，接着是opencv3，安装时需先安装依赖库，然后解压、配置和编译。

源码下载与编译

4. 创建新的工作区，下载并配置工作区，然后下载Autoware.ai源码。

5. 使用rosdep安装依赖库，有CUDA版本和无CUDA版本两种编译方式。

测试与问题解决

6. 下载并运行demo，可能遇到的问题包括编译错误和链接问题。

问题1：calibration_publisher报错，需修改CMakeList.txt文件。

问题2：ndt_gpu编译错误，需替换Eigen3Config.cmake文件中的版本信息。

问题3：opencv链接问题，需要检查和调整。

问题4：rosdep更新慢，可通过修改源码和配置文件解决。

问题5：runtime manager花屏，需安装wxPython 4.和libsdl1.2-dev。

通过上述步骤，你应该能够成功编译并测试Autoware.io。如有任何疑问，查阅官方文档或社区论坛寻求帮助。

大神用Python做个AI出牌器，工控编程源码实现财富自由附源码

在互联网上，我注意到一个有趣的开源项目——快手团队的DouZero，它将AI技术应用到了斗地主游戏中。今天，我们将通过学习如何使用这个原理，来制作一个能辅助出牌的欢乐斗地主AI工具，也许它能帮助我们提升游戏策略，迈向财富自由的境界。

首先，让我们看看AI出牌器的实际运作效果:

接下来，我们逐步构建这个AI出牌器的制作过程:

核心功能与实现步骤

UI设计：首先，我们需要设计一个简洁的用户界面，使用Python的pyqt5库，如下是关键代码:

识别数据：在屏幕上抓取特定区域，通过模板匹配识别AI的手牌、底牌和对手出牌，这部分依赖于截图分析，核心代码如下:

地主确认：通过截图确定地主身份，代码负责处理这一环节:

AI出牌决策：利用DouZero的AI模型，对每一轮出牌进行判断和决策，这部分涉及到代码集成，例如:

有了这些功能，出牌器的基本流程就完成了。接下来是使用方法:

使用与配置

环境安装：你需要安装相关库，并配置好运行环境，具体步骤如下:

位置调整：确保游戏窗口设置正确，AI出牌器窗口不遮挡关键信息:

运行测试：完成环境配置后，即可启动程序，与AI一起战斗:

最后，实际操作时，打开斗地主游戏，让AI在合适的时间介入，体验AI带来的智慧策略，看看它是否能帮助你赢得胜利！

腾讯T2I-adapter源码分析（1）-运行源码跑训练

稳定扩散、midjourney等AI绘图技术，为人们带来了令人惊叹的效果，不禁让人感叹技术发展的日新月异。然而，AI绘图的可控性一直不是很好，通过prompt描述词来操控图像很难做到随心所欲。源码笔记12为了使AI绘制的图像更具可控性，Controlnet、T2I-adapter等技术应运而生。本系列文章将从T2I-adapter的源码出发，分析其实现方法。

本篇是第一篇，主要介绍源码的运行方法，后续两篇将以深度图为例，分别分析推理部分和训练部分的代码。分析T2I-Adapter，也是为了继续研究我一直在研究的课题：“AI生成同一人物不同动作”，例如：罗培羽：stable-diffusion生成同一人物不同动作的尝试（多姿势图），Controlnet、T2I-adapter给了我一些灵感，后续将进行尝试。

T2I-Adapter论文地址如下，它与controlnet类似，都是在原模型增加一个旁路，然后对推理结果求和。

T2I-Adapter和controlnet有两个主要的不同点，从图中可见，其一是在unet的编码阶段增加参数，而controlnet主要是解码阶段；其二是controlnet复制unit的上半部结构，而T2I-Adapter使用不同的模型结构。由于采用较小的模型，因此T2I-Adapter的模型较小，默认下占用M左右，而controlnet模型一般要5G空间。

首先确保机器上装有3.6版本以上python，然后把代码clone下来。随后安装依赖项，打开requirements.txt，可以看到依赖项的内容。然后下载示例，下载的会放到examples目录下。接着下载sd模型到model目录下，再下载T2I-Adapter的模型到目录下，模型可以按需到huggingface.co/TencentA...下载。这里我下载了depth和openpose。sd模型除了上述的v1-5，也还下载了sd-v1-4.ckpt。网络驱动源码

根据文档，尝试运行一个由深度图生成的例子，下图的左侧是深度图，提示语是"desk, best quality, extremely detailed"，右侧是生成出来的。运行过程比较艰辛，一开始在一台8G显存的服务器上跑，显存不够；重新搭环境在一台G显存的服务器上跑，还是不够；最后用一台G显存的服务器，终于运行起来了。

接下来尝试跑openpose的例子，下图左侧是骨架图，提示词为"Iron man, high-quality, high-res"，右侧是生成的图像。

既然能跑推理，那么尝试跑训练。为了后续修改代码运行，目标是准备一点点数据把训练代码跑起来，至于训练的效果不是当前关注的。程序中也有训练的脚步，我们以训练深度图条件为例，来运行train_depth.py。

显然，习惯了，会有一些问题没法直接运行，需要先做两步工作。准备训练数据，分析代码，定位到ldm/data/dataset_depth.py，反推它的数据集结构，然后准备对应数据。先创建文件datasets/laion_depth_meta_v1.txt，用于存放数据文件的地址，由于只是测试，我就只添加两行。然后准备，图中的.png和.png是结果图，.depth.png和.depth.png是深度图，.txt和.txt是对应的文本描述。

文本描述如下，都只是推币源码为了把代码跑起来而做的简单设置。设置环境变量，由于T2I-Adapter使用多卡训练，显然我也没这个环境，因此要让它在单机上跑。而代码中也会获取一些环境变量，因此做简单的设置。

做好准备工作，可以运行程序了，出于硬件条件限制，只能把batch size设置为1。在A显卡跑了约8小时，完成，按默认的配置，模型保存experiments/train_depth/models/model_ad_.pth。那么，使用训练出来的模型试试效果，能生成如下（此处只是为了跑起来代码，用训练集来测试），验证了可以跑起来。

运行起来，但这还不够，我们还得看看代码是怎么写法，下一篇见。

PS：《直观理解AI博弈原理》是笔者写的一篇长文，从五子棋、象棋、围棋的AI演进讲起，从深度遍历、MAX-MIN剪枝再到蒙特卡罗树搜索，一步步介绍AI博弈的原理，而后引出强化学习方法，通俗易懂地介绍AlphaGo围棋、星际争霸强化学习AI、王者荣耀AI的一些强化学习要点，值得推荐。

AUTOMATIC的webui是近期很流行的stable-diffusion应用，它集合stable-diffusion各项常用功能，还通过扩展的形式支持controlnet、lora等技术，我们也分析了它的源码实现，写了一系列文章。

AI五分钟上线一个微信小程序

借助AI的力量，无需编程基础，五分钟内即可上线一个微信小程序。以开发一个显示时钟的小程序为例，操作步骤如下：

首先，通过AI工具生成三个文件的代码，包括：

- index.js：负责程序逻辑。

- index.wxml：定义程序界面。

- index.wxss：设置界面样式。

接着，将AI生成的代码粘贴到开发工具中，替换原有代码，保存并点击编译按钮，理论上无需修改代码，小程序即可正常运行。

初次运行效果可能存在字体过小或显示方式不理想等问题，AI会继续优化代码。

最新版本代码调整了字体大小，并提供了调整字体大小的参数。在实际操作中，发现将字体大小调整至vw最为合适，最终效果显著提升。

总结而言，五分钟内利用AI，即便是编程初学者，也可成功开发一个微信小程序。尝试亲手操作，将理论转化为实践。

附上源代码以供参考：

index.js

index.wxml

index.wxss

app.json

AI辅助编程插件：Sourcegraph Cody

Sourcegraph Cody插件是一款免费的开源AI编码助手，提供代码编写、修复和自动完成功能，并能回答编码相关问题。Cody获取整个代码库的上下文，生成更好的代码，使用广泛的API、impl和习惯用法，同时减少代码混淆。虽然支持基本的聊天功能，但其专注于解决编程问题，不涉及与话题无关的对话。Cody适用于VS Code等开发工具，安装后需通过Sourcegraph账号授权。

以下是Cody插件的安装和使用步骤：

1. 访问Cody官网获取安装指导。

2. 插件安装后需授权，对于VS Code用户，通过登录Sourcegraph账号即可使用。

3. 对于其他IDE如IDEA，需安装插件后在设置中输入Access tokens。在Sourcegraph官网创建新的token密钥，保存到IDEA的Cody设置中。

4. 使用Cody时，只需输入代码问题或请求解释，如解释源码类的方法。

Cody插件提供免费使用，相比其他非官方插件，其功能和价值较高，适合编程人员作为日常辅助工具。通过集成Cody，可以提高代码开发效率，解决编程问题，推荐给广大编程爱好者和专业人士使用。

AI与PDE（七）：AFNO模型的源代码解析

本文旨在解析AFNO模型的源代码，帮助读者理解模型细节与主干结构。首先，AFNO模型的主干框架在afnonet.py文件中定义，通过类AFNONet实现。模型的核心功能封装在多个类与函数中，依据代码注释逐步解析。

在代码中，forward_features函数负责模型的核心逻辑，包括patch切割与mixing过程。这些操作由PatchEmbed类实现。位置编码self.pos_embed通过高斯初始化得到，增加模型的表示能力。

关键模块AFNO2d位于代码中，它基于FNO的原理，负责处理输入数据。AFNO2d模块在forward_features函数中通过循环调用，实现数据的转换与混合。

经过数个L layer处理后，模型进入类似解码器的结构，用于将中间结果映射为目标结果。这一过程通过self.head(x)实现，以解决特定分类问题。

本文通过梳理代码流程与结构图，直观展示了AFNO模型的工作原理。读者可参考AFNO的GitHub源代码与论文，深入理解细节。后续文章将继续探讨基于AFNO模型框架的其他应用，如FourCastNet。

腾讯T2I-adapter源码分析（3）-训练源码分析

随着stable-diffusion和midjourney等AI技术展现令人惊叹的艺术创作，人们对AI可控绘图的追求日益高涨。为提升AI图像生成的可控性，Controlnet和T2I-adapter等解决方案应运而生。系列文章将从T2I-adapter的源码出发，深入剖析其训练部分的实现原理。

本篇我们将聚焦于训练源码的解析，通过代码结构的梳理，了解T2I-Adapter的训练流程。

训练代码的运行涉及数据处理、模型加载、优化器设置以及实际训练过程。在第一部分，我们首先设置参数并加载数据，如DepthDataset，它从txt文件中读取、对应的深度图和文本描述。

在模型加载阶段，我们区分了stable-diffusion模型和adapter。stable-diffusion模型加载时，其配置与推理阶段有所差异，如增加调度器参数、提高精度、调整分辨率和训练相关参数。adapter模型的加载则遵循推理过程中的初始化方法，通过构建不同模块来实现。

训练过程中，adapter模型的关键结构包括下采样、卷积和ResnetBlock的使用，相比controlnet，T2I-adapter的参数更少，没有注意力层，这使得训练更为高效。模型放入GPU后，使用adamW优化器进行训练，同时设置学习率和数据保存路径。

状态恢复部分，程序会判断是否从头开始或恢复训练，设置log信息。接下来，代码进入实际的训练循环，包括条件编码、隐藏状态生成、adapter结果附加至sd模型以及adapter梯度计算。

loss函数定义在模型配置中，采用L2损失来衡量生成图像与给定时间点加噪ground truth的接近程度。训练过程中，loss计算和模型保存都在代码中明确体现。

总的来说，T2I-adapter的训练源码展示了精细的结构和参数设置，确保了AI绘画的可控性和性能。在AI艺术的探索中，每一行代码都承载着技术进步的点滴痕迹。

AI Code Translator 编程语言自动转换工具源码分析

近期，关注到开源库 PuerTS 提及“Lua到TS的AI转写”。基于此，我探究了一款基于GPT的代码翻译工具——“AI Code Translator”。此工具能将一种编程语言自动转换为另一种语言。PuerTS提及的“AI转写”可能采用了相似原理。本文将深入分析“AI Code Translator”中“转写”部分的实现。

项目地址：未提供

项目截图：未提供

尝试使用在线工具 aicodeconvert.com/ 将一段TS代码转为Lua。实际体验中，AI转换的Lua代码保留了TS代码的含义、结构和写法，但需要开发者补充一些在目标语言中不存在的类型或函数，例如Lua的class。此外，名称保持与源代码一致，但如果源代码中使用特定库或框架，转换后的代码同样使用该库，但目标语言可能并未提供相应版本，需要开发者自行实现或先用AI转写源库。

分析工具的前端使用next.js编写，核心功能在Index.ts文件中，包含createPrompt和OpenAIStream两个关键方法。createPrompt负责构造AI翻译所需的提示词，OpenAIStream则封装了与OpenAI API的交互。createPrompt方法根据输入语言、输出语言以及代码内容构建提示词，旨在让AI理解翻译任务并生成目标代码。

创建提示词的方法分为三个主要分支，分别针对自然语言输入、自然语言输出以及具体编程语言的输入和输出情况。在构建提示词时，采用身份说明、任务描述、举例、具体文本填充和输出格式续写等步骤，旨在引导AI完成代码翻译。

对于大工程的转写，建议采用以下改进策略：分析代码依赖关系，优先转写底层代码；分段处理代码，避免超过AI处理的token长度限制；对AI生成的代码进行人工检查和测试，提升代码质量。这些技巧可帮助开发者更高效地利用AI转写工具。

总结，AI转写工具“AI Code Translator”通过简单的提示词构造实现代码自动转换。虽然适用于小型代码段，但对于大工程的转写还需结合人工辅助，以提高效率和代码质量。此外，若目标是学习和开发网络游戏，特别是手机游戏或游戏行业相关工作，推荐阅读《Unity3D网络游戏实战（第2版）》，本书由作者总结多年经验编写，提供实用的教程和知识，非常适合这一领域的需求。

想知道更多资讯>>>点击进入“探索”频道

【新主页源码】【工控编程源码】【源码笔记12】ai写源码

精选图文

热点推荐