怎么创建个人的网站如何修改网站抓取内容

张小明 2025/12/31 3:53:25
怎么创建个人的网站,如何修改网站抓取内容,h5网站模板开发,百度云盘前言 本文提出了新颖高效的多尺度注意力#xff08;EMA#xff09;模块#xff0c;并将其与YOLOv8结合以提升性能。该模块着重保留各通道信息、降低计算开销#xff0c;通过将部分通道重塑为批量维度、分组通道维度#xff0c;使空间语义特征分布更均匀。其创新点包括高效…前言本文提出了新颖高效的多尺度注意力EMA模块并将其与YOLOv8结合以提升性能。该模块着重保留各通道信息、降低计算开销通过将部分通道重塑为批量维度、分组通道维度使空间语义特征分布更均匀。其创新点包括高效多尺度注意力机制、通道维度重塑、并行子网络设计等在目标检测任务中表现出色。EMA模块结合通道和空间信息采用多尺度并行子网络结构优化坐标注意力机制。实验表明将EMA集成进YOLOv8后模型在图像分类和目标检测任务上有更好表现。文章目录 YOLOv8改进大全卷积层、轻量化、注意力机制、损失函数、Backbone、SPPF、Neck、检测头全方位优化汇总专栏链接: YOLOv8改进专栏文章目录前言介绍摘要创新点文章链接基本原理核心代码引入代码tasks注册步骤1:步骤2配置yolov8-EMA.yaml实验脚本结果介绍摘要通道或空间注意力机制在许多计算机视觉任务中表现出显著的效果可以生成更清晰的特征表示。然而通过通道维度缩减来建模跨通道关系可能会对提取深度视觉表示带来副作用。本文提出了一种新颖高效的多尺度注意力EMA模块。该模块着重于保留每个通道的信息并减少计算开销我们将部分通道重新调整为批次维度并将通道维度分组为多个子特征使空间语义特征在每个特征组内分布均匀。具体来说除了在每个并行分支中对全局信息进行编码以重新校准通道权重外这两个并行分支的输出特征还通过跨维度交互进一步聚合以捕捉像素级的成对关系。我们在图像分类和目标检测任务上进行了广泛的消融研究和实验使用流行的基准数据集如CIFAR-100、ImageNet-1k、MS COCO和VisDrone2019来评估其性能。创新点高效的多尺度注意力机制EMA模块提出了一种高效的多尺度注意力机制能够同时捕获通道和空间信息并在不增加太多参数和计算成本的情况下有效地提高特征表示能力。通道维度重塑EMA模块通过将部分通道重塑为批量维度将通道维度分组为多个子特征从而使空间语义特征在每个特征组内得到良好分布提高了特征的表达能力。并行子网络设计EMA模块采用了并行子网络设计有助于捕获跨维度的交互作用和建立维度间的依赖关系提高了模型对长距离依赖关系的建模能力。性能优越EMA模块在目标检测任务中表现出色相较于传统的注意力模块如CA和CBAMEMA在保持模型尺寸和计算效率的同时取得了更好的性能表现证明了其在提升模型性能方面的有效性和高效性。适用性广泛EMA模块的模型尺寸适中适合在移动终端上部署并且在各种计算机视觉任务中都表现出色具有广泛的应用前景和实际意义。文章链接论文地址论文地址代码地址代码地址基本原理EMAEfficient Multi-Scale Attention模块是一种新颖的高效多尺度注意力机制旨在提高计算机视觉任务中的特征表示效果。 EMA注意力模块通过结合通道和空间信息、采用多尺度并行子网络结构以及优化坐标注意力机制实现了更加高效和有效的特征表示为计算机视觉任务的性能提升提供了重要的技术支持。通道和空间注意力的结合EMA模块通过将通道和空间信息相结合实现了通道维度的信息保留和降低计算负担。这种结合有助于在特征表示中捕捉跨通道关系同时避免了通道维度的削减从而提高了模型的表现效果。多尺度并行子网络EMA模块采用多尺度并行子网络结构其中包括一个处理1x1卷积核和一个处理3x3卷积核的并行子网络。这种结构有助于有效捕获跨维度交互作用建立不同维度之间的依赖关系从而提高特征表示的能力。坐标注意力CA的再审视EMA模块在坐标注意力CA的基础上进行了改进和优化。CA模块通过将位置信息嵌入通道注意力图中实现了跨通道和空间信息的融合。EMA模块在此基础上进一步发展通过并行子网络块有效捕获跨维度交互作用建立不同维度之间的依赖关系。特征聚合和交互EMA模块通过并行子网络的设计有助于实现特征的聚合和交互从而提高模型对长距离依赖关系的建模能力。这种设计避免了更多的顺序处理和大规模深度使模型更加高效和有效。下图是结构其中包括输入、特征重组、通道注意力和输出步骤。输入阶段输入张量形状为( c , h , w ) (c, h, w)(c,h,w)其中 (c) 为通道数(h) 为高度(w) 为宽度。特征重组阶段输入张量被划分为( g (g(g) 个组每组包含( c g ) (\frac{c}{g})(gc​)个通道。重组后的张量形状为( g × batch size ) (g \times \text{batch size})(g×batch size)。特征提取和聚合阶段特征通过( ( 1 × 1 ) ) ((1 \times 1))((1×1))的卷积层和平均池化层提取并聚合。聚合后的特征通过一个 Sigmoid 激活函数进行处理以生成通道权重。通道注意力阶段特征被进一步通过( ( 3 × 3 ) ) ((3 \times 3))((3×3))卷积层和平均池化层提取得到每个通道的注意力权重。使用 Softmax 进行归一化处理确保权重分布合理。特征融合阶段提取到的特征通过矩阵乘法与原始特征进行融合生成最终的通道注意力特征。最终特征通过 Sigmoid 激活函数处理以生成像素级别的注意力图。输出阶段经过以上处理后生成的特征被重组为原始输入的形状( ( c , h , w ) ) ((c, h, w))((c,h,w))形成最终输出。通过这些步骤实现了对输入特征的多尺度注意力处理增强了特征表示的辨识能力同时降低了计算开销。核心代码importtorchfromtorchimportnnclassEMA(nn.Module):def__init__(self,channels,c2None,factor32):super(EMA,self).__init__()self.groupsfactor# 分组数默认为32assertchannels//self.groups0# 确保通道数能够被分组数整除self.softmaxnn.Softmax(-1)# 定义 Softmax 层用于最后一维度的归一化self.agpnn.AdaptiveAvgPool2d((1,1))# 自适应平均池化将特征图缩小为1x1self.pool_hnn.AdaptiveAvgPool2d((None,1))# 自适应平均池化保留高度维度将宽度压缩为1self.pool_wnn.AdaptiveAvgPool2d((1,None))# 自适应平均池化保留宽度维度将高度压缩为1self.gnnn.GroupNorm(channels//self.groups,channels//self.groups)# 分组归一化self.conv1x1nn.Conv2d(channels//self.groups,channels//self.groups,kernel_size1,stride1,padding0)# 1x1卷积self.conv3x3nn.Conv2d(channels//self.groups,channels//self.groups,kernel_size3,stride1,padding1)# 3x3卷积defforward(self,x):b,c,h,wx.size()# 获取输入张量的尺寸批次、通道、高度、宽度group_xx.reshape(b*self.groups,-1,h,w)# 将张量按组重构批次*组数, 通道/组数, 高度, 宽度x_hself.pool_h(group_x)# 对高度方向进行池化结果形状为 (b*groups, c//groups, h, 1)x_wself.pool_w(group_x).permute(0,1,3,2)# 对宽度方向进行池化并转置结果形状为 (b*groups, c//groups, 1, w)hwself.conv1x1(torch.cat([x_h,x_w],dim2))# 将池化后的特征在高度方向拼接后进行1x1卷积x_h,x_wtorch.split(hw,[h,w],dim2)# 将卷积后的特征分为高度特征和宽度特征x1self.gn(group_x*x_h.sigmoid()*x_w.permute(0,1,3,2).sigmoid())# 结合高度和宽度特征应用分组归一化x2self.conv3x3(group_x)# 对重构后的张量应用3x3卷积x11self.softmax(self.agp(x1).reshape(b*self.groups,-1,1).permute(0,2,1))# 对 x1 进行自适应平均池化并应用Softmaxx12x2.reshape(b*self.groups,c//self.groups,-1)# 重构 x2 的形状为 (b*groups, c//groups, h*w)x21self.softmax(self.agp(x2).reshape(b*self.groups,-1,1).permute(0,2,1))# 对 x2 进行自适应平均池化并应用Softmaxx22x1.reshape(b*self.groups,c//self.groups,-1)# 重构 x1 的形状为 (b*groups, c//groups, h*w)weights(torch.matmul(x11,x12)torch.matmul(x21,x22)).reshape(b*self.groups,1,h,w)# 计算权重并重构为 (b*groups, 1, h, w)return(group_x*weights.sigmoid()).reshape(b,c,h,w)# 将权重应用于原始张量并重构为原始输入形状引入代码在根目录下的ultralytics/nn/目录新建一个attention目录然后新建一个以EMA_attention为文件名的py文件 把代码拷贝进去。importtorchfromtorchimportnnclassEMA(nn.Module):def__init__(self,channels,c2None,factor32):super(EMA,self).__init__()self.groupsfactorassertchannels//self.groups0self.softmaxnn.Softmax(-1)self.agpnn.AdaptiveAvgPool2d((1,1))self.pool_hnn.AdaptiveAvgPool2d((None,1))self.pool_wnn.AdaptiveAvgPool2d((1,None))self.gnnn.GroupNorm(channels//self.groups,channels//self.groups)self.conv1x1nn.Conv2d(channels//self.groups,channels//self.groups,kernel_size1,stride1,padding0)self.conv3x3nn.Conv2d(channels//self.groups,channels//self.groups,kernel_size3,stride1,padding1)defforward(self,x):b,c,h,wx.size()group_xx.reshape(b*self.groups,-1,h,w)# b*g,c//g,h,wx_hself.pool_h(group_x)x_wself.pool_w(group_x).permute(0,1,3,2)hwself.conv1x1(torch.cat([x_h,x_w],dim2))x_h,x_wtorch.split(hw,[h,w],dim2)x1self.gn(group_x*x_h.sigmoid()*x_w.permute(0,1,3,2).sigmoid())x2self.conv3x3(group_x)x11self.softmax(self.agp(x1).reshape(b*self.groups,-1,1).permute(0,2,1))x12x2.reshape(b*self.groups,c//self.groups,-1)# b*g, c//g, hwx21self.softmax(self.agp(x2).reshape(b*self.groups,-1,1).permute(0,2,1))x22x1.reshape(b*self.groups,c//self.groups,-1)# b*g, c//g, hwweights(torch.matmul(x11,x12)torch.matmul(x21,x22)).reshape(b*self.groups,1,h,w)return(group_x*weights.sigmoid()).reshape(b,c,h,w)tasks注册在ultralytics/nn/tasks.py中进行如下操作步骤1:fromultralytics.nn.attention.EMA_attentionimportEMA步骤2修改def parse_model(d, ch, verboseTrue):elifmin{EMA}:args[ch[f],*args]配置yolov8-EMA.yaml‘ultralytics/cfg/models/v8/yolov8-EMA.yaml’# Ultralytics YOLO , GPL-3.0 license# YOLOv8 object detection model with P3-P5 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect# Parametersnc:2# number of classesscales:# model compound scaling constants, i.e. modelyolov8n.yaml will call yolov8.yaml with scale n# [depth, width, max_channels]n:[0.33,0.25,1024]# YOLOv8n summary: 225 layers, 3157200 parameters, 3157184 gradients, 8.9 GFLOPss:[0.33,0.50,1024]# YOLOv8s summary: 225 layers, 11166560 parameters, 11166544 gradients, 28.8 GFLOPsm:[0.67,0.75,768]# YOLOv8m summary: 295 layers, 25902640 parameters, 25902624 gradients, 79.3 GFLOPsl:[1.00,1.00,512]# YOLOv8l summary: 365 layers, 43691520 parameters, 43691504 gradients, 165.7 GFLOPsx:[1.00,1.25,512]# YOLOv8x summary: 365 layers, 68229648 parameters, 68229632 gradients, 258.5 GFLOPs# YOLOv8.0n backbonebackbone:# [from, repeats, module, args]-[-1,1,Conv,[64,3,2]]# 0-P1/2-[-1,1,Conv,[128,3,2]]# 1-P2/4-[-1,3,C2f,[128,True]]-[-1,1,Conv,[256,3,2]]# 3-P3/8-[-1,6,C2f,[256,True]]-[-1,1,Conv,[512,3,2]]# 5-P4/16-[-1,6,C2f,[512,True]]-[-1,1,Conv,[1024,3,2]]# 7-P5/32-[-1,3,C2f,[1024,True]]-[-1,1,SPPF,[1024,5]]# 9# YOLOv8.0n headhead:-[-1,1,nn.Upsample,[None,2,nearest]]-[[-1,6],1,Concat,[1]]# cat backbone P4-[-1,3,C2f,[512]]# 12-[-1,1,nn.Upsample,[None,2,nearest]]-[[-1,4],1,Concat,[1]]# cat backbone P3-[-1,3,C2f,[256]]# 15 (P3/8-small)-[-1,1,EMA,[256]]# 16 (P5/32-large)-[-1,1,Conv,[256,3,2]]-[[-1,12],1,Concat,[1]]# cat head P4-[-1,3,C2f,[512]]# 19 (P4/16-medium)-[-1,1,EMA,[512]]# 20 (P5/32-large)-[-1,1,Conv,[512,3,2]]-[[-1,9],1,Concat,[1]]# cat head P5-[-1,3,C2f,[1024]]# 23 (P5/32-large)-[-1,1,EMA,[1024]]# 24 (P5/32-large)-[[16,20,24],1,Detect,[nc]]# Detect(P3, P4, P5)实验脚本importosfromultralyticsimportYOLO yamlultralytics/cfg/models/v8/yolov8-EMA.yamlmodelYOLO(yaml)model.info()if__name____main__:resultsmodel.train(datacoco128.yaml,nameEMA,epochs10,workers8,batch1)结果
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

上传文件网站莱芜58同城网

〇、前言从 2020 年到 2025 年,AI 在多个维度实现了跨越式发展。从 ChatGPT 到 DeepSeek 等大型语言模型(LLM),以及多模态融合,从一开始的文本到后续的图片、文档、视频,还有辅助编程等等,都在说…

张小明 2025/12/31 3:52:52 网站建设

乐山 网站建设wordpress 主题 教育

《多态之函数重载》封装 继承 多态 抽象多态:同一个方法不同形态体现,多态分静态多态和动态的多态静态多态:函数重载和符号重载动态多态:抽象和虚方法函数重载:在同一个范围内,函数名一样,参数的…

张小明 2025/12/31 3:51:45 网站建设

怎么建设网站后台私域电商软件的直播解决方案

选对Geo优化服务商,网站流量翻倍不再是梦!在数字化营销的时代,网站的流量是企业发展的重要指标。然而,如何有效地提升网站流量,成为许多企业面临的挑战。Geo优化作为一种有效的策略,可以帮助企业精准定位目…

张小明 2025/12/31 3:51:11 网站建设

免费设计房屋的软件网站人多怎么优化

ArduPilot 与 BLHeli 电调配置实战指南:从协议选择到遥测调试 你有没有遇到过这样的情况?飞控已经校准,遥控器油门推满,但电机就是不转;或者刚起飞就抖得像筛子,螺旋桨嗡嗡作响;又或是地面站里…

张小明 2025/12/31 3:50:35 网站建设

没有域名怎么搭建网站青岛做网站推广

数据库并发处理与数据集存储过程更新详解 1. 并发处理问题 在对数据库进行更新操作时,一个基本且常见的问题是如何处理对同一数据的并发更新。例如,客户端 1 从表中检索出一行数据,随后客户端 2 也检索出同一行数据。由于客户端 2 处理速度较快,在客户端 1 之前将更新提交…

张小明 2025/12/31 3:50:01 网站建设

怎样建立微网站宁波seo整站优化

A100/H100用户必看:PyTorch-CUDA-v2.9镜像性能调优建议 在当今大规模深度学习训练场景中,A100与H100 GPU已成为高性能计算的标配。它们凭借强大的Tensor Core、超高的显存带宽和对先进精度格式(如TF32、FP8)的支持,为大…

张小明 2025/12/31 3:49:26 网站建设