传奇sf,传奇私服发布网,新开一秒传奇
当前位置:网站首页 > 传奇私服 > 正文

传奇私服租什么服务器

作者:admin发布时间:2021-10-29分类:传奇私服浏览:150评论:5


导读:概述AI加速引擎TACO-是基于腾讯云IaaS资源推出的AI训练加速引擎,为用户提供开箱即用的AI训练套件,用于分场景支持高性能分布式训练。TACO-基于腾讯内部丰富的AI业务场景...

概述

AI加速引擎TACO-是基于腾讯云IaaS资源推出的AI训练加速引擎,为用户提供开箱即用的AI训练套件,用于分场景支持高性能分布式训练。TACO-基于腾讯内部丰富的AI业务场景,提供自底向上的网络通信、分布式策略及训练框架等多层级的优化,是一套全生态的训练加速方案。为了更好的服务用户,腾讯云决定免费提供内部深度优化的AI训练加速方案,助力用户节约计算成本,提高AI产品研发效率。使用TACO进行云上AI加速随着云计算的普及,GPU算力的增强,基于深度学习的AI技术已经渗透到各行业。应用场景更加复杂,特征也更加丰富,网络模型从MB增长到GB甚至TB级别,训练所花费的时间越来越长。如何利用有限的GPU算力更高效地解决AI业务场景中遇到的问题成为了共同关注的焦点。用户可以使用TACO方案加速深度学习,其架构如下图所示:说明目前仅提供TACO-加速AI训练场景。关于支持推理场景TACO-加速引擎的发布信息,请您定期关注GPU云服务最佳实践文档。TACO-提供以下三个训练加速组件::基于深度优化的训练框架。:基于深度优化的分布式训练框架。HARP:自研用户态网络协议栈。应用场景TACO-Training加速组件支持但是不限于以下场景:推荐系统。例如,Wideamp;Deep,DeepFM等。自然语言处理。例如,BERT,Transformer等。图像识别。例如,ResNet、MobileNet及Inception系列等。组件介绍TTFTensorFlow是深度学习领域中应用最广泛的开源框架之一,但是在很多业务场景下,开源Tensorflow有其特定的限制。为了解决实际业务中遇到的问题,TencentTensorflow(以下简称TTF)提供了以下能力:相比原始的静态Embedding,高维稀疏动态Embedding帮助用户在不需要重新训练的条件下,动态添加和删除特征,按需使用内存,避免Hash冲突,同时保留原始TF的API设计风格。混合精度在原有实现的基础上增加了调整精度的策略,根据loss的状态自动在全精度和半精度之间切换,避免精度损失。针对特定业务场景的XLA、Grappler图优化及自适应编译框架,解决冗余编译的问题。开源TF1版本不再提供对AmpereGPU的支持,但考虑到很多用户仍然在使用TF1.15版本,为了解决该问题,TTF添加了对CUDA11的支持,使用户可以使用A100来进行模型训练。LightCCLightCC是基于Horovod深度优化的分布式训练框架,在保留了原生Horovod的易用性上,增加了性能更好的通信方式。LightCCAPI与Horovod完全兼容,业务不需要任何改动,无缝迁移。相比Horovod,LightCC提供了以下能力:2DAllReduce充分利用通信带宽。高效的梯度融合方式。TOPK压缩通信,降低通信量,提高传输效率。HARP随着网络硬件技术的发展,网卡的速度从10G增长到100G甚至更高,并在数据中心大量部署使用。但目前普遍使用的内核网络协议栈存在着一些必要的开销,使其不能很好地利用高速网络设备。为了解决内核网络协议栈存在的问题,腾讯云自研了用户态网络协议栈HARP,可以以Plug-in的方式集成到NCCL中,无需任何业务改动,加速云上分布式训练性能。在VPC的环境下,相比传统的内核协议栈,HARP提供了以下的能力:支持全链路内存零拷贝,HARP协议栈提供特定的buffer给应用,使应用的数据经过协议栈处理后由网卡直接进行收发,消除内核协议栈中耗时及占用CPU较高的多次内存拷贝操作。支持协议栈多实例隔离,即应用可以在多个CPUcore上创建特定协议栈实例处理网络报文,每个实例间相互隔离,保证性能线性增长。数据平面无锁设计,HARP协议栈内部保证网络session的数据仅在创建该session的CPUcore上,使用特定的协议栈实例处理。减少了内核中同步锁的开销,也降低了CPU的CacheMiss率,大幅提升网络数据的处理性能。性能提升TTF动态Embedding在某推荐业务上对AUC的提升效果:TTFXLA在某游戏业务上的性能加速效果:在腾讯云50GVPC环境下,ResNet50的多机训练加速效果:在腾讯云50GVPC环境下,Transformer的多机训练加速效果:在腾讯云50GVPC环境下,BERT-Base的多机训练加速效果:开始使用目前TACO-Training将以容器方式提供给用户使用,具体使用方式可参考部署及实践。


已有5位网友发表了看法:

欢迎 发表评论: