当前位置:首页 > 天道酬勤 > 正文内容

pytorch使用gpu(pytorch gpu版本)

张世龙2021年12月21日 13:34天道酬勤1250

py torch 1.8版自2020年10月1.7日发布以来,已收集了3000多次GitHub提交。 但是,最令人高兴的是,政府终于加入了对AMD ROCm的支持,无需配置Docker即可在本机环境中轻松运行。

请注意,AMD ROCm只支持Linux操作系统。 另外,这次更新有很多亮点。

与新的移动端教程新的性能检测工具演示相关的库TorchCSPRNG、TorchVision、TorchText和TorchText,用于优化代码并更新编译器Python中的函数转换以增强分布式训练需要注意的是,1.6以后,Pytorch的新功能分为Stable、Beta、Prototype三个版本。 其中,Prototype不属于稳定的发行版,必须从Nightly版本进行自我编译。

添加到

Python to Python函数转换

的beta特性torch.fx实现了从Python到Python的函数转换,可以轻松参与所有工作流。

版本

新的API,向NumPy学习!

1.7中添加的beta特性torch.fft为正式特性。 实现了与Numpy的np.fft同样的快速傅立叶变换,增加了硬件加速的支持和自动指导,更好地支持了科学计算。

还增加了测试版NumPy样式的线性代数模块torch.linalg,支持Cholesky分解、行列式、特征值等功能。

增强分布式训练

增加稳定的异步错误和超时处理,提高NCCL的可靠性。 增加了beta版的流水线并行化功能***,可以将数据分解为更小的块,提高并行计算效率。

添加测试版的DDP通信挂钩以控制工作器之间的同步梯度。 此外,还有Prototype版分布式培训的新功能。

ZeroRedundancyOptimizer :用于减少所有参与进程的内存消耗。

进程组nccl send/recv :允许用户使用Python而不是c进行集合运算。

cuda-supportinrpcusingtensorpipe :提高n卡运算的效率。

远程模块:允许用户像处理本地模块一样操作远程模块。

移动端新教程

随着这次更新,发布了图像分割模型DeepLabV3的安卓和在IOS上的详细教程。

安卓和IOS上的演示程序,如图像分割、目标检测、神经机器翻译等,方便大家更快地拿到。

另外,还有py torch mobilite解释器,可以减小运行时文件的大小。

添加

性能检测工具

测试版的Benchmark utils可以帮助用户进行准确的性能测试。

并且Prototype版的FX图形模式量化实现了量化过程的自动化。

文章的部分素材来源:量子比特

扫描二维码推送至手机访问。

版权声明:本文由花开半夏のブログ发布,如需转载请注明出处。

本文链接:https://www.zhangshilong.cn/work/26347.html

标签: originpgcpython
分享给朋友:

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。