tensorflow的新版本的安装是不分CPU和GPU版本的,直接 pip install tensorflow 就行了

重要的是cuda和cudnn的安装和配置,搞了很久就是用不了GPU

一、NVIDIA 官网 下载安装:CUDA toolkit

https://developer.nvidia.com/cuda-toolkit 下载 11.7.1 版本
安装时,如果已经安装过其它NVIDIA驱动也可以直接再安装

安装时一定要选择【自定义安装】,选项选择:

  1. 可以去掉 nvidia geforce experience .. (这个程序没啥用)
  2. 去掉cuda->visual studio interation (如果没有安装visual studio的IDE的话,根本没用,一般也不用这个IDE所以我选择不要)
  3. diriver components->下面的驱动的话,看一下当前版本和这个程序自带的新版本,自带的版本高于已安装的版本就勾上,否则就去掉吧(如果已经安装过了nvidia驱动应该能看到已有版本号)
    576ED9F1-56D7-4962-A1A9-E58BBA21A696.png
    811D38A8-1D9B-46c5-846C-8E2C43BFB406.png
    F4E8FF23-97F0-40d5-B960-9A82FEB743C2.png

这个安装后一般会需要重启才能生效的,选择等一会把cudnn一并配置好后重启即可。

二、NVIDIA 官网 下载安装:CUDNN (这个程序是需要登录后,加入到开发者身份才能下载,加入也简单,注册账号,填写一个个人资料就可以顺利下载到)

这里要注意cudnn需要与CUDA toolkit的版本兼容才能使用,不然以后在运行tf程序的时候,可能会出现意外终止问题(看到 Loaded cuDNN version 之后就意外退出了,没有任何报错信息)
下载时,一定要看看下载到兼容版本的
https://developer.nvidia.com/rdp/cudnn-archive

这个下载回来后不需要安装,直接解压后就可使用,我的方法是解压后,把文件夹名字改成【cudnn】然后放到CUDA的安装目录里

三、重点:环境变量的配置

需要四个环境变量:

# CUDA toolkit安装后应该会自动添加好以下两个环境变量
$CUDA\bin
$CUDA\libnvvp
# 以下两条是需要手动添加的,添加到上移置顶
$CUDA\extras\CUPTI\lib64
$CUDA\cudnn\bin

61414EDB-3398-4a72-A44D-98E6F04047B2.png

重启电脑让显卡驱动生效。

验证是否有可用的GPU

import tensorflow as tf
tf.test.is_gpu_available()  #True or False  ,  TF1.x 和 TF 2.x中都适用
tf.config.list_physical_devices('GPU')  #会得到一个可用的GPU的设备列表

标签: none

添加新评论