环境:ubuntu 18.04 + 2张NVIDIA RTX 2080TI + cuda10;
现象如图:

在这里插入图片描述
nvidia-smi结果只显示其中一张显卡;

排查过程:

1. BIOS能检测PCI两张显卡;正常;

调换位置也能检测到,基本排除硬件问题;

2. lspci |grep NVIDIA结果


两张显卡显示正常;

3.ls -l /dev/nvidia*

在这里插入图片描述
两张显卡显示正常;

4. 重装nvidia驱动,问题未解决;

5.echo出现差别

在这里插入图片描述
可以看出第一张卡没法读写,第二张卡可以写(nvidia-smi显示的也是第二张卡);

6. 测试

拔掉第二张显卡,测试第一张显卡,开机后进不了图形界面,nvidia-smi也没有显示显卡信息,基本确定显卡硬件故障,直接电话送修。

结论:还是建议买公版的显卡。

更多推荐