英伟达
直播中

孙燕冉

7年用户 328经验值
私信 关注
[问答]

M10仅显示2个GPU

我有一台带有ESXi 6.0 Build 4192238的服务器,带有一个带驱动程序367.64的M10。
当我运行nvidia-smi时,它只显示2个GPU,只允许我运行一半的预期用户。
有任何想法吗?
+ -------------------------------------------------
---------------------------- +
|
NVIDIA-SMI 367.64驱动程序版本:367.64 |
| ------------------------------- + -----------------
----- + ---------------------- +
|
GPU名称持久性-M |
Bus-Id Disp.A |
挥发性的Uncorr。
ECC |
|
Fan Temp Perf Pwr:用法/上限|
内存使用|
GPU-Util Compute M. |
| =============================== + =================
===== + ====================== |
|
0特斯拉M10开|
0000:07:00.0关闭|
N / A |
|
N / A 33C P8 10W / 53W |
6712MiB / 8191MiB |
44%默认值|
+ ------------------------------- + -----------------
----- + ---------------------- +
|
1特斯拉M10开|
0000:08:00.0关闭|
N / A |
|
N / A 36C P0 17W / 53W |
6713MiB / 8191MiB |
27%默认值|
+ ------------------------------- + -----------------
----- + ---------------------- +
+ -------------------------------------------------
---------------------------- +
|
进程:GPU内存|
|
GPU PID类型进程名称用法|
| =================================================
============================ |

以上来自于谷歌翻译


以下为原文

I have a server with ESXi 6.0 Build 4192238 with a single M10 with driver 367.64. When I run nvidia-smi it only shows 2 GPUs and only lets me run half of the expected users. Any ideas?

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 367.64                 Driver Version: 367.64                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla M10           On   | 0000:07:00.0     Off |                  N/A |
| N/A   33C    P8    10W /  53W |   6712MiB /  8191MiB |     44%      Default |
+-------------------------------+----------------------+----------------------+
|   1  Tesla M10           On   | 0000:08:00.0     Off |                  N/A |
| N/A   36C    P0    17W /  53W |   6713MiB /  8191MiB |     27%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|

回帖(2)

孙缅禧

2018-9-11 16:46:01
也许你的4G资源不足(ESXi驱动程序存在PCI over 4G问题)。
请参阅 -  http://nvidia.custhelp.com/app/answers/detail/a_id/4119/~/incorrect-bios-settings-on-a-server-when-used-with-a-hypervisor-can-cause-
MMIO

以上来自于谷歌翻译


以下为原文

Maybe you are running out of PCI resources under 4G (ESXi drivers have problems with PCI over 4G). See - http://nvidia.custhelp.com/app/answers/detail/a_id/4119/~/incorrect-bios-settings-on-a-server-when-used-with-a-hypervisor-can-cause-mmio
举报

王兰英

2018-9-11 16:52:50
感谢您的回复。 
我不相信这是一个资源问题。
自从发布以来,我已经能够借用另一台M10并且在交换它们之后,看起来我的M10很糟糕。
更换按预期工作,重新安装后,我的M10继续只能使用2个GPU。
看起来我必须RMA它。

以上来自于谷歌翻译


以下为原文

Thanks for your reply.
I do not believe it is a resource issue. Since posting, I've been able to borrow another M10 and after swapping them out it appears that I have a bad M10. The replacement works as expected and my M10 continues to only work with 2 GPUs after reinstalling again. Looks like I'll have to RMA it.
举报

更多回帖

发帖
×
20
完善资料,
赚取积分