因BIOS设定导致GPU无法使用问题(DELL R740服务器)
今天新装一台配有NVIDIA Telsa M10显卡的Dell R740服务器,服务器地产系统安装的VMware ESXi 6.0U3系统,一切按正常操作,显卡驱动安装也显示正常,但后通过vCenter给虚拟机分配显卡是遇到GPU配置文件无效问题,如图所示:
使用NVIDIA-smi命令也报错
首先,为确认显卡是否存在故障,我通过客户端可以配置显卡直通并分配到VM,因此判断不是显卡问题;
显卡驱动为NVIDIA官网下载,卸载重装也都没有问题,排除驱动版本问题;分析判断感觉是Dell R740的BIOS设定有问题,尝试步骤如下:
F2--进入BIOS设定
检查各项配置
默认值是56TB,(ESXi6.X最大支持16TB内存,默认值56TB,可能存在问题)修改成12TB,保存重启进入系统
再次进入vcenter分配GPU,配置方案生效,GPU正常工作
故障处理解释:
ESXi虽然是64位系统,但是内存寻址限制到44位,也就是最大支持16TB内存;官方kb:
https://kb.vmware.com/s/article/2087943?lang=en_US#q=2087943
目前Dell R740 出厂BIOS默认配置56TB内存,因此导致无法正确识别到GPU,所以需要确保NVIDIA GRID GPU的PCI寻址低于44位限制,才能使GPU正常工作。
更多精彩,请继续关注监控那些事儿,交流学习 感觉此文章有对您有所帮助动一下小手转发,关注,收藏!谢谢!
- 2022-03-23
工作站电脑是服务器?其实和你的电脑差 - 2022-03-23
中兴通讯R8500 G4X 服务器性能提升,水冷 - 2022-03-23
从深度学习计算过程来分析深度学习工作 - 2022-03-23
为防止有人对CPU动手脚,联想旗下工作站 - 2022-03-23
干货丨VMware vSphere 服务器虚拟化部署安装 - 2022-03-23
计算机机房控制温度与湿度方法 - 2022-03-23
Windows Server2012打印机安装与管理 - 2022-03-23
工作站和塔式服务器有什么区别 - 2022-03-23
「他山之石」保姆级教程:个人深度学习 - 2022-03-23
网站安全:你的网站服务器在哪?服务器