Tesla M40采用了完整的麦克斯韦架构大核心GM200,3072个流处理器,核心频率达1140MHz,单精度浮点计算突破7TFlops,可惜双精度十分残废只有可怜的0.21TFlops。
显存配备了多达12GB GDDR5,位宽384-bit,但是麦克斯韦架构并不支持显存和缓存的片上ECC,应该会以软件方式提供,但官方并未提及。
NVIDIA宣称,Tesla M40可将机器学习训练时间缩短到1天,CPU则需要至少8天。
Tesla M40的外观设计除了颜色之外和GTX Titan X看起来很像,不过改成了被动散热(依靠系统风扇),热设计功耗250W。
Tesla M4这是小型低端卡,事实上这也是第一款半高式的Tesla。它采用了麦克斯韦GM206核心(第一次用于Tesla),1024个流处理器,128-bit 4GB GDDR5显存,浮点性能单精度2.2TFlops、双精度0.07TFlops,热设计功耗50-75W。