Nvidia

众所周知,前段时间,大批量的显卡被送去锻炼身体了。这段时间内,显卡的价格可以说是水涨船高。潮水退去,显卡价格开始雪崩,然而,似乎仍然有一股力量,在强而有力地给价格基本盘托底。YDJSIR很显然也会在低潮地时候,搞点健身房退役卡来比划比划。

随着DAG大小的上升,一批又一批的卡和锻炼无缘,只能退下。当然,这里本文囊括的实际上并不只是锻炼身体残废的卡。炼丹实际上也很摧残显卡,对吧。只不过那种显卡的工作环境稍微好些毕竟求稳。因此专业计算卡(二手)同样在本文的覆盖范围内。全新购买显卡则不在本文的考虑范围内。

Nvidia RTX 2080Ti(魔改水冷,显存22G)

YDJSIR纠结与期待买什么显卡很久了。由于斥巨资买了R9-5950X和华硕X570-PLUS WIFI,原本计划中购买的4060Ti 16G和3080Ti 20G显然是吹了。然而开弓没有回头箭,既然决定了就一定要坚持到底。这期间还考虑过RTX 5000M 16G魔改方案(1600,号称为正式版核心),然而卖家居然表示这个价拿到的还是二手货,YDJSIR不满。最终,YDJSIR还是选择了最简单直白的方案:2080Ti 22G。闲鱼上正好有个老哥2400低价出一套水冷2080Ti,那YDJSIR当然是立刻冲了。卖家说拿到手炼了半年的丹,直到更换3090。至于再上一手?谁知道是哪来的。不管它之前在无尘机房挖人工智能矿和某莫名其妙矿场挖某种币,在我手上能用就行。

拿到手确实看得出充满了炼丹的气息。灰也太多了……扣具魔改的厉害,四颗螺丝就上了对角,不过反正最后也不是不能用。背板螺丝都松了,让YDJSIR略有担忧。挡板卖家没有提供,YDJSIR找了老半天才找到合适的螺丝。

image-20231026105119823

很显然显卡上后半段是预留了螺丝孔位的,不过卖家觉得反正显存和热点最高也就88℃,懒得装了。YDJSIR非常不理解这种行为,但确实缺少螺丝,且YDJSIR很不想拆这套扣具,就这样吧。底部风扇隔了这么远吹一吹问题应该也不太大。装显卡的过程中水冷管不够长,导致风扇只能装在机箱和冷排之间,非常难绷。因为这主板刚好是第二槽主PCIe x16……电源是ROG 雷神一代。这机箱里面确实是有ROG零件的,YDJSIR第一次装机装得比较符合标签描述。TUF勉强也能算小ROG嘛,对吧?

image-20231026110116829

来一套双烤成绩。机箱为D41,前置增加了一个大镰刀风扇,底部和后部一样用的EK AIO BASIC 240水冷上拆下来的12025风扇。CPU散热为利民PA120,非PA120SE。显卡水冷来自酷冷,型号不明。室温16℃。机箱侧板关闭放于宿舍电脑位置,前后左右大概有一两个机箱的空间。D41机箱是真的好看!

image-20231026110434023

烤机两小时后得到如下数据。160W 的CPU + 250W的GPU,挺不错的了。水冷压制下显卡性能发挥极为平稳。环境温度上去后,风扇再努力也还是比较困难。这样下去确实可以烤腿了。

image-20231026105853587

来一张GPU-Z图。

image-20231026110619476

后期当然是换了最新的Studio驱动。YDJSIR在此处提供了一些3DMark结果。可能是因为频率和TDP没拉高,这张卡在2080Ti对比中其实挺弱的。Anyway,能用就行。

Nvidia Tesla M4 (公版改散热,显存4G)

200块买不了吃亏买不了上当!只要200!顺丰包邮!

散热是自己改的,拿了一个半高刀卡只有两线(没错,只有正负极的定速风扇,嗯吹)。

image-20230326210626267

给PCIE3.0x4通道,6000转双小风扇满载能65W压到67℃(室温18℃左右),FurMark正常,但是性能还是太屑了。就当纯CUDA吧。这和核显没本质区别……最多翻一番,有独立显存。也有可能是因为8G内存显卡根本跑不开?

image-20230326210826368

image-20230326210849935

测试文件结果自取。不想评价什么了。

https://oss.ydjsir.com.cn/GitPages/X79andP106/tsresult-m4.3dmark-result

后续:YDJSIR 130到付把这个卡给卖了。买家似乎是 中国科学院地理科学与资源研究所 的研究人员。他表示他要拿这个显卡剪仿真软件的视频。YDJSIR想不明白这破卡能起什么作用。不过既然他说能用,那就是能用了。

后来,YDJSIR 还又卖了一块 PM953 给他。168块960G带转PCIe x1的转接卡,又不是不能用。

Nvidia Tesla K20 (华强北已硬改Titan加焊DP接口,显存5G)

刚收到,只卖233.33,这不立刻上手。当然YDJSIR暂时没机子试机,所以懒得试了。

image-20230326211316656

233想要性能当然是无脑588。588也许是卡与卡间差价最大的一张卡了,从白牌到旗舰,各种输出接口,应有尽有,毕竟这玩意很显然嗯离谱。但是这是魔改的Titan!初代Titan价格翻三倍。感谢球菌,反正公版泰坦皮也玩过了。体验一波1065性能吧。这也属于YDJSIR的“我炸死你”系列装机,属于又不是不能用系列。这玩意之后上套笔记本U配合着一起用用玩玩,整机没一点正经的东西。

最后这玩意点不亮。这傻逼机箱搞了一下还把PCIE槽搞坏了,收藏品+1。

Nvidia Tesla P40 (公版外挂散热,显存24G)

赶快上车,不要迟疑。除了没有半精度,AI算力和3060 12G持平,但显存翻倍,便宜!便宜!便宜!

YDJSIR的QVYE核显大抵是有些问题,只好还是用K620配合开Grid用。这张卡不能命令行切模式,可恶。

教程参考 https://blog.csdn.net/weixin_44503976/article/details/127942918 。关于P40的测评都被做烂了,B站太多。YDJSIR就不展示了。YDJSIR没超频,全默认、用K620这种卡输出,确实延迟很大而且高分辨率不友好。要是YDJSIR用QV1K或者是体质更好的QVYE就好了。

同城闪送,YYDS。珠江路下单只要半小时送到。YDJSIR用离心涡轮散热很安静,满载75℃以下,室内温度18℃左右。750没买,血亏。现在都850了(2023,3到4月份交际处),气抖冷。

Nvidia Tesla M40 (公版改散热,显存12G)

在50HX群,看群友折腾X99和P40 24G的相爱相杀把YDJSIR吓破了胆,不敢上挑剔的24G版本,而是买了改好的M40 12G。用的是影驰的1080Ti散热器,双风扇,很安静。完全拉满200W也确实不吵。咸鱼收的,就拿卖家的图充数一下吧。

image-20230307000320505

image-20230304095404360

有一说一,原来这么老的卡都可以开Resizable BAR的吗……不过本身也对他没什么期望就是了。

这个时候,YDJSIR不得不吐槽一下YDJSIR这块离谱的Z490UD。作为一个Z板,它没有C口。没有4K60输出(只有一个HDMI,最高4K30)。这都是小事,暂时可以忍。YDJSIR更新到了最新的F21 BIOS,发现选择优先哪个口输出视频的BIOS选项没了。结果哪怕YDJSIR想放弃4K60,M40渲染核显输出,结果会变成核显驱动一打立刻黑屏。清空CMOS无数次了,毕竟这玩意砖头化都不止一次了。没用!没用!没用!

下面是说明书里面的截图。

image-20230306223321225

下面是刚清完CMOS的实拍。

image-20230306223346862

实际上,QVYE开着核显确实有点小问题。比如说高频内存北桥掉频率之类的莫名其妙的问题。不过这也不是不能用,但既然有别的解决方案,不如还是关掉核显。好吧,禁掉了核显,用AMD亮机卡输出吧。没错,说的就是YDJSIR的肥猫家560。不过跑的结果不算太理想。虽然说这么干如果是只拿显卡来跑CUDA的话确实不错,但可能确实还是少了点图形渲染能力,不太适合打游戏。YDJSIR这么长时间也过来了。YDJSIR尝试着模仿下面这个可以实现AMD亮机卡和P10X系列的特殊“专业”卡并存的方式来实现游戏渲染,但似乎并不奏效。比如说设备管理器禁用黑卡那一步,YDJSIR直接陷于一片黑暗中无法自拔了。这下输麻了。虽然没成功,但是还是把教程放在下面以供参考。

https://www.bilibili.com/video/BV1Nd4y1277n/

不死心的YDJSIR最终决定下血本,花了快200收了一张公认此场景下好用的Nvidia Quadro K620。反正K420是输麻了,他一样有DP和DVI,理论来说应该也一样能用,但不知道为什么就是没人推荐。YDJSIR为什么不用游戏卡魔改同驱方案呢?

感谢Nvidia在T4驱动下留下的超强兼容性,用游戏驱动的话可能录制功能什么的会好用很多之类的,对一些新游戏的支持也更好。似乎图拉丁吧著名大佬还要预制一个特斯拉,特殊“专业”卡、移动端魔改卡和普通游戏卡,甚至特定专业卡跨架构同堂的神奇驱动。

游戏卡方案至少要1050以上的N卡才好用(然而YDJSIR发现自己太naïve了,魔改卡又不是不行,实际上这些方案的想法很多时候还是想着炼丹专用大显存,光追和新功能就扎扎实实用新的魔改卡,毕竟新东西就是新东西。哪怕是2060M,它也没比P40的1080Ti弱到哪里去,还省掉了拆分渲染和输出带来的延迟。不过再怎么说,这类魔改卡的成本可不低,已经违背了YDJSIR希望把主力交给M40这样的想法。所以还是买神奇的K620吧。详细教程看下面这个。YDJSIR用的是之际装Quadro驱动然后改驱动的方案。其他的改注册表啊高性能设置之类的,和视频里说的是一模一样的。毕竟这样得到的驱动的版本会更高一些。

https://www.bilibili.com/video/BV1d3411a7x8/

宝藏!上面的视频真的是宝藏!

实际上垃圾亮机卡配P系列的也是一样成立的。比如说这个。

https://www.bilibili.com/video/BV1c24y1m7eH/

实际上K600只要差不多一半的价格,虽然只差了一年,而且这两张卡性能差距并不大。但是K620价格快翻倍了,原因,你猜?K600居然只有1GB显存,估计是哪怕只做输出也不够吧。YDJSIR实际使用的时候哪怕是K620显存占用日常过1G。总有那么一些应用是一定吃输出那张卡的。

让我们看看3D Mark吧。和10700K+万能的1060Ti对比一下。YDJSIR这套方案DX12下薄纱后者(显卡部分),但DX11下却打不过。怎么回事呢?理论来说其实确实980Ti应该对飙1660的。

YDJSIR没想到的是居然Time Spy这种DX12的测试里面古老的M40表现得居然更好。怎么回事呢?

image-20230306234729153

DX12方面,拉个最强的过来羞辱一下。

image-20230306234111524

但是,换到DX11的Fire Strike,后者差距就没这么大了。YDJSIR不理解。

image-20230306234612046

image-20230306234914879

用起来的话,无非也就是炼丹和游戏。地平线4,高画质锁60帧不是什么问题。地平线5,中画质锁60也行。反正又不是不能玩。分辨率问就是1080。YDJSIR给M40是PCIE3.0x16,但是K600给的是PCIE3.0x4,众所周知K600只支持PCIE2.0。这样一波下来实际上它带宽非常有限,只剩下PCIE2.0x4了,高分辨率是极其吃亏的。YDJSIR虽然是4K60的屏幕,但按比例到1080也不是不能用,对吧。27寸1080P,属实是有点太大果粒了。跑一下3DMark的PCIE速度测试,这下笑拉了。一会儿40GB/s一会儿6GB/s,两个卡之间速度差异太大,鬼畜抖动极其厉害,屏幕帧率也是忽高忽低,基本没法用。

不过到了VR,这个问题倒是得到了极好的解决。YDJSIR拿来推Quest1毫无压力。毕竟VR的时候就M40后台嗯算就行,完全不需要考虑K620的感受。这下赢麻了。

image-20230306235106743

炼丹方面?就那样,B站测了那么多了,YDJSIR并不想测试。12G版本和24G也就容量区别,就这点还是比市面上绝大多数游戏卡适用性广。慢,但又不是不能用。YDJSIR暂时还没试过跑12G都跑不下的模型。这下感知不强徒增功耗了。不过随着SD的发展,大概24G也会成为必需品吧。

那么K620的性能如何呢?谁关心K620啊。K620再菜那也是按着UHD全家桶乱杀。UHD770都干不过他,有什么好说的。

image-20230306233826298

YDJSIR十分后悔当时没有远见不敢买P40.关掉CSM,纯UEFI+GPT,Above 4G Encoding满足就行,但YDJSIR被这个主板搞PTSD了不敢入,气抖冷。现在该想办法出了M40 12G收P40了。

后来在zyt的主板和那个YDJSIR乱改一通的机箱的结合下,PCIE槽被刮坏了。送人吧,希望能点亮。

Nvidia CMP 50HX (微星涡轮卡,显存10G)

除非你就跑整数运算和双精度浮点,不然不要碰50HX!!!

YDJSIR为了抢首发,竟然花了700买这破玩意,属于是亏到家了。2022年11月5日,50HX价格基本在550包邮左右,主要是影驰和微星的卡。YDJSIR买的是微星的版本,因为它太美丽啦!这是微星2080Ti的皮,放着就好看。

image-20221105193733507 image-20221105193810244 image-20221105193837492

PCB板子都是一样的,不过只有焊盘没有锡。

image-20221105194135009

P106吧吧主放出了526版本的对全系列矿卡的支持。不过,50HX改了也是废物。下面是两张GPU-Z图。50HX不能和40HX那样补电容就能补齐PCIE x16通道,而只能到x8通道。据称是缺了电阻。但在其极弱的单精度浮点面前,补不补电容又有什么区别呢?

正常驱动 魔改驱动
image-20221105194247112 image-20221105194227794

让我们来看看它惨不忍睹的单精度浮点性能。

image-20221105194403326

单精度浮点和双精度浮点一模一样。与此同时,这个卡静置功耗68W,视频编解码引擎永远是满的,有人推测是因为用视频编码引擎消耗掉单精度浮点,感觉有一定合理性。400G的单精度浮点是什么概念?看看下面的GT720和GT730的数字。这么屑的单精度浮点,魔改起来有什么价值呢?

GT720 GT730
image-20221105194830077 image-20221105194946179

这卡静置功耗就很大,风扇噪声跑CUDA(下面提的都是画图)实际上也就120W,还能忍受,室温18℃左右。当然,跑起整数运算直接涡轮发动机可以起飞了。YDJSIR平时设备管理器给他禁掉,需要的时候再跑。

这玩意直接装CUDA 11.8就行。CUDA安装包里可以把驱动一起带上去的。Geforce Experience就算了,在这个场景下没有任何用处。

image-20221105195255462

image-20221105200716053

Stable Diffusion跑起来有一说一还是有点价值的,速度和1650S差不多。最关键的是这玩意显存够大,可以直出大图,可以开更大的Batch。YDJSIR玩得不亦乐乎。当然,YDJSIR也就图一乐罢了。毕竟魔法咏唱也是要学的。

来几张图作为Example。很显然,也可以用超分工具处理一下。

image-20221105201508185

image-20221105233128900

image-20221105201910624

总感觉这玩意的细节还是很离谱,大体方向倒是挺对的。反而画人不看手的话,真心感觉挺好的。

目前也只能是生成小图放在角落或者压低分辨率当配角,感觉还是担当不起主力。

这玩意的带宽和单精度太拉,速度上不去,得很有耐心或者放着一直跑。也算是平添些乐趣了。

YDJSIR当然也拿XPS的1650跑过。那个更慢,更没意思,不提了。

Nvidia P106-090 (索泰单风扇,显存3G)

这还是上一轮低谷时入的卡了。那个时候,P106-100还要500+,而P106-90已经只值98了。

经过本次实践,YDJSIR得出以下结论:

  1. 电源走背线是极为优雅的;
  2. M2 NVME走PCIE的硬盘有可能让自检不过;
  3. 你的VGA连接线可能是坏的(大悲);
  4. P106-90实在有点寒酸……没有核显的平台还是不建议入;
  5. 一个半白教一个纯白装机是很痛苦的
  6. 不是完全亲历亲为的事情最好不要做……(观念差异与异地解决问题的困难)

下面的配置单按照YDJSIR的意思有修改,并不是实际装机版本!

用途:长期稳定挂载的家用Server+轻度游戏(偏向RTS和MC)+深度学习与媒体渲染

下面报价是2020年暑期左右的数据。

总价 备注
¥2500以内 许多项目并未包括在预算内
项目 详情 报价
电源 大厂二手700W双卡电源(长城鑫谷优先,最好模组化) ¥150 闲鱼市价
机箱 EATX机箱 ¥ 150 淘宝
主板 华南金牌X79烈焰战神 ¥900 https://item.taobao.com/item.htm?spm=a1z0d.6639537.1997196601.4.7e837484udjxXm&id=572872304531 华南金牌企业店
CPU E5 2650 v2 包含在上面
CPU风扇 寒冰A600 包含在上面
内存条 三星 RECC DDR3 8G 1600MHz ¥85×4=¥340 https://item.taobao.com/item.htm?spm=a230r.1.14.33.10c35840pXRMQb&id=620944956523&ns=1&abbucket=20#detail
亮机卡 大厂1050 2G ¥360 闲鱼市价
CUDA算力卡 橙色较新的P106-90 ¥100 闲鱼市价
无线网卡+Wifi(7) Intel 3600AC-PCIE:蓝牙网卡一体化 ¥48 https://item.taobao.com/item.htm?spm=a1z0d.6639537.1997196601.299.19f1748404uYSG&id=576911360843 YDJSIR推荐商家!
SSD SM961-256G-MLC ¥319 https://item.taobao.com/item.htm?spm=a1z0d.6639537.1997196601.4.64f07484NSjV0d&id=569659895912
显示器 不在预算内考虑 ¥0
键盘鼠标 不在预算内考虑 ¥0
HDD 随机数量,最多2个 ¥120
装X用贴纸 NY时尚阵线 ¥4 CPU、显卡与系统等
机箱风扇 炫光风扇12cm ¥10 x 3 个人建议是确认散热状况后再补装风扇

image-20200725233911443

image-20200725234223457

内存 固态
image-20200725233734119 image-20200725234349152

实测渲染成绩和1050Ti差不多,它的主人后来搞了个正经1050Ti亮机。考虑到卡也不贵,就这样算了。

AMD

YDJSIR买的AMD卡,无论二手的还是全新的,都只是亮机卡,没什么魔改不魔改的。

等以后AMD计算卡强大起来了,也许YDJSIR也会买一块回来玩玩的。