矿渣硅酸盐水泥(矿渣论坛),本文通过数据整理汇集了矿渣硅酸盐水泥(矿渣论坛)相关信息,下面一起看看。

最近开始摆弄TensorFlow。训练时感觉CPU运行时间太长。我手里只有a卡,先配置比较麻烦,所以想买个n卡来运行。看了K40,K80等计算卡,参考nvidia官网GPU Compute Capability,最终因为垃圾人的本性,在黄海捡到了一张矿卡P104-100(号称矿版1070,计算能力6.1)。矿卡本身是4G内存,在魔变里可以用Bios和8G内存刷卡。690元的价格可以接受。只有一千兆字节。

粉丝版3,结果是MSI的低电量卡,被JS坑了。我在困境中含泪接受了。外观显示

P104具体参数,

GPU-Z显示刷bios后显存确实是8G。据说这个P104也可以像P106一样操作来玩游戏。我用它运行机器学习的时候没有试过,但是这些矿卡是PCIe 1X。也许游戏带宽是个问题。附上显卡bios,有需要的朋友可以用一下:8wx6。刷bios要小心。

安装tensorflow-gpu环境。我用anaconda安装tensorflow-gpu,简单给你介绍一下步骤。

下载anaconda,并选中在安装期间将Anaconda添加到我的Path环境变量中。

打开cmd并输入以下命令:

一个create-n tensor flow pip python=3.7遇到y/n就选y。

输入:激活张量流

使用国内源代码,在pip安装中输入以下命令:

pip install-default-time out=100-ignore-installed-upgrade tensor flow-GPU==2 . 0 . 1-I

下载安装cuda 10.0和cudnn。解压缩cuDNN。将三个文件夹下的解压文件放入对应的CUDA文件夹中。安装cuda 10.1时有些文件需要重命名。

在“我的电脑-管理-高级设置-环境变量”中找到路径,添加以下环境变量(cuda使用默认安装路径):

c:程序文件NVIDIA GPU计算工具kitCUDAv10.0bin

c:程序文件NVIDIA GPU计算工具kitCUDAv10.0libnvvp

c:程序文件NVIDIA GPU计算工具kitCUDAv10.0lib

c:程序文件NVIDIA GPU计算工具kitcudav 10.0包括

验证安装结果

打开cmd并输入以下命令:

activatetensorflow

再次输入:

大蟒

再次输入:

importtensorflow

不会引发异常来证明安装成功。

性能测试因为我的机器没有核显,所以平时除了P104还要插另外一个显卡。于是又买了一个2070超级官网显示计算能力:7.5。既然买了,那就来看看这个有计算能力的矿卡p 104 PK:6.1!

2070超级参数

下面开始测试对比。

统一运行环境win10,cuda 10.0,tensorflow-gpu2.1,Anaconda3-2020.02-Windows,Python3.7.7

1.先运行tensorflow网站的“Hello World”。

2070超级

I tensor flow/core/common _ runtime/gpu/GPU _ device . cc:1304]createdtensor flow设备(/job:localhost/replica:0/task:0/device:GPU:0,6283内存)-物理GPU(设备:0,名称:GeForce RTX 2070 SUPER,pci busid: 0000:65:00.0,计算能力:7.5)

对60000个样本进行训练

纪元1/5

60000/60000[=============================]-7s 117 us/sample-损耗:0.2996 -精度:0.9123

纪元2/5

60000/60000[=============================]-6s 99us/sample-损耗:0.1448 -精度:0.9569

纪元3/5

60000/60000[=============================]-5s 85us/sample-损耗:0.1068 -精度:0.9682

纪元4/5

60000/60000[=============================]-6s 101 us/sample-损耗:0.0867 -精度:0.9727

纪元5/5

60000/60000[=============================]-6s 96us/sample-损耗:0.0731 -精度:0.9766

P104-100

I tensor flow/core/common _ runtime/gpu/GPU _ device . cc:1304]createdtensor flow设备(/job:localhost/replica:0/task:0/device:GPU:0,7482内存)-物理GPU(设备:0,名称:P104-100,pci总线id:0000:07:00.0,计算能力:6.1)

对60000个样本进行训练

纪元1/5

60000/60000[=============================]-4s 68us/sample-损耗:0.2957 -精度:0.9143

纪元2/5

60000/60000[============================]-3s 56us/sample-损耗:0.1445 -精度:0.9569

纪元3/5

60000/60000[============================]-3s 58us/sample-损耗:0.1087 -精度:0.9668

纪元4/5

60000/60000[=============================]-3s 57us/sample-损耗:0.0898 -精度:0.9720

纪元5/5

60000/60000[============================]-3s 58us/sample-损耗:0.0751 -精度:0.9764

P104运行时使用7482 MB内存,2070超级使用6283兆字节内存都是8G卡,可能2070超级需要同时负责显示画面,所以需保留些显存供使用。

对比测试一跑完我就哭了104页每个世用时3s 58,2070超级每个世用时几乎7s .P104比2070超级快了几乎2S。我的2070超级,白买了。我要去退掉。

2、接着跑克拉斯官方文档内的用于文本分类的1DCNN

文档显示,本相测试对照耗时

90年代/epochon英特尔i5 2.4Ghz CPU .特斯拉K40 GPU上10秒/纪元.

2070超级

纪元1/5

25000/25000[=============================]-10s 418美制/步损:0.4080 -精度:0.7949-val _ loss:0.3058-val _精度:0.8718

纪元2/5

25000/25000[=============================]-8s 338美制/步损:0.2318-精度:0.9061-val _ loss:0.2809-val _精度:0.8816

纪元3/5

25000/25000[============================]-9s 349美制/步损:0.1663 -精度:0.9359-val _ loss:0.2596-val _精度:0.8936

纪元4/5

25000/25000[============================]-9s 341美制/步损:0.1094 -精度:0.9607-瓦尔_损失:0.3009-瓦尔_精度:0.8897

纪元5/5

25000/25000[============================]-9s 341美制/步损:0.0752 -精度:0.9736-val _ loss:0.3365-val _精度:0.8871

P104-100

纪元1/5

25000/25000[=============================]-8s 338美制/步损:0.4059 -精度:0.7972-瓦尔_损失:0.2898-瓦尔_精度:0.8772

纪元2/5

25000/25000[============================]-7s 285美制/步损:0.2372 -精度:0.9038-val _ loss:0.2625-val _精度:0.8896

纪元3/5

25000/25000[=============================]-7s 286美制/步损:0.1665 -精度:0.9357-val _ loss:0.3274-val _精度:0.8701

纪元4/5

25000/25000[=============================]-7s 286美制/步损:0.1142 -精度:0.9591-val _ loss:0.3090-val _精度:0.8854

纪元5/5

25000/25000[=============================]-7s 286美制/步损:0.0728 -精度:0.9747-val _ loss:0.3560-val _精度:0.8843

还是矿卡P104最快,两卡都比特斯拉40快。

3、最后测试在MNIST数据集上训练辅助分类器甘(ACGAN).

网页显示运行每纪元耗时,硬件后端时间/时期

CPU TF小时

泰坦x(麦克斯韦)TF分钟

泰坦x(麦克斯韦)TH 7分钟

跑了5个时代测试结果如下:

2070超级

纪元1/5

600/600[=========================]-45s 75 ms/步

纪元一的测试:

组件|损耗|发电_损耗|辅助_损耗

-

发电机(火车)| 0.76| 0.4153 | 0.3464

发电机(测试)| 1.16| 1.0505 | 0.1067

鉴别器(火车)| 0.68| 0.2566 | 0.4189

鉴别器(测试)| 0.74| 0.5961 | 0.1414

纪元2/5

600/600[=========================]-37s 62 ms/步

纪元2的测试:

组件|损耗|发电_损耗|辅助_损耗

-

发电机(火车)| 1.05| 0.9965 | 0.0501

发电机(测试)| 0.73| 0.7147 | 0.0117

鉴别器(火车)| 0.85| 0.6851 | 0.1644

鉴别器(测试)| 0.75| 0.6933 | 0.0553

纪元3/5

600/600[=========================]-38s 64 ms/步

纪元3的测试:

组件|损耗|发电_损耗|辅助_损耗

-

发电机(火车)| 0.84| 0.8246 | 0.0174

发电机(测试)| 0.67| 0.6645 | 0.0030

鉴别器(火车)| 0.82| 0.7042 | 0.1158

鉴别器(测试)| 0.77| 0.7279 | 0.0374

纪元4/5

600/600[==========================]-38s 63 ms/步

纪元四的测试:

组件|损耗|发电_损耗|辅助_损耗

-

发电机(火车)| 0.81| 0.7989 | 0.0107

发电机(测试)| 0.66| 0.6604 | 0.0026

鉴别器(火车)| 0.80| 0.7068 | 0.0938

鉴别器(测试)| 0.74| 0.7047 | 0.0303

纪元5/5

600/600[==========================]-38s 64 ms/步

纪元5的测试:

组件|损耗|发电_损耗|辅助_损耗

-

发电机(火车)| 0.80| 0.7890 | 0.0083

发电机(测试)| 0.64| 0.6388 | 0.0021

鉴别器(火车)| 0.79| 0.7049 | 0.0807

鉴别器(测试)| 0.73| 0.7056 | 0.0266

P104-100

纪元1/5

600/600[=========================]-63s 105 ms/步

纪元一的测试:

组件|损耗|发电_损耗|辅助_损耗

-

发电机(火车)| 0.79| 0.4320 | 0.3590

发电机(测试)| 0.88| 0.8000 | 0.0802

鉴别器(火车)| 0.68| 0.2604 | 0.4182

鉴别器(测试)| 0.72| 0.5822 | 0.1380

纪元2/5

600/600[=========================]-59s 98ms/步

纪元2的测试:

组件|损耗|发电_损耗|辅助_损耗

-

发电机(火车)| 1.02| 0.9747 | 0.0450

发电机(测试)| 0.79| 0.7753 | 0.0165

鉴别器(火车)| 0.85| 0.6859 | 0.1629

鉴别器(测试)| 0.77| 0.7168 | 0.0576

纪元3/5

600/600[=========================]-59s 98ms/步

纪元3的测试:

组件|损耗|发电_损耗|辅助_损耗

-

发电机(火车)| 0.84| 0.8263 | 0.0170

发电机(测试)| 0.64| 0.6360 | 0.0042

鉴别器(火车)| 0.82| 0.7062 | 0.1157

鉴别器(测试)| 0.77| 0.7353 | 0.0384

纪元4/5

600/600[==========================]-58s 97 ms/步

纪元四的测试:

组件|损耗|发电_损耗|辅助_损耗

-

发电机(火车)| 0.82| 0.8036 | 0.0115

发电机(测试)| 0.69| 0.6850 | 0.0019

鉴别器(火车)| 0.80| 0.7054 | 0.0933

鉴别器(测试)| 0.75| 0.7165 | 0.0301

纪元5/5

600/600[==========================]-58s 97 ms/步

纪元5的测试:

组件|损耗|发电_损耗|辅助_损耗

-

发电机(火车)| 0.80| 0.7904 | 0.0087

发电机(测试)| 0.64| 0.6400 | 0.0028

鉴别器(火车)| 0.79| 0.7046 | 0.0806

鉴别器(测试)| 0.74| 0.7152 | 0.0272

这回2070超级终于耗时比P104-100少了。这张新卡暂时不用退了。

总结如果个人学习使用,矿卡P104-100魔改8G版本性价比不错,可以购买。

本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。

更多矿渣硅酸盐水泥(矿渣论坛)相关信息请关注本站,本文仅仅做为展示!