1、watch -n 0.1 nvidia-smi

Pwr:Usage/Cap(48w/250w)表示显卡功率;中间那一栏,表示显存的已占用/总共的大小;Perf表示性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能(未工作时为P0);FAN表示风扇转速;persistence-M:持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少;Disp.A:display active,表示GPU的显示是否初始化;volatile GPU-util:浮动的GPU利用率; compute M:计算模式。

监控GPU使用情况;提升GPU利用率;Pytorch解决cuda out of memory

 

2、cuda out of memory

在网络中,存在一个generator和3个discriminator,loss是四者的和,在训练generator时,将discriminator的计算放在with torch.no_grad():语句下;同样,在训练discriminator时,将generator的计算放在with torch.no_grad()语句下。避免多余的反向传播

 

相关文章:

  • 2021-10-07
  • 2022-12-23
  • 2021-10-24
  • 2021-06-15
  • 2021-06-14
  • 2021-12-29
  • 2021-09-24
  • 2022-01-01
猜你喜欢
  • 2022-12-23
  • 2022-01-04
  • 2021-12-24
  • 2022-12-23
  • 2022-01-29
  • 2021-06-09
相关资源
相似解决方案