配置环境 OR 训练时 各种奇奇怪怪的报错/bug 集中串

2019年11月3日 0 作者 折纸

这几天真的好痛苦啊,各种诡异的环境问题,训练时各种bug冒出来…从结果来看,等于这几天的努力或者所谓的“工作量”都是白费了。我太难了。
把手头上的事搞定以后一定要抽时间开始打kaggle比赛,从入门到放弃

这篇文章用来记录各种报错/bug解决办法。

11/27

事太多了,搞定完开始打比赛是不存在的..

tensorflow.python.framework.errors_impl.InternalError: cudaGetDevice() failed. Status: CUDA driver version is insufficient for CUDA runtime version

这个报错是说CUDNN、CUDAtoolkit版本和CUDA驱动版本不一致
解决方案

nvidia-smi

file
然后安装对应版本的cudatoolkit即可
conda install cudatoolkit==xx.xx.xx
file