Tensorflow开始重新培训:创建瓶颈文件

时间:2016-09-05 09:01:18

标签: amazon-web-services amazon-ec2 tensorflow deep-learning bazel

我正在关注the tutorial重新训练适应我自己问题的初始模型。 我在大约100个文件夹/类别中有大约5万张图像。

运行此

bazel build tensorflow/examples/image_retraining:retrain

bazel-bin/tensorflow/examples/image_retraining/retrain --image_dir /path/to/root_folder_name

在Amazon EC2 g2.2xlarge上我希望整个过程非常快(比我的笔记本电脑更快),但瓶颈文件的创建需要很长时间。 假设已经有2个小时,只创建了800个文件,我需要超过5天(!!)来创建文件......

因为GPU,它应该比这个节奏更快(创建约400个瓶颈文件/小时)吗?

我怎样才能让这个过程更快?

1 个答案:

答案 0 :(得分:1)

终于找到了我的问题的答案。

Bazel在没有GPU支持的情况下工作。为了解决这个问题,我修改了有关这些问题的文件:

然后跑

TF_UNOFFICIAL_SETTING=1 ./configure

bazel build -c opt --config=cuda tensorflow/examples/image_retraining:retrain --verbose_failures

bazel-bin/tensorflow/examples/image_retraining/retrain --image_dir ~/Images/

在一天结束时,这个过程要快得多(500张图像/秒),训练本身也是用GPU完成的!

相关问题