amazon-web-services - Tensorflow开始重新培训：创建瓶颈文件

时间：2016-09-05 09:01:18

标签： amazon-web-services amazon-ec2 tensorflow deep-learning bazel

我正在关注the tutorial重新训练适应我自己问题的初始模型。我在大约100个文件夹/类别中有大约5万张图像。

运行此

bazel build tensorflow/examples/image_retraining:retrain

bazel-bin/tensorflow/examples/image_retraining/retrain --image_dir /path/to/root_folder_name

在Amazon EC2 g2.2xlarge上我希望整个过程非常快（比我的笔记本电脑更快），但瓶颈文件的创建需要很长时间。假设已经有2个小时，只创建了800个文件，我需要超过5天（!!）来创建文件......

因为GPU，它应该比这个节奏更快（创建约400个瓶颈文件/小时）吗？

我怎样才能让这个过程更快？

答案 0 :(得分：1)

终于找到了我的问题的答案。

Bazel在没有GPU支持的情况下工作。为了解决这个问题，我修改了有关这些问题的文件：

然后跑

TF_UNOFFICIAL_SETTING=1 ./configure

bazel build -c opt --config=cuda tensorflow/examples/image_retraining:retrain --verbose_failures

bazel-bin/tensorflow/examples/image_retraining/retrain --image_dir ~/Images/

在一天结束时，这个过程要快得多（500张图像/秒），训练本身也是用GPU完成的！