【发布时间】:2020-11-19 10:37:00
【问题描述】:
我指的是以下链接在 Sagemaker Script Mode 方法中使用 Tensorboard。
https://www.tensorflow.org/tensorboard/get_started
下面是我的训练脚本中的张量板回调,它是一个 .py 文件
model = create_model()
model.compile(optimizer='adam',
loss='sparse_categorical_crossentropy',
metrics=['accuracy'])
log_dir = "logs/fit/" + datetime.datetime.now().strftime("%Y%m%d-%H%M%S")
tensorboard_callback = tf.keras.callbacks.TensorBoard(log_dir=log_dir, histogram_freq=1)
model.fit(x=x_train,
y=y_train,
epochs=5,
validation_data=(x_test, y_test),
callbacks=[tensorboard_callback])
在笔记本中,我正在创建下面的 Tensorflow Estimator,我将上面的脚本文件名作为 entry_point 传递。
estimator = TensorFlow(
entry_point='Script_File.py',
train_instance_type=train_instance_type,
train_instance_count=1,
model_dir=model_dir,
hyperparameters=hyperparameters,
role=sagemaker.get_execution_role(),
base_job_name='tf-fashion-mnist',
framework_version='1.12.0',
py_version='py3',
output_path=<S3 Path>,
script_mode=True,
)
我正在笔记本中使用以下代码开始训练。
estimator.fit(inputs)
训练完成后,我将在终端中使用以下代码(也已在我的笔记本单元格中尝试过)来启动张量板。
tensorboard --logdir logs/fit
但在张量板上我无法查看任何图表。它显示消息“无法获取运行”。 有什么我想念的吗?还是我必须在脚本中进行任何额外设置才能在 Tensorboard 中查看我的日志?
【问题讨论】:
标签: amazon-web-services amazon-s3 tensorflow2.0 tensorboard amazon-sagemaker