我们在谷歌云顶点AI中使用顶点AI训练作业和Kubeflow管道。
在训练作业中,我们通过python sdk将参数和指标记录到顶点AI实验。
顶点AI管道可以跟踪从Kubeflow管道到实验的指标吗?或者失败了,是否可以通过sdk手动获取管道运行id并使用此id进行日志记录?顶点AI管道中的实验跟踪还有其他方法吗?
启动管道的方法有很多,如果使用以下方法很容易获得作业id(资源名称):
导入google.cloud. aiPlatform作为aip
display_name=f"{COMPONENT_NAME}-管道",template_path=jobspec_filenameenable_caching=False,#pipeline_root=pipeline_root_path,parameter_values={project_id:'p1'})
job.run()打印(作业)
上面将打印类似的内容:
我没有尝试过,但我认为您可以使用PipelineService列出或获取以前的管道执行。有一些方法,如ListTrainingPipelinesRequest和ListTrainingPipelinesResponse可能很有用
顶点AI管道可以跟踪从Kubeflow管道到实验的指标吗?
可以。请参阅此文档中链接的笔记本示例:https://cloud.google.com/vertex-ai/docs/experiments/user-journey/uj-compare-pipeline-runs