機械学習の開発を円滑に進めるためにMLOps の取り組みは重要です。今日はよく使われているMLOps のFramework であるKubeflow とKubeflow に基づいたCloud Service AI Platform を皆さんへ紹介させていただきます。
※なお、この記事中の図示は、特に断りが無い限り筆者が作成したものです。
MLOpsとは
MLOPSは分析(ML)+開発(Dev)+リリース(Operations)の組み合わせです。 機械学習の開発効率を向上させる為に、機械学習project の開発原則とルールが纏められています。MLOpsのレベル
MLOps の自動化はその程度により3 つのレベルがあります。 詳細については【Google Cloud「MLOps: 機械学習における継続的デリバリーと自動化のパイプライン」(リンク:https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning?hl=ja)】をご覧ください。MLOpsによく使われているツール
レベル 2 のMLOps を構築するためにはツールが必要です。ここではよく使われているMLOps のツールの一つを皆さんへ紹介させていただきますKubeflow
Kubeflow はKubernetes に基づいて発展したMLOps のワークロードを管理するためのオープンソースツール群です。元々はGoogle が社内でTensorFlow の開発にMLOps を管理するために使用したものです。好評を得てオープンソースにしました。