例: トレーニング済みモデルの運用可能化

あなたは製薬会社に勤めていて、心疾患の治療を改善できるよう、ジギタリスの花成に関するデータを調査しています。一般的なジギタリスDigitalis purpureaとケジギタリスDigitalis lanataのどちらが良好な予後になるのかを見つけようとしています。

研究を実施するには、花のガクと花弁の長さと幅に関するデータを花の種別に分類する必要があります。データを分類するため、データ統合の外部でトレーニング済みモデルを開発しました。

トレーニング済みモデルを運用化するには、次のタスクを完了します。

1パッシブPythonトランスフォーメーションを含むマッピングを作成し、トレーニング済みモデルをリソースファイルとしてリストします。

2トレーニング済みモデルにアクセスするPythonスクリプトを記述します。

3花のガクと花弁に関するデータをPythonトランスフォーメーションに渡して、ジギタリスの種別にデータを分類します。

次の表に、Pythonトランスフォーメーションに渡すことができるガクと花弁のサンプルデータを示します。

名前	タイプ	精度
sepal_length	decimal	10
sepal_width	decimal	10
petal_length	decimal	10
petal_width	decimal	10
true_class	string	50

パッシブPythonトランスフォーメーションでは次のコンポーネントを使用します。

リソースファイル

トレーニング済みモデルのパスをリソースファイルとして指定します。

例えば、次のパスのファイルfoxgloveDataMLmodel.pklに保存されたトレーニング済みモデルを使用します。

- Secure Agentマシン上の場所を基準にしたパス。

例えば、リソースファイルが<Secure Agentインストールディレクトリ>/ext/python/folder1/foxgloveDataMLmodel.pklにある場合、相対パスは/folder1/foxgloveDataMLmodel.pklになります。

- サーバーレスランタイム環境の補足ファイルの場所。

/data/home/dtmqa/data/foxgloveDataMLmodel.pkl

Pythonコード

［Pre-Partition Pythonコード］および［メインPythonコード］セクションでPythonコードを指定します。

［Pre-Partition Pythonコード］セクションを使用してライブラリをインポートし、リソースファイルをロードし、変数を初期化します。

例えば、次のコードを［Pre-Partition Pythonコード］セクションに入力します。

from sklearn import svm
from sklearn.externals import joblib
import numpy as np
clf = joblib.load(resourceFileArrays[0])
classes = ['common', 'woolly']

［メインPythonコード］セクションを使用して、Pythonトランスフォーメーションがトレーニング済みモデルを使用して各データ行を評価する方法を定義します。

例えば、次のコードを［メインPythonコード］セクションに入力します。

input = [sepal_length, sepal_width, petal_length, petal_width]
input = np.array(input).reshape(1,-1)
pred = clf.predict(input)
predicted_class = classes[pred[0]]
sepal_length_out = sepal_length
sepal_width_out = sepal_width
petal_length_out = petal_length
petal_width_out = petal_width
true_class_out = true_class