トランスフォーメーション > Pythonトランスフォーメーション > 例: トレーニング済みモデルの運用可能化
  

例: トレーニング済みモデルの運用可能化

あなたは製薬会社に勤めていて、心疾患の治療を改善できるよう、ジギタリスの花成に関するデータを調査しています。一般的なジギタリスDigitalis purpureaとケジギタリスDigitalis lanataのどちらが良好な予後になるのかを見つけようとしています。
研究を実施するには、花のガクと花弁の長さと幅に関するデータを花の種別に分類する必要があります。データを分類するため、データ統合の外部でトレーニング済みモデルを開発しました。
トレーニング済みモデルを運用化するには、次のタスクを完了します。
  1. 1パッシブPythonトランスフォーメーションを含むマッピングを作成し、トレーニング済みモデルをリソースファイルとしてリストします。
  2. 2トレーニング済みモデルにアクセスするPythonスクリプトを記述します。
  3. 3花のガクと花弁に関するデータをPythonトランスフォーメーションに渡して、ジギタリスの種別にデータを分類します。
次の表に、Pythonトランスフォーメーションに渡すことができるガクと花弁のサンプルデータを示します。
名前
タイプ
精度
sepal_length
decimal
10
sepal_width
decimal
10
petal_length
decimal
10
petal_width
decimal
10
true_class
string
50
パッシブPythonトランスフォーメーションでは次のコンポーネントを使用します。
リソースファイル
トレーニング済みモデルのパスをリソースファイルとして指定します。
例えば、次のパスのファイルfoxgloveDataMLmodel.pklに保存されたトレーニング済みモデルを使用します。
/data/home/dtmqa/data/foxgloveDataMLmodel.pkl
Pythonコード
[Pre-Partition Pythonコード]および[メインPythonコード]セクションでPythonコードを指定します。
[Pre-Partition Pythonコード]セクションを使用してライブラリをインポートし、リソースファイルをロードし、変数を初期化します。
例えば、次のコードを[Pre-Partition Pythonコード]セクションに入力します。
from sklearn import svm
from sklearn.externals import joblib
import numpy as np
clf = joblib.load(resourceFileArrays[0])
classes = ['common', 'woolly']
[メインPythonコード]セクションを使用して、Pythonトランスフォーメーションがトレーニング済みモデルを使用して各データ行を評価する方法を定義します。
例えば、次のコードを[メインPythonコード]セクションに入力します。
input = [sepal_length, sepal_width, petal_length, petal_width]
input = np.array(input).reshape(1,-1)
pred = clf.predict(input)
predicted_class = classes[pred[0]]
sepal_length_out = sepal_length
sepal_width_out = sepal_width
petal_length_out = petal_length
petal_width_out = petal_width
true_class_out = true_class