リソースファイル
Pythonトランスフォーメーションでは、リソースファイルとPythonコードを使用して、トランスフォーメーション機能を定義します。トレーニング済みモデルを使用する場合は、そのトレーニング済みモデルをリソースファイルとしてPythonトランスフォーメーションで指定します。
Pythonトランスフォーメーションには次のコンポーネントがあります。
- リソースファイル
Pythonコードでアクセスするリソースが含まれるファイル。
このファイルは、データ統合の外部で大規模なデータセットに対してトレーニングしたトレーニング済みモデルにすることができます。トレーニング済みモデルを使用してデータを分類したり、Pythonトランスフォーメーションに渡すデータに基づいて予測を作成したりすることができます。トレーニング済みモデルにはPythonコードからアクセスします。
- ランタイム環境
ランタイム環境のタイプに基づいてリソースファイルを追加します。Pythonコードでリソースファイルを参照する場合は、リソースファイルを同じディレクトリに追加します。一貫性を維持するため、python_resourcesという名前の専用フォルダにリソースファイルを保存できます。
次のガイドラインを考慮します。
- - Secure Agentマシンが予期せず停止してエージェントが別のマシンで再起動した場合は、新しいマシンの同じディレクトリにPythonインストールおよびリソースファイルを追加する必要があります。
- - Secure AgentマシンでPythonインストールまたはリソースファイルを更新した場合は、次に詳細モードでジョブを実行したときにファイルが有効になります。
- - 長時間実行するジョブの失敗を防ぐために、Secure Agentマシン上のファイルはジョブの実行中に5回以上更新しないようにしてください。
- サーバーレスランタイム環境
補足ファイルの場所にリソースファイルを追加します。
Pythonインストールファイルまたはリソースファイルを更新した場合、変更を有効にするにはサーバーレスランタイム環境を再デプロイする必要があります。
補足ファイルの場所の詳細については、「Administrator」のヘルプにある「Administrator」を参照してください。
- Pythonコード
- Pythonトランスフォーメーションが、トランスフォーメーションに渡すデータを処理するために使用するPythonコード。Pythonコードを記述するときは、入力変数を再構築するか、トレーニング済みのモデルをロードするか、出力変数を定義します。