NKP の Kubernetes クラスタに、Nutanix Enterprise AI(NAI)2.6 を展開してみます。今回は、NAI にライセンス キーを追加してみます。
前回はこちら。
今回の内容です。

ライセンス追加前の状態
NAI をインストールすると、2日間はライセンス キーを追加しなくても利用可能です。しかし、2日を経過すると、エンドポイントが起動不可になり、起動されていたエンドポイントは自動的にハイバネートされます。

起動していたエンドポイントは、ハイバネートされて「休止状態」になります。

CPU で起動していたエンドポイントを再開しようとすると、下記のように「vCPU license not added」といったエラーになります。

GPU エンドポイントを再開しようとすると、下記のように「GPU GB license not added」といったエラーになります。

1. NAI ライセンス キーの入手
NAI UI で Kubernetes クラスタの ID を確認してから、Nutanix Support & Insights Portal でライセンス キーを発行します。
1-1. Kubernetes クラスター ID の確認
NAI の「設定」→「ライセンス管理」タブを開き、「ライセンスを追加」をクリックします。

「Kubernetes クラスター ID」が表示されるので、記録しておきます。ちなみに、この ID は「kubectl get namespace -n kube-system」コマンドでも確認できます。

1-2. ライセンス キーの入手
Support & Insights Portal Portal から Licenses 画面(License Summary ページ)にアクセスします。
そして、「Manage License」→「Manage NAI/NKP License」からライセンス キーを発行します。

ライセンス キーの発行には、下記の情報が必要です。
- NAI Cluster Name(NAI を展開する NKP クラスタ名。今回なら nkpnai)
- NAI Cluster UUID(さきほど確認した Kubernetes クラスター ID)
- ライセンス キーに割り当てるリソース(GPU ライセンスなら GB、CPU ライセンスなら vCPU 数)
2. NAI ライセンスの追加
あらためて、NAI の「設定」→「ライセンス管理」タブを開き、「ライセンスを追加」をクリックします。

ライセンス キーを入力して、「追加」をクリックします。今回は、GPU ライセンス(GPU GB ライセンス)を追加しています。

これで、NAI にライセンス キーが追加されました。この時点ではエンドポイント(の GPU Pod)が起動されていないので、まだ「GPU GB ライセンス消費量」は「0 GB」になっています。

3. ライセンス消費の様子(GPU GB ライセンス)
ライセンス キーを追加することで、エンドポイントを起動 / 再開できるようになります。そして、エンドポイントを起動すると、GPU のメモリ容量によってライセンスが消費されます。ちなみに、GPU GB ライセンスがあれば、CPU のエンドポイントも起動可能になります。
今回は、ハイバネートで一時停止されている GPU エンドポイントを再開してみます。
「ローカル エンドポイント」画面で停止されているエンドポイントを選択して、「アクション」→「再開」をクリックします。

確認画面が表示されるので、「再開」をクリックします。

エンドポイントが起動され、「アクティブ」になりました。

この環境の Kubernetes GPU ノードで利用している GPU は NVIDIA A16 で、16GB(AHV の認識では 15 GiB)のメモリが搭載されています。そして、エンドポイントの推論エンジンとして GPU Pod が起動されるので、「アクセラレーター メモリー合計」も 15 GiB になりました。
ちなみに、A16 は NAI のサポート対象外ですが、たまたまラボにあったので利用しています。

エンドポイントの起動により、「GPU GB ライセンス消費量」も、「15 GB」になりました。

つづく。(かもしれない)
