4 Parallella Cluster

Parallellaでクラスタリング その3 演算ノードの追加

昨年末のクリスマス特価$99 @Amazon.comで買い足したParallella Desktopを演算ノードとしてクラスタに追加しました。作業そのものは既存のノードと同じく

  1. 本家サイトを参考にセットアップ
  2. 日本語化
  3. マスター演算ノードの公開鍵を登録
  4. NFSクライアント設定

だけで追加できます。さっそく動かしてみましょう。

$ cd ~/parallella/test
$ mpirun -host parallella01,parallella02,parallella03,parallella04 ./main.elf
Host key verification failed.
--------------------------------------------------------------------------
ORTE was unable to reliably start one or more daemons.
This usually is caused by:

* not finding the required libraries and/or binaries on
 one or more nodes. Please check your PATH and LD_LIBRARY_PATH
 settings, or configure OMPI with --enable-orterun-prefix-by-default

* lack of authority to execute on one or more specified nodes.
 Please verify your allocation and authorities.

* the inability to write startup files into /tmp (--tmpdir/orte_tmpdir_base).
 Please check with your sys admin to determine the correct location to use.

* compilation of the orted with dynamic libraries when static are required
 (e.g., on Cray). Please check your configure cmd line and consider using
 one of the contrib/platform definitions for your system type.

* an inability to create a connection back to mpirun due to a
 lack of common network interfaces and/or no route found between
 them. Please check network connectivity (including firewalls
 and network routing requirements).
--------------------------------------------------------------------------

あれ? エラーになりました。マスター演算ノードのparallella01から各ノードへはパスフレーズ入力なしで問題なくsshログインできます。何がまずいのでしょう?

少し調べてみたところ、OpenMPIのSSH実行はツリー構造になっており、スレーブ演算ノードから別のスレーブ演算ノードへもsshログインが行われるようです。つまり、parallella02,03,04の各スレーブ演算ノード間でもSSHログインができるようになっている必要があります。

ということで、各スレーブノードの公開鍵をそれぞれのスレーブノードにも登録することで、無事に4台のParallella Desktopでクラスタリングを組むことができました。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です