LSFコマンドマニュアル

bjobs


bjobs
     LSF ジョブの情報を表示します

形式
     bjobs [-a] [-A] [-g]  [-R]  [-w  |  -l]  [-J  job_name]  [-m
     host_name | -m host_group | -m cluster_name] [-N host_name |
     -N host_model | -N CPU_factor] [-P project_name]

     [-q queue_name] [-u user_name |  -u  user_group  |  -u  all]
     job_ID ...

     bjobs [-d] [-p] [-r] [-s] [-A]  [-g]  [-R]  [-w  |  -l]  [-J
     job_name]  [-m  host_name | -m host_group | -m cluster_name]
     [-N  host_name  |  -N  host_model  |  -N   CPU_factor]   [-P
     project_name] [

     -q queue_name] [-u user_name  |  -u  user_group  |  -u  all]
     job_ID ...

     bjobs [-h | -V]

機能説明
     ジョブの情報を表示します。

     デフォルトでは、自分の保留ジョブ、実行ジョブ、および中断ジョ
     ブの情報を表示します。

     古い履歴情報を表示するには、bhist を使用します。

オプション

     -a

     lsb.params の CLEAN_PERIOD で指定した時間 (デフォルトは 1 時
     間) 内で、すべての状態のジョブ (完成ジョブも含む) の情報を表
     示します。


     -A

     ジョブ配列の要約した情報を表示します。ジョブ配列 ID を 持 つ
     ジョ ブ配列を指定し、-A も指定した場合には、ジョブ配列 ID を
     持つインデックスリストを組み込まないでください。

     必要ならば、-w を使用して全部の配列指定を表示できます。


     -d

     lsb.params の CLEAN_PERIOD で指定した時間 (デフォルトは 1 時
     間) 内で、最近完成したジョブの情報を表示します。


     -g

     ジョブグループの情報を表示します。


     -p

     保留ジョブを表示するだけでなく、前回のディスパッチ時に各ジョ
     ブがディスパッチされなかった保留理由も表示します。保留理由で
     は、その理由が該当するホストの数が表示され、-l も指定した 場
     合にはホスト名も表示されます。

     各保留理由には 1 つまたは複数のホストが関連付けられ、これ ら
     のホストがジョブを実行するよう割り当てられなかった理由が示さ
     れます。ジョブが (bsub -m を使用して) 特定のホストを要求した
     場合には、ユーザは、要求されたホストに関連付けられた理由と一
     緒に関係のないホストも表示されることがあります。保留理由のラ
     イ フ サイクルは、新しいディスパッチ順が始まった後で終わりま
     す。表示される理由は、現在の負荷状況を反映しないことがありま
     す。なぜなら、これは lsb.params の MBD_SLEEP_TIME で指定され
     た間隔と同じだけ存続することがあるためです。

     ジョブ配列のジョブスロット制限に到達すると

     (bsub -J "jobArray[indexList]%job_slot_limit")、次のメッセー
     ジが表示されます。

     The job array has reached its job slot limit.


     -r

     実行中のジョブを表示します。


     -R

     ジョブグループツリー内のジョブを再帰的に表示します。


     -s

     中断ジョブと各ジョブの中断の理由を表示します。

     中断の理由は、ジョブが中断されている間に変化することもありま
     す。たとえば、ページング率が原因となってジョブが中断されるこ
     とがありますが、ページング率が低下した後で、別の負荷インデッ
     クスによってジョブの再開が妨げられることもあります。中断の理
     由は、負荷インデックスに基づいて更新されます。これらの 理 由
     は、 lsb.params の SBD_SLEEP_TIME によって指定された時間間隔
     と同じくらい古いことがあります。したがって、表示された理由は
     現在の負荷状況を反映しないこともあります。


     -w

     ワイドフォーマット。フィールドを切り捨てずに、ジョブの情報を
     表示します。


     -l

     ロングフォーマット。各ジョブの詳細情報を複数行フォーマットで
     表示します。

     -l オプションを指定すれば、次の補足情報が表示されます。プ ロ
     ジェクト名、ジョブコマンド、投入ホスト上の現在の作業ディレク
     トリ、保留と中断の理由、ジョブ状態、リソース使用率、リソース
     制限、ジョブグループ情報。

     該当する場合のジョブ配列ジョブ制限 (%job_limit) も含 め て、
     ジョ ブ 配列の詳細情報を表示するには、bjobs -A -l を使用しま
     す。


     job_ID

     指定したジョブまたはジョブ配列の情報を表示します。

     -A を使用する場合には、インデックスリストなしでジョブ配列 ID
     を指定します。


     -J job_name

     指定したジョブまたはジョブ配列の情報を表示します。


     -m host_name | -m host_group |

     指定したホストにディスパッチされたジョブ、または指定したクラ
     スタ内の全ホストにディスパッチされたジョブだけを表示します。

     使用可能なホストとホストグループを決定するに は、 bhosts  と
     bmgroup  を 使 用 します。使用可能なクラスタを決定するには、
     bclusters を使用します。


     -N host_name | -N host_model |

     ジョブによって消費された正規化 CPU 時間を表示します。正規 化
     に は、指定した CPU 係数を使用するか、指定したホストまたはホ
     ストモデルの CPU 係数を使用します。

     -P project_name

     指定したプロジェクトに属するジョブだけを表示します。


     -q queue_name

     指定したキュー内のジョブだけを表示します。

     コマンド bqueues は、システムで設定されたキューのリスト、 お
     よびこれらのキューの設定情報を返します。


     -u user_name | -u user_group |

     指定したユーザによって投入されたジョブだけを表示します。キー
     ワード all は、すべてのユーザを指定します。


     -h

     コマンドの使用法を標準エラー出力に出力して終了します。


     -V

     LSF のリリースバージョンを標準エラー出力に出力して終了 し ま
     す。

出力
     保留ジョブは、ディスパッチされる順に表示されます。高優先順位
     キュー内のジョブは、低優先順位キュー内のジョブより前に表示さ
     れます。同じ優先順位キュー内の保留ジョブは、投入された順に表
     示されます。しかし、この順序は、コマンド btop または bbot を
     使用して変更することができます。ホストに複数のジョブがディス
     パッチされた場合には、そのホスト上のジョブは、キューの優先順
     位とディスパッチ時間によってこのホスト上でスケジューリングさ
     れる順にリストされます。完成したジョブは、完了した順に表示さ
     れます。

  デフォルト表示
     ジョブの一覧は次のフィールドで表示されます。


     JOBID

     LSF がジョブに割り当てたジョブ ID。


     USER

     ジョブを投入したユーザ。


     STAT

     ジョブの現在の状態 (下の JOB STATUS を参照)。


     QUEUE

     ジョブが属するジョブキューの名前。ジョブが属するキューが設定
     から削除されていた場合には、そのキュー名は lost_and_found と
     して表示されます。元のキュー名を取得するには、bhist を使用し
     ま す。lost_and_found キュー内のジョブは、bswitch コマンドに
     よって別のキューに交換されるまでは、保留の状態を保ちます。


     FROM_HOST

     ジョブが投入されたホストの名前。そのホストがリモートクラスタ
     内 にある場合には、クラスタ名が、host_name@cluster_name とい
     うフォーマットで、ホスト名に追加されます。


     EXEC_HOST

     ジョブが実行されている 1 つまたは複数のホストの名前 (ジョ ブ
     が ディ スパッチされていない場合には、このフィールドは空です
     )。ホストがリモートクラスタ内にある場合には、クラスタ名 が、
     host_name@cluster_name  というフォーマットで、ホスト名に追加
     されます。ジョブの実行されているホストが設定から削除されてい
     た 場 合には、そのホスト名は lost_and_found として表示されま
     す。元のホスト名を取得するには、bhist を使用します。


     JOB_NAME

     ユーザによって割り当てられたジョブ名、またはデフォルトで割り
     当てられた command 文字列 (bsub(1) を参照)。ジョブ名が長すぎ
     てこのフィールドに収まらない場合には、ジョブ名の後部だけが表
     示されます。


     SUBMIT_TIME

     ジョブの投入時間。

  -l output
     -l オプションを指定した場合には、出力されるロングフォー マッ
     トリストに次の追加フィールドが含まれます。



     Project

     ジョブの投入元であるプロジェクト。


     Command

     ジョブコマンド。


     CWD

     投入ホスト上の現在の作業ディレクトリ。


     PENDING REASONS

     ジョブが PEND または PSUSP 状態にある理由。-p と -l の両方の
     オプションを指定すると、各理由に関連付けられたホストの名前が
     表示されます。


     SUSPENDING REASONS

     ジョブが USUSP または SSUSP 状態にある理由。

          loadSched

     ジョブの負荷スケジューリングしきい値。

          loadStop

     ジョブの負荷中断しきい値。


     JOB STATUS

     ジョブの状態には次の値があります。

          PEND

     ジョブは保留中です。つまり、このジョブはまだ起動されていませ
     ん。

          PSUSP

     ジョブは、保留中に、その所有者または LSF 管理者によって中 断
     されました。

          RUN

     ジョブは、現在実行中です。

          USUSP

     ジョブは、実行中に、その所有者または LSF 管理者によって中 断
     されました。

          SSUSP

     ジョブは LSF によって中断されました。ジョブは、次のいずれ か
     の原因のため、LSF によって中断されました。

     1) 実行ホスト上の負荷条件が、ホストまたはキューに対して定 義
     された loadStop ベクトルに基づくしきい値を超えました。

     2) ジョブのキューの実行ウィンドウがクローズされています。

     bqueues(1)bhosts(1)、および lsb.queues(5) を参照してくださ
     い。

          DONE

     ジョブは、状態 0 で終了しました。

          EXIT

     ジョブは、0 以外の状態で終了しました。実行時のエラーによって
     異 常終了したか、その所有者または LSF 管理者によって中止され
     た可能性があります。

          UNKWN

     MBD は、ジョブが実行されているホスト上の SBD との連絡を失 い
     ました。

          ZOMBI

     次の場合には、ジョブは ZOMBI になります。

     -    実行ホスト上の SBD が到達不能であり、実行可能なジョブが
     bkill によって中止され、UNKWN と表示されます。

     -    再実行可能なジョブの動作しているホストが使用不 能 で あ
     り、 ジョ ブが新しいジョブとして投入されたかのように、ジョブ
     は、新しいジョブ ID を使用して LSF によってキューに再登録 さ
     れました。

     実行ホストが使用可能になった後、LSF は ZOMBI ジョブの中止 を
     試みます。ZOMBI ジョブが正しく終了したら、そのジョブの状態は
     EXIT に変更されます。


     LSF MultiCluster 環境では、リモート実行クラスタ上で動作中 の
     ジョ ブが ZOMBI ジョブになると、実行クラスタは、そのジョブを
     ローカル ZOMBI ジョブと同じ方法で処理します。さらに、実行 ク
     ラ スタは、ジョブが ZOMBI 状態にあることを投入クラスタに通知
     し、投入クラスタはジョブをキューに再登録します。


     RESOURCE USAGE

     実行クラスタで MultiCluster リソース使用更新が設定されている
     場合を除いて、この情報は、ローカルクラスタ内のジョブに対して
     だけ表示されます。現在、ジョブでは次のような値が使用されてい
     ます。

          CPU 時間

     ジョブ内の全プロセスの累積合計 CPU 時間 (秒単位)。

          MEM

     ジョブ内の全プロセスの合計常駐メモリ使用量 (MB 単位)。

          SWAP

     ジョブ内の全プロセスの合計仮想メモリ使用量 (MB 単位)。

          PGID

     ジョブ内で現在アクティブ状態のプロセスグループ ID。

          PID

     ジョブ内で現在アクティブ状態のプロセス。


     RESOURCE LIMITS

     キュー内のジョブに加 え ら れ る ハー ド の リ ソー ス 制 限
     (getrlimit(2)lsb.queues(5) を参照)。これらの制限は、ジョ
     ブおよびプロセスごとに加えられます。

     ジョブごとに可能な制限は次のとおりです。

     CPULIMIT

     PROCLIMIT

     MEMLIMIT

     SWAPLIMIT


     PROCESSLIMIT

     UNIX のプロセスごとのリソース制限は次のとおりです。

     RUNLIMIT

     FILELIMIT

     DATALIMIT

     STACKLIMIT

     CORELIMIT

     キューに投入されたジョブが、これらの指定された制限を持ってい
     る 場合には (bsub(1) を参照)、対応するジョブ制限かキュー制限
     の低い方がジョブに使用されます。

     リソース制限が指定されない場合には、リソースは無制限であると
     みなされます。

  ジョブグループ情報
     ジョブグループの場合には、親ジョブグループと次のフィールドが
     表示されます。


     GROUP

     ジョブグループ名。


     STAT

     ジョブグループ状態。ジョブグループ状態としては、次の値があり
     ます。

          HOLD

     ジョブグループは、親または祖先のジョブグループ、あるい は グ
     ループ所有者または LSF 管理者によって、保留状態にあります。

          ACTIVE

     ジョブグループはアクティブ状態です。

          INACTIVE

     ジョブグループは非アクティブ状態です。


     OWNER

     ジョブグループ所有者。


     NJOBS

     ジョブグループ内のジョブの合計数。

     PEND、DONE、RUN、EXIT、SSUSP、USUSP、PSUSP

     それぞれ、PEND、DONE、RUN、EXIT、SUSUP、USUSP、および  PSUSP
     状態のグループのジョブ数。

  ジョブ配列要約情報
     -A を指定した場合には、ジョブ配列の要約情報を表示します。 次
     のフィールドが表示されます。


     JOBID

     ジョブ配列のジョブ ID


     ARRAY_SPEC

     name[index] フォーマットによる配列指定。配列指定は切り捨てら
     れ ることがあります。全部の配列指定を表示するには、-A と一緒
     に -w オプションを使用します。


     OWNER

     ジョブ配列の所有者。


     NJOBS

     ジョブ配列内のジョブの数。


     PEND

     ジョブ配列の保留ジョブの数。


     RUN

     ジョブ配列の実行中ジョブの数。


     DONE


     ジョブ配列の正しく完了したジョブの数。


     EXIT

     ジョブ配列の正しく完了しなかったジョブの数。


     SSUSP

     ジョブ配列の LSF システム中断ジョブの数。


     USUSP

     ジョブ配列のユーザ中断ジョブの数。


     PSUSP

     ジョブ配列の保留ジョブの数。

使用例
     % bjobs -pl

     起動者のすべての保留ジョブに関する詳細情報を表示します。

     % bjobs -ps

     保留ジョブと中断ジョブだけを表示します。

     % bjobs -u all -a

     すべてのユーザとそのすべてのジョブを表示します。

     % bjobs -d -q short -m apple -u john

     john がキューshort に投入し、ホスト apple で実行された、最近
     完成したすべてのジョブを表示します。

     % bjobs 101 102 203 509

     job_ID 101、102、203、および 509 のジョブを表示します。

関連項目
     bsub(1),  bkill(1),  bhosts(1),  bmgroup(1),   bclusters(1),
     bqueues(1)    bhist(1),   bresume(1),   bdel(1),   bstop(1),
     lsb.params(5), mbatchd(8)
Contact

お問い合わせ

お客様に最適な製品をご提案いたします。まずは気軽にお問い合わせ下さい。
03-5446-5531

平日9:30~17:30 (土曜日、日曜日、祝祭日、年末年始、夏期休暇は、休日とさせていただきます。)