bjobs LSF ジョブの情報を表示します 形式 bjobs [-a] [-A] [-g] [-R] [-w | -l] [-J job_name] [-m host_name | -m host_group | -m cluster_name] [-N host_name | -N host_model | -N CPU_factor] [-P project_name] [-q queue_name] [-u user_name | -u user_group | -u all] job_ID ... bjobs [-d] [-p] [-r] [-s] [-A] [-g] [-R] [-w | -l] [-J job_name] [-m host_name | -m host_group | -m cluster_name] [-N host_name | -N host_model | -N CPU_factor] [-P project_name] [ -q queue_name] [-u user_name | -u user_group | -u all] job_ID ... bjobs [-h | -V] 機能説明 ジョブの情報を表示します。 デフォルトでは、自分の保留ジョブ、実行ジョブ、および中断ジョ ブの情報を表示します。 古い履歴情報を表示するには、bhist を使用します。 オプション -a lsb.params の CLEAN_PERIOD で指定した時間 (デフォルトは 1 時 間) 内で、すべての状態のジョブ (完成ジョブも含む) の情報を表 示します。 -A ジョブ配列の要約した情報を表示します。ジョブ配列 ID を 持 つ ジョ ブ配列を指定し、-A も指定した場合には、ジョブ配列 ID を 持つインデックスリストを組み込まないでください。 必要ならば、-w を使用して全部の配列指定を表示できます。 -d lsb.params の CLEAN_PERIOD で指定した時間 (デフォルトは 1 時 間) 内で、最近完成したジョブの情報を表示します。 -g ジョブグループの情報を表示します。 -p 保留ジョブを表示するだけでなく、前回のディスパッチ時に各ジョ ブがディスパッチされなかった保留理由も表示します。保留理由で は、その理由が該当するホストの数が表示され、-l も指定した 場 合にはホスト名も表示されます。 各保留理由には 1 つまたは複数のホストが関連付けられ、これ ら のホストがジョブを実行するよう割り当てられなかった理由が示さ れます。ジョブが (bsub -m を使用して) 特定のホストを要求した 場合には、ユーザは、要求されたホストに関連付けられた理由と一 緒に関係のないホストも表示されることがあります。保留理由のラ イ フ サイクルは、新しいディスパッチ順が始まった後で終わりま す。表示される理由は、現在の負荷状況を反映しないことがありま す。なぜなら、これは lsb.params の MBD_SLEEP_TIME で指定され た間隔と同じだけ存続することがあるためです。 ジョブ配列のジョブスロット制限に到達すると (bsub -J "jobArray[indexList]%job_slot_limit")、次のメッセー ジが表示されます。 The job array has reached its job slot limit. -r 実行中のジョブを表示します。 -R ジョブグループツリー内のジョブを再帰的に表示します。 -s 中断ジョブと各ジョブの中断の理由を表示します。 中断の理由は、ジョブが中断されている間に変化することもありま す。たとえば、ページング率が原因となってジョブが中断されるこ とがありますが、ページング率が低下した後で、別の負荷インデッ クスによってジョブの再開が妨げられることもあります。中断の理 由は、負荷インデックスに基づいて更新されます。これらの 理 由 は、 lsb.params の SBD_SLEEP_TIME によって指定された時間間隔 と同じくらい古いことがあります。したがって、表示された理由は 現在の負荷状況を反映しないこともあります。 -w ワイドフォーマット。フィールドを切り捨てずに、ジョブの情報を 表示します。 -l ロングフォーマット。各ジョブの詳細情報を複数行フォーマットで 表示します。 -l オプションを指定すれば、次の補足情報が表示されます。プ ロ ジェクト名、ジョブコマンド、投入ホスト上の現在の作業ディレク トリ、保留と中断の理由、ジョブ状態、リソース使用率、リソース 制限、ジョブグループ情報。 該当する場合のジョブ配列ジョブ制限 (%job_limit) も含 め て、 ジョ ブ 配列の詳細情報を表示するには、bjobs -A -l を使用しま す。 job_ID 指定したジョブまたはジョブ配列の情報を表示します。 -A を使用する場合には、インデックスリストなしでジョブ配列 ID を指定します。 -J job_name 指定したジョブまたはジョブ配列の情報を表示します。 -m host_name | -m host_group | 指定したホストにディスパッチされたジョブ、または指定したクラ スタ内の全ホストにディスパッチされたジョブだけを表示します。 使用可能なホストとホストグループを決定するに は、 bhosts と bmgroup を 使 用 します。使用可能なクラスタを決定するには、 bclusters を使用します。 -N host_name | -N host_model | ジョブによって消費された正規化 CPU 時間を表示します。正規 化 に は、指定した CPU 係数を使用するか、指定したホストまたはホ ストモデルの CPU 係数を使用します。 -P project_name 指定したプロジェクトに属するジョブだけを表示します。 -q queue_name 指定したキュー内のジョブだけを表示します。 コマンド bqueues は、システムで設定されたキューのリスト、 お よびこれらのキューの設定情報を返します。 -u user_name | -u user_group | 指定したユーザによって投入されたジョブだけを表示します。キー ワード all は、すべてのユーザを指定します。 -h コマンドの使用法を標準エラー出力に出力して終了します。 -V LSF のリリースバージョンを標準エラー出力に出力して終了 し ま す。 出力 保留ジョブは、ディスパッチされる順に表示されます。高優先順位 キュー内のジョブは、低優先順位キュー内のジョブより前に表示さ れます。同じ優先順位キュー内の保留ジョブは、投入された順に表 示されます。しかし、この順序は、コマンド btop または bbot を 使用して変更することができます。ホストに複数のジョブがディス パッチされた場合には、そのホスト上のジョブは、キューの優先順 位とディスパッチ時間によってこのホスト上でスケジューリングさ れる順にリストされます。完成したジョブは、完了した順に表示さ れます。 デフォルト表示 ジョブの一覧は次のフィールドで表示されます。 JOBID LSF がジョブに割り当てたジョブ ID。 USER ジョブを投入したユーザ。 STAT ジョブの現在の状態 (下の JOB STATUS を参照)。 QUEUE ジョブが属するジョブキューの名前。ジョブが属するキューが設定 から削除されていた場合には、そのキュー名は lost_and_found と して表示されます。元のキュー名を取得するには、bhist を使用し ま す。lost_and_found キュー内のジョブは、bswitch コマンドに よって別のキューに交換されるまでは、保留の状態を保ちます。 FROM_HOST ジョブが投入されたホストの名前。そのホストがリモートクラスタ 内 にある場合には、クラスタ名が、host_name@cluster_name とい うフォーマットで、ホスト名に追加されます。 EXEC_HOST ジョブが実行されている 1 つまたは複数のホストの名前 (ジョ ブ が ディ スパッチされていない場合には、このフィールドは空です )。ホストがリモートクラスタ内にある場合には、クラスタ名 が、 host_name@cluster_name というフォーマットで、ホスト名に追加 されます。ジョブの実行されているホストが設定から削除されてい た 場 合には、そのホスト名は lost_and_found として表示されま す。元のホスト名を取得するには、bhist を使用します。 JOB_NAME ユーザによって割り当てられたジョブ名、またはデフォルトで割り 当てられた command 文字列 (bsub(1) を参照)。ジョブ名が長すぎ てこのフィールドに収まらない場合には、ジョブ名の後部だけが表 示されます。 SUBMIT_TIME ジョブの投入時間。 -l output -l オプションを指定した場合には、出力されるロングフォー マッ トリストに次の追加フィールドが含まれます。 Project ジョブの投入元であるプロジェクト。 Command ジョブコマンド。 CWD 投入ホスト上の現在の作業ディレクトリ。 PENDING REASONS ジョブが PEND または PSUSP 状態にある理由。-p と -l の両方の オプションを指定すると、各理由に関連付けられたホストの名前が 表示されます。 SUSPENDING REASONS ジョブが USUSP または SSUSP 状態にある理由。 loadSched ジョブの負荷スケジューリングしきい値。 loadStop ジョブの負荷中断しきい値。 JOB STATUS ジョブの状態には次の値があります。 PEND ジョブは保留中です。つまり、このジョブはまだ起動されていませ ん。 PSUSP ジョブは、保留中に、その所有者または LSF 管理者によって中 断 されました。 RUN ジョブは、現在実行中です。 USUSP ジョブは、実行中に、その所有者または LSF 管理者によって中 断 されました。 SSUSP ジョブは LSF によって中断されました。ジョブは、次のいずれ か の原因のため、LSF によって中断されました。 1) 実行ホスト上の負荷条件が、ホストまたはキューに対して定 義 された loadStop ベクトルに基づくしきい値を超えました。 2) ジョブのキューの実行ウィンドウがクローズされています。 bqueues(1)、bhosts(1)、および lsb.queues(5) を参照してくださ い。 DONE ジョブは、状態 0 で終了しました。 EXIT ジョブは、0 以外の状態で終了しました。実行時のエラーによって 異 常終了したか、その所有者または LSF 管理者によって中止され た可能性があります。 UNKWN MBD は、ジョブが実行されているホスト上の SBD との連絡を失 い ました。 ZOMBI 次の場合には、ジョブは ZOMBI になります。 - 実行ホスト上の SBD が到達不能であり、実行可能なジョブが bkill によって中止され、UNKWN と表示されます。 - 再実行可能なジョブの動作しているホストが使用不 能 で あ り、 ジョ ブが新しいジョブとして投入されたかのように、ジョブ は、新しいジョブ ID を使用して LSF によってキューに再登録 さ れました。 実行ホストが使用可能になった後、LSF は ZOMBI ジョブの中止 を 試みます。ZOMBI ジョブが正しく終了したら、そのジョブの状態は EXIT に変更されます。 LSF MultiCluster 環境では、リモート実行クラスタ上で動作中 の ジョ ブが ZOMBI ジョブになると、実行クラスタは、そのジョブを ローカル ZOMBI ジョブと同じ方法で処理します。さらに、実行 ク ラ スタは、ジョブが ZOMBI 状態にあることを投入クラスタに通知 し、投入クラスタはジョブをキューに再登録します。 RESOURCE USAGE 実行クラスタで MultiCluster リソース使用更新が設定されている 場合を除いて、この情報は、ローカルクラスタ内のジョブに対して だけ表示されます。現在、ジョブでは次のような値が使用されてい ます。 CPU 時間 ジョブ内の全プロセスの累積合計 CPU 時間 (秒単位)。 MEM ジョブ内の全プロセスの合計常駐メモリ使用量 (MB 単位)。 SWAP ジョブ内の全プロセスの合計仮想メモリ使用量 (MB 単位)。 PGID ジョブ内で現在アクティブ状態のプロセスグループ ID。 PID ジョブ内で現在アクティブ状態のプロセス。 RESOURCE LIMITS キュー内のジョブに加 え ら れ る ハー ド の リ ソー ス 制 限 (getrlimit(2) と lsb.queues(5) を参照)。これらの制限は、ジョ ブおよびプロセスごとに加えられます。 ジョブごとに可能な制限は次のとおりです。 CPULIMIT PROCLIMIT MEMLIMIT SWAPLIMIT PROCESSLIMIT UNIX のプロセスごとのリソース制限は次のとおりです。 RUNLIMIT FILELIMIT DATALIMIT STACKLIMIT CORELIMIT キューに投入されたジョブが、これらの指定された制限を持ってい る 場合には (bsub(1) を参照)、対応するジョブ制限かキュー制限 の低い方がジョブに使用されます。 リソース制限が指定されない場合には、リソースは無制限であると みなされます。 ジョブグループ情報 ジョブグループの場合には、親ジョブグループと次のフィールドが 表示されます。 GROUP ジョブグループ名。 STAT ジョブグループ状態。ジョブグループ状態としては、次の値があり ます。 HOLD ジョブグループは、親または祖先のジョブグループ、あるい は グ ループ所有者または LSF 管理者によって、保留状態にあります。 ACTIVE ジョブグループはアクティブ状態です。 INACTIVE ジョブグループは非アクティブ状態です。 OWNER ジョブグループ所有者。 NJOBS ジョブグループ内のジョブの合計数。 PEND、DONE、RUN、EXIT、SSUSP、USUSP、PSUSP それぞれ、PEND、DONE、RUN、EXIT、SUSUP、USUSP、および PSUSP 状態のグループのジョブ数。 ジョブ配列要約情報 -A を指定した場合には、ジョブ配列の要約情報を表示します。 次 のフィールドが表示されます。 JOBID ジョブ配列のジョブ ID ARRAY_SPEC name[index] フォーマットによる配列指定。配列指定は切り捨てら れ ることがあります。全部の配列指定を表示するには、-A と一緒 に -w オプションを使用します。 OWNER ジョブ配列の所有者。 NJOBS ジョブ配列内のジョブの数。 PEND ジョブ配列の保留ジョブの数。 RUN ジョブ配列の実行中ジョブの数。 DONE ジョブ配列の正しく完了したジョブの数。 EXIT ジョブ配列の正しく完了しなかったジョブの数。 SSUSP ジョブ配列の LSF システム中断ジョブの数。 USUSP ジョブ配列のユーザ中断ジョブの数。 PSUSP ジョブ配列の保留ジョブの数。 使用例 % bjobs -pl 起動者のすべての保留ジョブに関する詳細情報を表示します。 % bjobs -ps 保留ジョブと中断ジョブだけを表示します。 % bjobs -u all -a すべてのユーザとそのすべてのジョブを表示します。 % bjobs -d -q short -m apple -u john john がキューshort に投入し、ホスト apple で実行された、最近 完成したすべてのジョブを表示します。 % bjobs 101 102 203 509 job_ID 101、102、203、および 509 のジョブを表示します。 関連項目 bsub(1), bkill(1), bhosts(1), bmgroup(1), bclusters(1), bqueues(1) bhist(1), bresume(1), bdel(1), bstop(1), lsb.params(5), mbatchd(8)
平日9:30~17:30 (土曜日、日曜日、祝祭日、年末年始、夏期休暇は、休日とさせていただきます。)