newzmat
newzmatユーティリティは主に分子指定について様々な標準フォーマット間でコンバートするために作られています。また,その他にも多くの機能があり,例えばGaussianチェックポイントファイルから分子指定だけを取り出したりすることもできます。以下ではnewzmatの機能全貌について説明します:
- newzmatでは,種々のデータファイルフォーマット間で分子指定をコンバートできます。他のプログラムで作成されたファイルからZ-matrixを(つまりGaussian用の入力を)生成したり,異なるプログラムのファイルフォーマット間で分子指定をコンバートすることもできます。newzmatでは多くのよく使われているグラフィック・メカニックプログラム(Gaussianのグラフィカルインプットフロントエンドとして使えるようなプログラム)のデータファイルからGaussianインプットファイルを作成するのに用いることもできます。結果として得られるファイルは(可能であれば)効率よく計算するために適切な対称性が適用されます。
- newzmatでは,他のデータファイルからGaussian 03 チェックポイントファイルを生成したり,(こちらのほうが重要)チェックポイントからデータファイルを生成することが可能です。この機能は可視化プログラムで表示を行うためにデータを抽出するために用います。
- newzmatでは,構造最適化の(あるいはその途中の)チェックポイントファイルから中間構造を再利用したり,表示するために取り出すことも可能です。
コマンド構文
newzmatは一般的に次の構文をとります:
newzmat option(s) input-file output-file
ここで option(s) は(1個以上の)オプションで,行う操作を指定します。 input-file はコンバートする(あるいは取り出そうとする)構造が入っているファイルであり,output-fileは新しい分子指定(またはGaussianインプット)が出力されるファイルです。それぞれのファイル名の部分をハイフンにすることで,標準入力・標準出力を指定することもできます。
アウトプットファイル名が省略された場合,アウトプットファイルのベース名はインプットファイルと同じものに,拡張子はそのファイルタイプで慣習的に使われているものになります。一般的には,ファイル指定の際拡張子は省略しておいて,自動的に拡張子変換が行われるようにしておきます。デフォルトの拡張子は以下の表の通りです。
| 拡張子 | 説明 | オプション形式 |
| .bgf | Biograf 中間データファイル | bgf |
| .cac | CaChe 分子ファイル | cache |
| .chk | Gaussian 03 チェックポイントファイル | chk |
| .com | Gaussian インプットファイル(Z-matrix形式) | zmat |
| .com | Gaussian インプットファイル(カーティシャン座標形式) | cart |
| .con | QUIPUシステムデータファイル | con |
| .dat | Model/XModel/MM2データファイル | model |
| .dat | MacroModelデータファイル(フォーマット式・非フォーマット式) | mmodel, ummodel |
| .ent | Brookhavenデータファイル(PDBと同じ) | ent |
| .com | 結晶構造用分率座標(Fractional coords)(厳密に 3 trans. ops.が必要) | fract |
| .inp | MOPACインプットファイル | mopac |
| .pdb | Protein Data Bank 形式(Brookhavenと同じ) | pdb |
| .ppp | ある種のPPPプログラム(出力のみ) | ppp |
| .xyz | Unadornedカーティシャン座標 | xyz |
| .zin | 古いバージョンのZINDO | zindo |
インプット・アウトプットオプション
インプットまたはアウトプットの分子指定形式を指定するには,それぞれオプション -i または-o を用います。これらのオプションのすぐ後に,指定する分子指定フォーマットを,表中の対応するオプション形式で示します(間にスペースはいれません)。例えば,-ipdbとすると,インプットの分子指定にはPDB形式を指定したことになり,さらに拡張子が指定されなかった場合には拡張子.pdbがインプットファイル名に補完されます。同様に,-oxyzとすると,アウトプットにカーティシャン座標形式を用いることになり,アウトプットファイルのデフォルトの拡張子は.xyzになります。インプットおよびアウトプットオプションのデフォルトは,それぞれ-izmat, -ozmatです。ここで,-izmat と-icartは同じことであることに注意してください。このどちらかが指定されても,Gaussianインプットファイルとして読まれ,その分子指定形式はZ-matrix, カーティシャン,およびそれらの混合(内部およびカーティシャン)座標のどれでもかまいません。
インプット・アウトプット関連のその他オプション
newzmatで,インプットを指定する際に以下のオプションが指定できます:
-step N
Gaussian 03チェックポイントファイル中N番目のステップの構造最適化データの構造を用います(-ichk インプットオプションを用いているときのみ)。このオプションはredundant内部座標(デフォルトの座標系)による最適化では利用できません。その代わりにルートセクションでGeom=(Check,Step=N)として,続けてジョブを計算することにより,チェックポイントファイルから構造を取り出します。
-ubohr
インプットファイル中の距離の単位がBohrになります(デフォルトはオングストローム)。-urad
インプットファイル中の角度の単位がラジアンになります(デフォルトは度)。アウトプットを指定する際に以下のオプションが指定できます:
-mof1
MacroModel形式1を用います(-ommodel指定時のみ有効)。-mof2
MacroModel形式2を用います(-ommodel指定時のデフォルト)。-optprompt
最適化を行うパラメータに関する入力が求められます。これは,構造最適化を行おうとしている場合で,しかも-ozmatを指定している(または他にオプションが指定されていない)場合に使われます。デフォルトでは,対称性で固定されるもの以外の全てパラメータが最適化されます。-prompt
ルートセクションおよびタイトルセクション行と電荷・多重度に関する入力が求められます。これは,-ozmatを指定している(または他にオプションが指定されていない)場合に使われます。newzmatにより生成されるデフォルトのGaussianインプットファイルは,HF/6-31G(d) シングルポイント(1点)計算になります。例
次のコマンドでは, PDBファイルwater.pdbから分子指定を読み込み,Gaussianインプットファイル(Z-matrix形式)h2o.comとして書き出されます。
$ newzmat -ipdb water h2o -ozmatはデフォルトなので,省略可能 Charge and multiplicity [0,1]? デフォルト値でよい場合にはそのままリターンを押すPDBファイルからはZ-matrixの電荷および多重度が決められないので,別途入力が求められます。
次のコマンドでは, Gaussian 03 チェックポイントファイルG98-11234.chkから分子指定を読み込み,PDBファイルpropell.pdbに書き出します。
$ newzmat -ichk -opdb G98-11234 propell
次のコマンドでは,チェックポイントファイル newopt.chk から最適化における5番目のステップの構造を読み込み,MOPACファイル step5.inpに書き出します。
$ newzmat -ichk -omopac -step 5 newopt step5
次のコマンドでは,チェックポイントファイル mystery.chk 中の構造を読み込み,それを画面上にGaussianインプットファイル形式で表示します(コマンドがインタラクティブ(対話形式)で実行されることを仮定しています)。
$ newzmat -ichk mystery.chk -
次のコマンドでは, チェックポイントファイルquick.chk を書き出しますが,その際インプットにはユーザーがインタラクティブにGaussianインプットファイルをタイプして与えます。
$ newzmat -ochk - quick # anything 0 1 O H 1 1.0 H 1 1.0 2 120. 入力ファイルの終わりには空行 ^Dインプットファイルの終わりには空行が必要であることに注意してください。
次のコマンドでは,MOPACファイル newsalt.inpから分子指定を読み込み,対応するZ-martrix形式でGaussianインプットファイルnewsalt.comに書き出します。その際,この分子に対するルートセクション・タイトルセクション行と電荷・スピン多重度に関する入力が求められます。
$ newzmat -imopac -prompt newsalt Percent or Route card? # B3LYP/6-31G(d,p) Opt Route card? ルートセクションの終わりには空行 Titles? Optimization of caffeine at B3LYP/6-31G** Titles? タイトルセクションの終わりには空行 Charge and Multiplicity? 0,1アウトプット形式の選択
標準でサポートされていない可視化ソフトにデータをコンバートする場合には,まずPDBファイルを試してみてください。PDB形式は結合性情報が含まれており,広くサポートされているからです。ソフトウェアによっては,PDB形式の拡張子には .pdbでなく, .entを用いる必要があるかもしれません。.pdbを用いるときは -ient または -oent オプションを,.entを用いるときは-ipdb または-opdb オプションを選んでください。他によく使われる形式にはMopacファイル形式があります。
その他のnewzmatオプション
その他newzmatのオプションには,結合性情報の生成や,標準的な構造パラメータの利用,分子対称性の利用に関するものがあります。完全結合性テーブルを用いることにより,対称性が適用できるようなZ-martix構造を生成します。また,そのようなテーブルは分子力学(MM)プログラムのデータファイルを出力するために必要となります。インプット形式に完全結合性情報が含まれているようなもの(例えば,MacroModelデータファイル)を用いる場合,その結合性情報が使われます。
しかし, インプットがZ-matrixやMOPAC形式の場合,その内部座標による結合性情報しか利用できません。したがって,分子対称性が課されたZ-matrixを生成する場合,残りの結合性情報を生成する必要があります。カーティシャン座標で読み込まれた場合,当然ですが結合性情報は入っていません。よってデフォルトで,内部に保存されている原子半径を用いて結合性テーブルを作成します。さらに,インプット構造を生成するために用いたときには,分子力学プログラムでは適切な結合距離を生成することができず,ある程度対称的にはなっているが厳密に保たれていないような構造が生成されるときがあります。このようなケースに対処するには,オプションを指定してやる必要があります。
-allbonded
新しい結合性情報を生成する際,全ての原子が結合しているものとして扱います。-bmodel
結合距離を決めるのに,標準モデルB結合長の組み込み値を用います。-density N
密度行列番号Nに対する自然軌道を生成します。このオプションはCaCheファイルを生成する場合にのみ有用です。Nは,HFでは0,MP2では2,CIでは6,QCISDまたはCCDでは7とします。-fudge
内部値を用いるときに,結合距離がいいかげんであっても妥当であるとします。 これはモデルインプットのときにははデフォルトであり,その他のときには使えません。-gencon
内部半径を用いて結合性情報を生成します。-getfile
全ての引数がファイル名を指定したこととなり,標準入力・出力は受け付けないようになります。-lsymm
対称性を判断するのに緩い閾値を用います。このオプションは-symavも指定したことになります。-mdensity M
-densityで指定した電子密度と一般化電子密度Mとの差分電子密度を生成し,それを自然軌道に変換します。-nofudge
いいかげんな(fudge)結合距離を用いません。これはデフォルトであり,モデルインプットを除く全てのケースではこれしか選択できません。-nogetfile
-getfileを無効にします。-noround
Z-matrixパラメータの丸めを無効にします。-nosymav
インプット座標の平均化を無効にします。-nosymm
対称性を利用しなくなります。-order
原子の順番を可能な限り入力順のままになるようにします。-round
0.01 Å または1 度までZ-martixパラメータを丸めます。-symav
近似対称操作を行って入力構造を平均化し,厳密な対称性になるようにします。-symm
分子対称性をアサインします。-tsymm
対称性を判断するのに厳しい閾値を用います。このオプションはデフォルトです。-rebuildzmat
Z-marixを構築する際,読み込んだものを用いず,新たに構築します(Z-matrixかMOPACインプットではデフォルトになっているでしょう)。このオプションは-genconも同時に指定したことになります。また,このオプションは-redozと省略することもできます。newzmatに関する既知の問題
- 対称性平均化処理は, 与えられた座標だとおおよその対称性にしかならないとして,座標から対称性を推測しますが,常に意図した対称性になるとは限りません。Gaussianの出力ファイル中の座標は少数6桁で,その座標を使えば元の対称性が得られますが,分子力学(MM)による構造を用いてもMM最適化はかなり遠くで収束することになるでしょう。例えば,MacroModelで座標を生成した場合,通常の最小化の後,最後に完全Newton-Raphsonステップを行う必要があるかしれません。
- newzmatは最初に読み込んだ構造や,最終構造で核間反発エネルギーを計算し,一貫性が保たれているかどうかをチェックします。もしこのチェックが満たされていないようであれば,警告メッセージが出力されます。この不一致が大きい場合,プログラムが失敗していることを示しています。