DRBD調査事項
- 共有ディスクの使用
あえて共有ディスクを使用するのであれば、heartbeatだけで十分。DRBDは不要
- リソースの移動
heartbeatが勝手にhttpdを再起動してしまう
←on-fail="restart" となっているため
crmコマンドを用いたPacemakaer のリソース設定方法 « Linux-HA Japan
op start interval="0s" timeout="90s" \ ← リソースの起動時のタイムアウト値の設定 op monitor interval="3s" timeout="20s" \ ← リソースの監視間隔と、タイムアウト値の設定 op stop interval="0s" timeout="100s" ← リソースの停止時のタイムアウト
SUSE Linux Enterprise High Availability Extension
meta migration-threshold="1" failure-timeout="60s"
P18
resource-failure-stickiness クラスタオプションは、migration-threshold クラスタオプションに替わりました。P44
リソースに障害が発生すると、自動的に再起動されます。現在のノードで再起動できない場合、または現在のノードでN回失敗した場合は、別なノードへのフェールオーバーを試みます。新しいノードへのマイグレートを行う基準(migration-threshold)となるリソースの失敗数を定義できます。P45
たとえば、リソース「r1」の場所の制約を設定し、このリソースを「node1」で優先的に実行するように指定したと仮定します。そのノードで実行できなかった場合は、「migration-threshold」を確認して失敗回数と比較します。失敗回数 >= マイグレーションしきい値の場合は、リソースは次の優先実
行先として指定されているノードにマイグレートされます。
デフォルトでは、しきい値に達すると、管理者がリソースの失敗回数を手動でリセットするまで(失敗原因を修正してから)、実行できなかったリソースをそのノードで実行することはできません。
ただし、リソースの失敗タイムアウトオプションを設定することで、失敗回数を失効させることができます。したがって、「migration-threshold=2」と「failure-timeout=60s」を設定すると、2回の失敗の後に新しいノードにマイグレートし、1分後に復帰させられる可能性があります(固着性と制約スコアによる)。P206
migration-threshold
ノードがこのリソースをホストできなくなるまで、このリソースについてノード上で発生する失敗の回数。デフォルト: noneP207
on-fail
ignore リソースが失敗しなかったのように動作します block リソースにこれ以上の操作を実行しません stop リソースを停止して、他の場所でも開始しません restart リソースを停止して再起動します(別のノード上で) fence リソースが失敗したノードを停止します(STONITH) stanby リソースが失敗したノードからすべてのリソースを移動させます
- DRBDのレプリケーションタイミング
書き込む度。リアルタイムレプリケーションであり、ファイルシステムとディスクドライバの中間に位置するDRBDが、書き込み要求があるたびにローカルディスクとピアノードへ書き込み要求を出す。