PostgreSQL 7.1.2 ドキュメント(日本語版 1.0)
Prev	Chapter 9. ログ先行書き込みプロトコルに基づくロギング: Write-Ahead Logging (WAL)	Next

9.3. WALの設定

データベースの性能に影響するようなWALに関連したパラメータがあります。この節では、その使い方を説明します。設定方法の詳細についてはSection 3.4を御覧下さい。

WALには2つの共通関数があります。 LogInsertとLogFlushです。 LogInsertは共有メモリ上の WALバッファに新しいレコードを挿入します。新しいレコードを挿入する余地がないときは、LogInsert は、満杯になったWALを書き込み(カーネルキャッシュに移動)しなければなりません。これは望ましいことではありません。なぜなら、データベースへの低レベルの変更(たとえばタプルの挿入)のたびに LogInsertが呼ばれ、そのような時には変更を受けたページに対して排他ロックがかっており、それ故このような操作は可能な限り高速に実行されると想定されているからです。さらに悪いことには、 WALに必要な新しいログセグメントも必要となるかも知れません。この場合、更に時間がかかります。通常、 WAL の書き込み、吐出しは LogFlush要求で実施されます。これは大抵の場合、トランザクションコミットの際に永続記憶にトランザクションレコードが吐出されることを保証するために行われます。ログ出力が大量に行われるシステムでは、LogInsertが WALバッファの書込を行うことを防ぐほどには LogFlush要求が頻繁に起らないかも知れません。そういうシステムでは、WAL_BUFFERS変数を変更して WALバッファの数を増やしてください。デフォルトの WALの数は8です。この数を増やすと共有メモリの使用量に影響があります。

チェックポイントは、一連のトランザクションにおいて、それ以前のすべてのデータがログされ、データファイルも更新されていることが保証されている時点を指します。チェックポイントでは、すべての変更されたページがディスクに吐出され、特別なチェックポイントレコードがログファイルに書き込まれます。その結果、クラッシュが発生した際に、ログの中でどのレコード(これはredoレコードと呼ばれています)から復旧処理がREDOログ操作を開始すべきかを知ることができます。なぜなら、redoレコード以前にデータファイルに対して行われた変更はすでにディスク上に記録済だからです。チェックポイントが実施された後、 redoレコード以前のログセグメントはすべて削除されます。そこで、チェックポイントを使ってWALディレクトリ以下のディスクスペースを開放することができます(WALを使った BARが実装されれば、ログセグメントを削除する代りに保存することができます)。チェックポイントでは、 LogInsertやLogFlushが新しくログセグメントを作るために時間を費やすことのないように、前もってログセグメントを作っておくこともできます。

WALログはsegmentsと呼ばれる16MBのファイルのセットに保持されています。デフォルトではセグメントの75%以上が使われた時にだけ新しいセグメントが作成されます。 WAL_FILES設定パラメータを調整することにより、64 個までのログセグメントを前もって作成することができます。

クラッシュ後の回復をより早くするためには、頻繁にチェックポイントを行うことです。ただし、変更されたページを吐出すコストとの兼ね合いでことを行う必要があります。また、チェックポイント後の最初のデータページの変更によりそのページ内容全体がログされます。したがって、ログする量が増えるので、ログファイルのサイズも大きくなってしまいます。

postmasterは次のチェックポイントを作成するために特別なバックエンドを頻繁に起動します。CHECKPOINT_SEGMENTSログセグメント数に達するか、またはCHECKPOINT_TIMEOUT秒が経過するか、どちらかの条件が満たされるとチェックポイントが作成されます。デフォルトの設定では、それぞれ3セグメントと300秒となっています。また、SQLコマンドのCHECKPOINTで強制的にチェックポイントを作成することもできます。

COMMIT_DELAYパラメータにより、 LogInsertがコミットレコードを書き込んでから LogFlushが行われるまでの間にバックエンドが何マイクロ秒sleepするかが決まります。この遅延があることにより、ほかのバックエンドがコミットレコードをログに書き込んだあと、それらすべてのログレコードを一度のfsyncで吐出すことができます。もし COMMIT_SIBLINGSよりも少ない数のバックエンドしか現在アクティブなトランザクションに存在しない場合は、sleepしません。このことにより、すぐにコミットしそうなバックエンドがいないときでも sleepするのを防ぐことができます。大抵のプラットフォームでは、sleep の最小単位はミリ秒です。ですから、0でない1から10000マイクロ秒までのどんなCOMMIT_DELAYの設定も効果は同じことになるでしょう。

WAL_SYNC_METHODパラメータはPostgresがカーネルに対してWAL更新のディスクへの書き込みを依頼する方法を決定します。どういう設定でも信頼性は同じはずですが、プラットフォームによってどれが一番早いかは全然違います。ちなみに、このパラメータは FSYNCが無効になっている場合は無関係です。

WAL_DEBUGを0以外のどんな値にしても、 LogInsertとLogFlushの WALにおける呼び出しが標準エラー出力に出力されるようになります。いまのところ、値による違いはありません。将来はもっと汎用的な方法に置き換えられるかもしれません。

Prev	Home	Next
実装	Up	ディスク領域