PostgreSQL 7.1.2 ドキュメント(日本語版 1.0)
Prev	Chapter 9. ログ先行書き込みプロトコルに基づくロギング: Write-Ahead Logging (WAL)	Next

9.2. 実装

WALは7.1以降では自動的に有効になります。 WALログが必要とする追加ディスク容量を確保すること、そして必要ならばチューニングすることを除いては(Section 9.3参照)、システム管理者は何もする必要はありません。

WALは $PGDATA/pg_xlogディレクトリに、16MBのサイズをもつセグメントファイルの集合として格納されています。セグメントは8KBのページに分割されます。ログレコード用のへッダーはaccess/xlog.hに記述されています;レコード内容は、ログの対象となる事象のタイプによって異なります。セグメントファイルは名前として 0000000000000000からはじまる順序数が与えられています。いまのところ、数字は巡回しませんが、利用可能な数字を使い尽くすには非常に長い時間がかかるはずです。

WALバッファは共有メモリ上の制御構造で、バックエンドが使用します。保護はスピンロックで行います。必要な共有メモリの量はバッファの数によります。WALバッファはデフォルトでは64KB です。

主要なデータベースファイルが置いてあるディスクとは別のディスクにログを置くと利点があります。これはpg_xlogディレクトリを別な場所に(もちろんpostmasterを落しておいてから)移動し、 $PGDATAの元々の場所からシンボリックリンクを張ることによって可能となります。

WALの目的は、データベースレコードが置き換えられたり、あるいは、実際にはディスクドライブのキャッシュにデータがあり、まだディスクに書き込まれていないのに、書込が成功したと嘘の報告をカーネルにするようなディスクドライブによってデータが破壊されたりする前に、ログが書き込まれることを保証することにあります。そのような情況では、電源が落ちた際に、復旧不可能なデータの破壊が起ることがあります。システム管理者は、 PostgreSQLのデータとログを保持しているディスク装置がそのような嘘の報告をしないように保証するべきです。

9.2.1. WALによるデータ回復

チェックポイントが実行され、ログがフラッシュされた後、チェックポイントの位置はpg_controlに保存されます。したがって、データ回復を行う場合はバックエンドはまず pg_control を読み、次にチェックポイントレコードを読みます。そして、チェックポイントに位置が記録されているredoレコードを読み、REDO操作を開始します。チェックポイント後最初のページ変更によってページ内容全体がログに保存されているので、そのページは最初に一貫した状態に復旧されます。

pg_controlのチェックポイント位置を使うことによって回復処理のスピードは早くなりますが、pg_control が壊れた場合に備え、ログセグメントを逆順に読み -- すなわち新しいものから古いものへと --、最終チェックポイントを見付ける方法を実際には実装した方が良いと思います。リリース7.1ではまだこれはできていません。

Prev	Home	Next
ログ先行書き込みプロトコルに基づくロギング: Write-Ahead Logging (WAL)	Up	WALの設定