PostgreSQL 7.1.2 ドキュメント(日本語版 1.0)
Prev	Chapter 2. PostgreSQL内部の概略	Next

2.3. 構文解析過程

構文解析過程は二つの部分から構成されます：

gram.yとscan.lで定義されている パーサはUnixのツールyacc と lexを使って作られています。
変換プロセス はパーサから返されたデータ構造の変更や追加をします。

2.3.1. パーサ

パーサは問い合わせ文字列(ASCIIテキストとして渡される)が正しい構文になるようにチェックしなければいけません。もし構文が正しい場合は構文解析ツリーが作られ返されます。正しくない場合はエラーが返されます。実装にはUnixのよく知られたツールである lexとyaccが使われています。

字句解析はファイルscan.l で定義されており、識別子やSQLキーワード の認識をします。認識されたすべてのキーワードや識別子に対してトークンが作られパーサに渡されます。

パーサはファイルgram.yの中で定義されており、 文法ルールとルールが実行されたときに起こる アクションのセットから構成されています。アクションのコード(Cコードで書かれています)は構文解析ツリーを作るのに使われます。

ファイルscan.lはプログラムlex を使ってCのソースファイルscan.cに変換されます。そしてgram.yはyaccを使って gram.cに書き換えられます。これらの書き換えが終ると、パーサを作るために通常のCコンパイラが使えるようになります。作られた Cのファイルには変更を加えないで下さい。次にlex かyaccが呼ばれた時にそれらは上書きされてしまいます。

Note: ここで述べられた書き換えやコンパイルは通常Postgres のソースと一緒に配布されるメイクファイル を使って自動的に行われます。

yaccやgram.yで定義される文法ルールの詳しい説明は本稿では説明しきれません。lex やyaccについては本や資料が沢山出ています。 gram.yの文法の勉強を始める前にyacc の知識を得ておくことをお勧めします。その知識を持たないと、何が起こっているのか理解するのが難しいと思います。

問い合わせを処理するために Postgresで使われるデータ構造をわかりやすく説明するため、処理の過程でこれらのデータ構造に加えられる様子を表す例を使いたいと思います。この例はこれからのセクションの様々な説明でも使われる簡単な問い合わせを含んでいます。この問い合わせではサプライヤーデータベースで使われるテーブルは既に定義済であると仮定しています。

Example 2-1. 単純なセレクト文

       select s.sname, se.pno
       from supplier s, sells se
       where s.sno > 2 and s.sno = se.sno;

図\ref{parsetree}はExample 2-1で与えられる問い合わせのために gram.yで定義された、ルールとアクションによって作られる構文解析ツリーを表します。(一つの図で両方のデータ構造を見せるスペースがなかったため、\ref{where_clause}で表される where句のための演算子ツリー は入っていません。)

Treeの頂点にあるのはSelectStmtというノードです。 SQLの問い合わせのfrom句に現れる全てのソーステーブルに対しエイリアスの名前と、 リレーションの名前を持つ RelExprノードのポインタを持つRangeVarノードが作られます。全てのRangeVarノードはSelectStmt ノードのfromClauseフィールドに付けられたリストに集められます。

SQL問い合わせのセレクトリストに現れるそれぞれの項目に対して、 Attrノードへのポインタを持つResTargetノードが作られます。 Attrノードはその項目のリレーション名 と属性の名前を持つValueノードへのポインタを持ちます。すべての ResTargetノードはSelectStmt ノードのフィールド targetListと接続されたリストにまとめられます。

図 \ref{where_clause} はSelectStmtノードのフィールド qual に付随されたExample 2-1で与えられる、SQL問い合わせの where句のための演算子ツリーを表します。演算子ツリーの頂点の節はAND操作を表すA_Exprノードです。このノードは二つのサブツリーを指すlexprとrexprという子節を持ちます。lexprに付随されたサブツリーは s.sno > 2の条件を表し、rexprに付随されたものは s.sno = se.snoを表します。それぞれの属性に対してリレーションの名前と属性名を持つValueノードへのポインタを持つAttrノードが作られます。問い合わせにあらわれる定数に対しては、定数の値を保持するためにConstノードが作られます。

2.3.2. 書き換えプロセス

書き換えプロセスはパーサから引数としてツリーを受け取り、その中を再帰的に移動します。もしSelectStmtノードが見つかった場合、それは新しいデータ構造の頂点になるQueryノードに書き換えられます。図\ref{transformed}は、書き換えられたデータ構造を表しています。 (一つの図で全てを示すスペースがなかったため、書き換えられたwhere句の部分は\図ref{transformed_where}で示されています。)

もしFROM句のリレーション名 がシステムに認識された場合、ここで照合が行われます。システムカタログ に存在するすべてのリレーション名に対して、リレーション名、 エイリアス名 、そしてリレーションIDを持つRTE ノードが作られます。ここからはリレーションIDは問い合わせで作られるリレーション を参照するために使われます。すべてのRTEノードは、 Queryノードの rtableフィールドと結びつけられた レンジテーブルエントリーリスト (range table entry list) に納められます。もしも問い合わせの中でシステムが認識できないリレーションが発見された場合、エラーが返され問い合わせプロセスはアボートされます。

次に、属性名が問い合わせで使われるリレーションの中に含まれているかがチェックされます。見つかった全ての属性に対して、 Resdomノード(カラム名を持ちます)へのポインタとVAR ノードへのポインタを持つ TLE節が作られます。VARノードには重要な二つの数字があります。フィールドvarno は上でエントリーリストが作った範囲のなかで現在の属性を持つリレーションのポジションを示します。フィールド varattno はリレーション内の属性のポジションを示します。もし属性の名前が見付けられない場合、エラーが返され問い合わせプロセスはアボートされます。

Prev	Home	Next
接続の方法	Up	Postgresルールシステム