Windows構文解析機Earleyでの文法の実用化
芦刈弁のおもちゃの文法
北大阪・枚方・明野教会壮年会交流会
2002年6月23日(日曜日)
枚方希望教会客会員 関西外国語大学 古賀弘毅
E-mail:h-koga@kansaigaidai.ac.jp
[Go Back Home]

このお話では、芦刈弁(有明海のそばにある私の故郷の佐賀県芦刈町の方言)の文法を作り、Windows上で走らせることのできる構文解析機 Earley、Morgan's 2001 parserに実用化します。同文法を積んだ分析機で芦刈弁の文を解析しながら、芦刈弁の文を言ったり、解釈したりします。

1.芦刈弁の文
Q1) 芦刈弁の文は、たとえば、以下のようなものです。それぞれの芦刈弁の文と同じような意味となる標準語の対応する文はどんなものでしょうか。また、芦刈弁と標準語の文法の対応を考えましょう。

1)(芦刈) uzumaki no sononaka ni oi ga fune ba nomikomu [否定形:nomikoman].
    (標準) uzumaki ___ sononaka _____ ore ____ fune ____ nomikomu.
    (標準語との対応) 主格「ga」→「no」、所有格「の」→「_」、目的格「を」→「_」、子音終末動詞基の動詞[動詞基 nomikom]「nomikomu」→_____;[動詞基 hatarak]「hataraku」→「____」;[動詞基 mot]「motu」→「____」;[動詞基 shin]「shinu」→「shin」、否定形「anai」→「__<anu>」

2)(芦刈) ame no fuu [furu][否定形: furan].
    (標準) ame ___ _________ [否定形:fur_________]
    (標準語との対応) 子音終末動詞基の動詞[動詞基 fur]「furu」→「fuu」;[動詞基 or]「oru」→「oo」;「ori n saru」<[動詞基 ori nasar]、基底:ori nasaru>→「o n saa」;[動詞基 sinjir]「shinjiru」→「shinjii」、否定形「anai」→「__<anu>」

3)(芦刈) kodon no arawaru [否定形:arawaren].
    (標準) kodomo _____ arawareru [否定形:arawarenai].
    (標準語との対応) 母音終末動詞基の動詞[動詞基 araware]「arawareru」→____________________、否定形「nai」→「__」

4)(芦刈) ame no fuugii, kodon no hataraku.
    (標準) ame ____ furu ________, kodomo _______ hataraku.
    (標準語との対応) 条件接続詞「nara」→___ s -> [s + nara/______] s

5)(芦刈) oi ga fune ba nomikomu uzumaki no arawaru.
    (標準) ore _____ fune _____ nomikomu uzumaki ______ arawareru.
    (標準語との対応) 関係節+名詞 俺の船を飲み込む渦巻き→________、noun -> s_gap + noun。なお、これは、主要辞の名詞が空所を埋める文によって記述される性質を持つような名詞を意味する。

なお、これは芦刈弁の断片に過ぎません。

Q1解答)       (1)渦巻きがその中に俺の船を飲み込む。
                    (2)雨が降る。
                    (3)子どもが現れる。
                    (4)雨が降るならば、子どもが働く。
                    (5)俺の船を飲み込む渦巻きが現れる。

2.芦刈弁の文法
芦刈弁の文法は、語彙が何かを除けば、標準語の文法と同一である。以下の規則を芦刈弁の文法として提案する。

  1. % A Grammar of Ashikari Dialect
  2. initial symbol: s    %芦刈弁の文はsという種類のものである。
  3. s -> compp s    %条件接続詞や引用助詞「と」などの文を取ることを示す補文標識は、文を取ったら(つまり、句phraseになったら)、たとえば、「太郎が学校へ行くなら」のように、文を修飾する。
  4. s -> pp s    %「午後8時から」などの後置詞句も、文を修飾する。
  5. s -> nomp vi    %主格句(nominative phrase、以下nompと省略)と「眠る」などの自動詞(intransitive verb、以下viと省略)(「を」句を取らない動詞)が、この順で並んだら、文をなす。
  6. s -> locp nomp vi    %すぐ上の場合、主格句の前に位置格句(locative phrase、以下locpと省略)が出てきてもよい。
  7. s -> nomp vp    %目的語を取る動詞、つまり、他動詞(transitive verb、以下vtと省略)文の場合、目的格句と他動詞が並んで動詞句をなし、主格句と動詞句がこの順で並んで、文をなす。なお、動詞句の場合、位置格句が目的格句の前に現れてもよい。
  8. vp -> accp vt
  9. vp -> locp accp vt
  10. s_gap -> compp s_gap    %条件接続詞や引用助詞「と」などの文を取ることを示す補文標識は、空所のある文を取ったら(つまり、句phraseになったら)、たとえば、「学校へ行くなら」のように、空所のある文を修飾する。
  11. s_gap -> pp s_gap    %「午後8時から」などの後置詞句も、空所のある文を修飾する。
  12. s_gap -> vi
  13. s_gap -> locp vi
  14. s_gap -> vp    %ここでは主要辞の名詞が関係節の主格名詞を記述する場合、つまり、主要辞の名詞が関係節中の述語の主語である場合のみを考えた。
  15. n -> s_gap n    %空所を持つ文(s_gap)(関係節)と名詞(n)(主要辞のhead noun)が並んで名詞(n)となる。
  16. n -> s n    %名詞が空所を含まない文を取る場合で、同格節などがこの規則で分析される。
  17. n -> possp n    %所有格句(possessive phrase、以下posspと略)と名詞が並んだら、名詞となる。
  18. nomp -> n nom    %名詞と格(主格、目的格、位置格、所有格)とが並んだら、格句(nomp、accp、locp、posspの順)となる。
  19. accp -> n acc
  20. locp -> n loc
  21. possp -> n poss
  22. pp -> n p        %名詞と後置詞(postposition、以下pと略)とが並んだら、後置詞句(postpositional phrase、以下ppと略)となる。
  23. compp -> s comp    %文と補文標識(complementizer、以下compと略)とが並んだら、補文標識句(complementizer phrase、以下comppと略)となる。
  24. nom -> no    %標準語の「が」
  25. acc -> ba    %標準語の「を」
  26. loc -> ni
  27. poss -> ga    %標準語の「の」
  28. p -> de
  29. comp -> gii    %標準語の「ならば」
  30. n -> iesusama %イエス様
  31. n -> kami    %神
  32. n -> miwaza    %御業
  33. n -> mikotoba    %御言葉
  34. n -> waga    %標準語の「おまえ」
  35. n -> anta    %標準語の「あなた」
  36. n -> oi    %標準語の「俺」
  37. n -> antagata    %標準語の「あなた方」
  38. n -> mon    %標準語の「もの:物・者」
  39. n -> ai    %愛
  40. n -> eikou    %栄光
  41. n -> megumi    %恵み
  42. n -> inoti    %命
  43. n -> tumi    %罪
  44. n -> shuui    %周囲
  45. n -> naka    %中
  46. vt -> sinjii    %標準語の「信じる」
  47. vt -> sinjiran    %標準語の「信じない」
  48. vt -> sinsaa    %標準語の「なさる;しなさる」
  49. vt -> jissensu    %標準語の「実践する」
  50. vt -> nomikomu    %飲み込む
  51. vt -> motu    %持つ
  52. vi -> sin    %標準語の「死ぬ」
  53. vi -> hataraku    %働く
  54. vi -> onsaa    %標準語の「いらっしゃる;おりなさる」
Earley Parser Kit [EarleyとLunkから成る]を自分のPC、Windows上で、文法を自分で作って、構文解析機に文法を積んで、分析させられます。

3.芦刈弁の文の生成、解釈
Q2) 次の標準語の文を芦刈弁で言ってみましょう。「ヨハネの福音書(ヨと省略)」や「テサロニケI(テと省略)」からの文を簡略化しました。
 

1)(標準) 自分の中にイエス様がいらっしゃる(ヨ)。
    (芦刈) _________________
2)(標準) 神のイエス様を信じるあなたたちのうちに御言葉が働く(テ)。
    (芦刈) _________________________
3)(標準) 神のイエス様を信じるものが命を持つ(ヨ)。
    (芦刈) ___________________
4)(標準) 自分の罪の中で神のイエス様を信じないものが死ぬ(ヨ)。
    (芦刈) ______________________
答えの芦刈弁の文がどう分析機によって、分析されるか見ましょう。配布したEarleyParserKitを使って、自分でashikariben.txtを分析に搭載して試してみましょう。

Q2解答)Earleyを使わない人は、自分で文法を使って、分析してください。答えはすぐ下のとおりです。

1)おいが中にイエス様のおんさあ。
2)神がイエス様ば信じいあんたがたがうちに御言葉の働く。
3)神がイエス様ば信じいもんの命ば持つ。
4)わがが罪が中で神がイエス様ば信じらんもんの死ん。
それぞれについて、可能な統語構造は複数あるかもしれません。話者の意図と離れて、語列は文法によってその可能な分析が算出されます。

Q3) 次の芦刈弁の文がわかりますか。「テサロニケ人への手紙」(小林和夫、1995)からの文(30ページ)をかなり簡略化して、芦刈弁の文にしてみました。(現在、枚方希望教会では成人科の学びで、礼拝前に1時間、みんなで「テサロニケ人への手紙」を読んでいます。)

あんたの周囲にイエス様が愛ば実践すぎい、神の、恵みが中にわがば飲み込む御業ばしんさあ。
この芦刈弁の文がどう分析機によって、分析されるか見ましょう。EarleyParserKitを持っている人は実際に自分でashikariben.txtを分析機に積んで試してみましょう。複数の分析があったら、それは、文法がこの語列を解析する仕方が形式上は複数あるということを示します。そのような場合は、意味的のどちらが意図されているものかを考え、選びましょう。このようにして、文の意味がはっきりと分かります。

Q3解答)標準語の「あなたが周囲にイエス様の愛を実践するならば、神が、恵みの中にあなたを飲み込む御業をなさる」と翻訳されます。
    この分析では、位置格句「恵みが中に」が「わがば飲み込む」という動詞を修飾している。もうひとつの分析では、位置格句「恵みが中に」が「御業ばしんさあ」という動詞を修飾していて、これは意図していない分析である。
    文法は語列の可能なすべての解釈を算出する。日常の言語使用のここに文法の意義がある。

    分析機に実用化した正式の日本語の文法については、Gunji 1987、Gunji & Hashida 1998、Koga 2000などを参照して欲しい。分析機に実用化した正式の英語文法には、Sag 1997、Pollard & Sag 1994 などがある。分析機に実用化した正式のドイツ語文法には、Hinrichs & Nakazawa 1994、Meurers 1997 などがある。これらの文法は、規則の規則、つまり、文法に横たわる原理を探求している文法である。
 

参考文献