nofx @Wiki
自然言語処理
最終更新:
匿名ユーザー
-
view
- 有限オートマトン
- 1.有限個の状態の集合 K
2.有限個の入力アルファベット Σ
3.遷移の集合δ+開始記号 S(S∈K)
4.最終状態の集合 F(F⊆K)
有限オートマトン M=(K,Σ,δ,S,F)
- 形式文法
- 1.非終端記号の集合 N
2.終端記号の集合 Σ
3.生成規則(書き換え規則) P
4.開始記号 S
形式文法 G=(N,Σ,P,S)
- 正則文法(正規文法)(regular grammer : RG)
- 形式文法 G=(N,Σ,P,S)のうち生成規則Pが次の形になっているもの。
●A→aB もしくは
●A→a
開始記号Sについては
●S→ε
ただし、 A,B∈N, a∈Σ
正則文法は3型文法とも呼ばれる。
- 文脈自由文法(context-free grammer : CFG)
- 形式文法 G=(N,Σ,P,S)のうち生成規則Pが次の形になっているもの。
●A→α ( A∈N, α∈(Σ∪N)* )
文脈自由文法は2型文法とも呼ばれる。
プログラミング言語は文脈自由文法で生成できる。
→ ある条件を満たす文脈自由文法 : LL(1)文法
- チョムスキー標準形(Chomsky normal form : CNF)
- 形式文法 G=(N,Σ,P,S)のうち生成規則Pが次の形になっているもの。
1.A→BC ( A,B,C ∈ N )
2.A→a ( a∈Σ )
3.S→ε
- グライバッハ標準形(Greibach normal form : GNF)
- 形式文法 G=(N,Σ,P,S)のうち生成規則Pが次の形になっているもの。
1.A→aB1B2…Bm ( a∈Σ、 B1,B2,…,Bm ∈ N )
2.A→a ( a∈Σ )
3.S→ε
- s文法
- 1.生成規則の右辺は終端記号で始まる
2.生成規則の左辺が同じなら右辺は異なる終端記号で始まる