言語の分類
言語には、大きく分けて音声言語と文字言語がある。
人間は、音声言語を言語の基礎としているが、情報の分野では文字言語の方が研究が進んでいる。そのため、人工知能では文字言語を扱う。
人間は、言語の基礎となる音声言語を習得するために、一般的な学習とは別のプロセスを経る。そのプロセスの特徴は主に次の通りである。
- 習得に適した体型になる。身体は未発達で、大人に世話をされないと生きていけない。しかし、頭部は必要なだけ発達しており、発語も可能である。
- 頻度の少ない刺激に反応する。聞き慣れた言葉は聞き流し、初めて聞いた言葉には関心を持つ。
- 睡眠時間が多い。少ない経験から、必要な要素を効率よく整理していると思われる。
文献を調べたわけではないので適当な説だが、とりあえず一般的な学習とは異なることを理解してもらいたい。
文字言語の特性
文字言語には大きく分けて、構造と意味の2つの概念を内包する。
文字言語は記号列で表されるが、構造とは、記号列の作る文法、単語の区切りのことである。
意味は、記号列が何を表しているか、ということである。
一般に、構造は文字言語の中で完結しているが、意味は文字言語からは推定することができない。
音声言語の場合、構造も言語のみでは把握するのは難しい。そこで、視覚や触覚など、他の器官と連合して学習することになる。
しかし、文字言語の場合、記号と意味の同時性が薄いため、連合学習は難しい。
内的言語
このような文字言語の特性を考慮して、どのように言語を扱わせるかを考える。
構造を把握することには問題がない。実際、形態素解析の行えるソフトが普及している。
一方、意味を把握するのは難しい。構造と意味の関連性を覚えるのにも、意味の把握は必要だから、意味が分からなければ学習は完成しない。
そこで、意味を環境に求めなくてはいけない。つまり、「感覚器官」が必要になる。
感覚器官からの入力と、構造解釈を照らし合わせて、言語の意味を探るのだ。
この作業は、もちろん、何も覚えていない状態からは行うことは不可能である。指針がないと、どの入力と意味とを合わせて良いのか不明である。
そこで、構造解釈の原型を作ることにしよう。この原型は、感覚器官との関連性を密に持っている。これに近い構造の文があれば、それに意味を乗せることができるだろう。
この、構造解釈の原型は、元々持っていなければならない。それでいて、これは既に文と同じ構造を作ることができる。つまり、始めから文を作る性能を持っている必要があるということだ。ただし、あくまで基本的な文構造だけだ(基本構造に複文、重文は必要ない)。
この文構造のことを内的言語と呼ぼう。人工知能の言語解釈は、内的言語→文字言語となる。人工知能としては、内的言語に解釈の多重性があっては困る。
人工知能が文章を作るときも、内的言語→文字言語という手順を踏む。こうすることで、他の文字言語にも対応することができる。つまり、人工知能は翻訳する機能を手に入れる。
最終更新:2007年07月31日 09:41