聴覚

  • 聴覚
 音波の機械的現象としてだけでは説明できず、知覚や認知的側面もある。
 何かを聴くとき、大気を通して音波が耳に到達し、耳の中でそれが神経の活動電位に変換される。
 その神経パルスは脳に到達し、知覚される。
 音響信号処理など音響学に関わる問題では、単に音波の物理的性質を考慮するだけでなく、耳と脳が各人の聴覚に重要な役割を果たしている点を考慮することが重要となる。

例えば、耳は音を神経刺激に変換する際に周波数スペクトルへの分解を行う。この解析は蝸牛基底膜における機械的な特性によるフィルタ・バンク処理によって実施される。このフィルタ・バンクは中心周波数にほぼ比例してバンド幅が広がるいわゆる定Q型のものであるため、その特性からこのスペクトル解析はフーリエ分析的なものではなく、ウェーブレット分析的なものとなる。そのため、時間領域の情報の一部は失われてしまう。しかし、基底膜の振動を中枢へ伝える神経パルスは基底膜が特定の方向へ変位したときに発火するという性質を持ち合わせるため、振動に含まれる時間的な情報は神経発火の時間パターンとして中枢へ伝えられていることも知られている。MP3の圧縮方法は基底膜上に複数の振動成分が与えられた場合の相互作用、すなわちマスキングを考慮して実効的なダイナミック・レンジを狭めることによる情報圧縮を利用している。さらに耳のダイナミック応答は対数関数的である。公衆交換電話網はこの現象を利用して、音声を対数的に圧縮し、指数的に伸張して再生している。また、耳の非線形性の副次効果として、周波数の近い音が2つあるとき、実際には存在しない低い周波数の音が聞こえてくる。このような耳の解剖学的特徴に起因する生理的現象も音響心理学的現象としてひとまとめに扱われるのが一般的である。

脳によって生じる真の音響心理学的現象もある。例えば、録音された音楽にパチパチという雑音があっても、人はそのようなノイズを気にせずに音楽を楽しめる。人によってはノイズを全く忘れてしまう場合もあり、後でノイズがあったかどうかを聞いても答えられないことがある。これを心理音響マスキングのレベルで説明する場合もある。この場合、ノイズの存在があってもなくても知覚的にはその違いが分からない。これとは別に、雑音の存在があってもそれが注意している音には干渉しないで聞くような場合も存在する。これは音脈分凝と呼ばれる現象であり、心理音響的マスキングとは異なるレベルでの処理が貢献している。脳がそのようなマスキングを行う能力は、様々に利用されている。ただし、デジタル信号処理では、この現象はアナログのホワイトノイズ全体をカバーするというよりも、圧縮によって失われた部分を隠すのに使われることが多い。別の心理音響現象として、脳はパターン認識のために相関的プロセスを使うと考えられており、同様な技法は電子回路で信号パターンを探すのにも使われている。相関的な一致を受け入れるしきい値が非常に低い場合、純粋なノイズや少しだけ似ているような音声からもよくあるパターンを補完して聞き取ってしまう。例えば、無線通信士がノイズの多い中でモールス符号を聞き取ろうとしていると、実際にはモールス符号がないにも関わらず、ノイズからモールス信号を聞き取ってしまう。このような心理音響現象は、例えば非常に危険な状況で知覚力を高めるのに重要な役割を果たす。これは脳が勝手に知覚を生成する幻聴とは異なる[要出典]。


  • 知覚の限界
 人間の耳は、一般に20Hzから20,000Hz(20kHz)の音を知覚する。
 上限は加齢と共に低くなる傾向があり、成人では一般に16kHzより高い音は聞こえない。
 耳は20Hz未満の音は知覚できないが、触覚で感じることができる。

 耳の周波数識別能力としては、中音域で約2Hz以上の違いを聞き分けることができる。
 ただし、別の手段でそれ以下の周波数の違いを知覚することもできる。
 例えば、2つの近い周波数の音があると、別の低い周波数の音の変化が聞こえる。いわゆるうなりである。

 人間の耳は周波数を対数的に知覚する。言い換えれば、知覚される音高は周波数と指数関数的関係にある。
 音階がその例で、1オクターブ音高が上がると基本周波数は約2倍になる。
 ある音の周波数を約***倍すると次の半音高い音になる。
 半音12個分高いと1オクターブ高い音になるので、***すなわち2倍の周波数ということになる。

 つまり、西洋の音楽で使われている半音による音階は、周波数に対して線形ではなく、対数的である。
 聴覚の研究で使われるMel尺度やBark尺度も経験則から設定されており、やはり周波数に対して対数的である。

 聞こえる音の大きさの範囲は幅広い。我々の鼓膜は音圧変化に敏感である。
 可聴な最小の音を0dBと定義するが、上限は明確には定義できない。
 音の大きさの上限は、物理的に耳に障害が発生する限界、つまり聴覚障害を引き起こす音の大きさということになる。
 これは、その音が連続する時間にも依存する。
 120dBの音は、短時間なら後遺症を引き起こさない(不快あるいは苦痛を伴う可能性はある)が、80dBの音を長時間聞き続けると、後遺症が残る可能性がある。

 可聴な最小の音をもっと厳密に測定してみると、周波数によって可聴な最小の音の大きさが異なることがわかる。
 様々な周波数で聞こえる最小の音を測定していくと、周波数を横軸とした絶対可聴しきい値(ATH)曲線が得られる。
 一般に、耳の感度(ATHの最小点)は1kHzから5kHzの間にピークがあるが、その値は加齢と共に変化し、老人になるほど2kHz以上の感度が悪くなる。

 ATHは最小の等ラウドネス曲線である。
 等ラウドネス曲線は可聴周波数範囲について音圧レベル(dB)で表され、同じ大きさと知覚される音圧を表す。
 等ラウドネス曲線を初めて測定したのは、1933年、ベル研究所の Fletcher と Munson で、ヘッドホンで純粋な音を再生して測定された。
 彼らはその曲線を Fletcher-Munson 曲線と呼んだ。
 各人が主観的に音の大きさをどう感じているかは測定が困難であるため、Fletcher-Munson 曲線は多人数の測定結果を平均して描かれた。

 1956年、Robinson と Dadson が測定手法を改善し、無響室で前面からの音を使って新たな等ラウドネス曲線を得た。
 Robinson-Dadson 曲線は1986年、ISO 226 として標準化された。
 2003年、12カ国の研究で得られたデータを元に ISO 226 が改版され、等ラウドネス曲線と名づけられるようになった。

最終更新:2009年08月10日 01:00
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。