音声の動的要素と静的な要素

英語の音のストリームにはいろいろな情報が含まれています。大事なのは言語音のような動的要素と、個人識別情報などの静的要素があります。

人間が話す個人性の情報は音響的には何をもって判断するのでしょうか。鈴木教郎氏の研究によると音の静的な成分が個人性情報を最も含んでいると言っています。つまり音のスペクトルとか周波数などの音の静的成分が個人情報となっています。

会話音を聞くとだれが話しているか分かるのは、その音声の個人情報によるものです。この場合には音のスペクトルとか周波数などの音の静的成分と、話者が話す独得のリズムやイントネーションの動的成分です。

しかし、音声の認識には音の動的成分が関与しており、音声の個人認識には静的成分が関与しております。だからいろいろな人が個性のある音で話しても動的変化は同じであるために女性でも男性でも、子供でも大人でも、痩せていても太っていても、誰が話しても問題無く音声が聞き取れるのです。

するとモデル音を聞いて真似をする場合に注意が必要です。それはモデル音には話者の個人情報も含まれております。するとこの個人情報は真似てはいけません。実際には真似する事はできないのです。

そのためには正しくはモデル音からその話者の個人情報を取り去り、残った動的な言語情報に自分が持つ個人情報を加える必要があります。

発音練習ではこのように音声を音のストリームで捉えると、大変に難しい事が分かります。

音素ベースの調音音声学では、音素が時間軸に音声が子音や母音が同格で並んでいるとモデル的に捉えているから簡単ですが、それは事実ではなく非常に簡単にモデル的に捉えた音声なのです。

その結果音素ベースで学習すると、ぎくしゃくとした発音になる弊害があり、音素ベースでは音のストリームは聞き取れません。

一緒に英語を学びませんか

ディープラーニングで一緒に英語を勉強しませんか。次のサイトにメソッドと教材があります。

次の方が会員として参加しています。

https://英会話革命.com/for-member/memberlist/

現在、無料モニターを募集しております。下記リンクから無料で登録できます。

https://英会話革命.com/

シェアする

  • このエントリーをはてなブックマークに追加

フォローする