愛猫家は気になる!アプリ「MeowTalk」は猫の鳴き声を人間が認識できる音声に変換できるのだろうか?

愛猫家は気になる!アプリ「MeowTalk」は猫の鳴き声を人間が認識できる音声に変換できるのだろうか?

愛猫家(猫バカとも言われる?)にとって、猫の鳴き声が理解出来たらと、皆さん思うのではないでしょうか?

App Storeで、猫が言っていることを翻訳するアプリを見たことがあると思います、実際にそれらは本当にあなたの猫の鳴き声を翻訳出来るのでしょうか?

それぞれの猫の「言語」が独特なので難しいのですが、現代の技術を使えばかなり近づけることができる可能性が在ります

MeowTalkのような猫の翻訳アプリは、機械学習に重点を置いた音声認識を利用しています

音声認識と機械学習

音声認識は、音声を録音し、その音声をデジタルデータファイルに変換することによって機能します、音の高さや音量などのデータを、アプリが分析して意味に合致させるためのデータポイントとしてエンコードします


DPA Microphonesの説明によると、これらのデータポイントは、バックグラウンドサウンドや単語の発音によって大きく異なることがあります

私たちは音声認識を当たり前だと思っていることがありますが、特に人間の言葉がいかに複雑かを考えるとこれはテクノロジーの驚くべき偉業です

The Scientistが説明しているように、それぞれの単語にはさまざまな音、つまり「音素」が混じり合っています。コンピュータに音声を理解させるのはとても難しい、猫の鳴き声の新たなものとして、さらに困難になるでしょう

音声認識を使用するアプリは、データセットと呼ばれる単語の「語彙」でプログラムされています、そして、アプリはあなたの音声をデータ語彙の中で最も近い選択肢にマッチさせます

間違いがあった場合は修正し、次回のためにそのデータを保存します、これは機械学習の一部でプログラムが音声を認識するために学習する方法です

MeowTalk 00002

音声認識にはまだ問題があり、特に音声障害やアクセントがあります、しかし、こうした問題を克服するために機械学習を改善している企業もあります、時間の経過とともに、機械学習は音声認識を強力なツールに変えることができます

これが人間にとっての音声認識の仕組みです···、これが猫の鳴き声にも効果があるでしょうか?

音声認識と猫の鳴き声認識

まず、ある種のニャーを「お腹すいた」として訳すのと、人間の言葉を分析するのとではなぜ違うのかを理解する必要があります、問題は、猫のコミュニケーションが姿勢などの非言語的な手掛かりに大きく依存していることです、もう一つの問題は、世界共通の「猫語」がないことです


American Society for the Prevention of Cruelty to Animals(ASPCA:アメリカ動物虐待防止協会)だけでなく日本でもよく言われていることは、野生の成猫は決して鳴かず、人にしか鳴かないと言います

ヒューマン協会の他の研究では、これらの音は孤立してはいないと付け加えています、私たちはそれをボディーランゲージや他の文脈と一緒に解釈しなければなりません

多くの場合、これらの無音の信号は、「お腹が空いた」という意味のニャーと「遊びたい」という意味のニャーの唯一の違いです

この問題に加えて、2匹の猫が同じ言語を持つことはありません。猫は飼い主のために、自分だけの「言語」を開発します

これは、飼い主の声の真似をすることと、猫の性格に基づいています、同じ欲求や必要性を伝える場合でも、2匹の猫が同じ声を出すことはありません、では、どのようにして1つのアプリの音声語彙をすべての猫に翻訳することができるのでしょうか?
MeowTalk 00005

猫のための柔軟な機械学習

音や感情を理解しようとするOtoのような仮想アシスタントは少数ですが、音声認識はまだ非言語的な信号には弱いと言えます、しかし、だからといってそれらを解釈できないというわけではありません

MeowTalkは、これらの問題を克服するために、より柔軟性の高い機械学習を使用しています

Meowtalkは、Alexaチームでも働いていたJavier Sanchez氏によって作られました、彼は、このアプリをスマートカラーへのステップとして想像していました

これらの首輪は、複雑な機械学習戦略を駆使して、猫の鳴き声を人間の言葉に翻訳し、人間が猫をよりよく理解し、世話をするのを助けることができるようになるでしょう

MeowTalkチームは、それぞれの猫のためにより具体的なプロファイルを作成することで、ユニークさの問題を補っています、アプリでは、それぞれの猫を個別に登録します、Science Norwayの報告によると、子猫は成猫とは異なる鳴き声をするため、アプリでは猫の誕生日も尋ねています

それぞれのプロファイルは、機械学習に少しディープラーニングを取り入れて、猫に固有のデータネットワークを生成します

ボキャブラリーについては、MeowTalkはデータセットの10個のサウンドプロファイルからスタートします、それぞれに「happy(ハッピー)」や「hunting(ハンティング)」のように、異なる意味を持っています、アプリが音を聞いてそれを間違えると、それを修正するか、新しい解釈を作成することができます
Fighting(ファイティング)、Warning(警告)、Angry(怒っている)、Mating(交尾)、Happy(ハッピー)、Mother Call(マザーコール)、Resting(休憩)、Pain(痛み)、Defense(防衛)、Hunting(狩猟)
MeowTalk 00001
訂正は、アプリに基本語彙を新しい音に置き換えるように指示します

例えば、「Hunting(狩猟)」を長い泣き声の代わりに短い鳴き声に合わせるようにアプリに指示することができます

通常、音声認識アプリケーションでの機械学習は、このタイプの上書きに抵抗します、しかし、MeowTalkが使っているより柔軟な形式の機械学習は、この修正をより簡単に処理できます

新しい解釈を作成すると、以前はエンコードされていなかった意味が追加されます。たとえば、猫がお気に入りのおもちゃを欲しがったときに特定の呼び方をしている場合、オプションとして「私のマウスが欲しい」を追加することができます、自動修正辞書に単語を追加するのと似ています

時間をかけて、あなたの猫のために高度にパーソナライズされたスピーチプロファイルを開発することができます

最終的には、ペットシッターや行動上の問題を解決するのに役立つほど洗練されたものになるかもしれません、それだけでなく、飼い主がペットの気持ちに気付く助けになります

猫翻訳アプリは機能するか?

結局のところ、「猫翻訳」はユーザーが自分の猫がどのように話すかをアプリに教えることに大きく依存しています、それぞれの猫のコミュニケーションがユニークであることから、おそらくいつもそうであると言えます

しかし、開発者が部分的にでもこれを成功させることができるほど機械学習が発達したという事実は信じられないことです、機械学習とAIは猛烈なスピードで進化しており、次はどこへ向かうのか楽しみです

ダウンロード:MeowTalk iOS | Android

(Via MUO.)

MeowTalk 00003

私もこれから我が家のツーにゃんの「ラテ蔵」くんと「茶豆」ちゃんで確認してみたいと思いますが、「茶豆」ちゃんは外猫での生活が長いので殆ど鳴いた声を聞いたことがないですが


LEAVE A REPLY

*
*
* (公開されません)