OpenAIのChatGPTの進化：テキストを超えて、音声と画像のインタラクションへ

26 Sep 2023

0370 PV約4分

OpenAIのChatGPTの進化：テキストを超えて、音声と画像のインタラクションへ

画期的な発表として、OpenAIは有名なChatGPTプラットフォームの新機能を発表しました。これらの機能強化により、ユーザーはテキストだけでなく、画像や音声コマンドを使用してチャットボットと対話できるようになります。

1. 高度な機能へのアクセシビリティの拡大

OpenAIは、今後2週間で、ChatGPT PlusとEnterpriseのユーザーがこれらの革新的な機能にアクセスできるようになると発表しました。

音声機能は、オプトイン方式ではありますが、iOSとAndroidデバイスの両方で利用できるようになります。同時に、画像機能はすべてのChatGPTプラットフォームで展開されます。同社はまた、最初の段階的なローンチ後、これらの機能の可用性をより多くのユーザーに広げる意向を表明しています。

2. 音声チャット : デジタルコミュニケーションのゲームチェンジャー

音声チャット機能は、ユーザーとChatGPTの間の聴覚的対話を促進するように設計されています。ボタンを押し、質問を声に出すだけで、ユーザーは話し言葉で返答を受け取ることができ、テキストベースの返答は必要ありません。

この革新的なアプローチは、AlexaやGoogleアシスタントのような人気のあるバーチャルアシスタントの機能を反映しています。注目すべきは、OpenAIのこの発表は、AmazonがAlexa向けに同様の機能を発表した直後に行われたことです。

3. 高度なオーディオビジュアル通信機能

シームレスな音声コミュニケーションを可能にするため、OpenAIは最先端の音声合成モデルを導入しました。このモデルは、単なるテキストと短い音声サンプルから「人間のような音声」を生成する能力を誇ります。

さらに、Whisperモデルは話し言葉をテキストに書き起こすために統合されています。しかしながら、OpenAIは潜在的な悪用、特になりすましや詐欺のリスクについて警戒を続けており、この機能の使用を特定のシナリオや共同作業に制限する予定です。

ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb

— OpenAI (@OpenAI) September 25, 2023