Googleは新しいAIを発表したばかりだが、すでにそのパフォーマンスについて嘘をついていると非難されている
人工知能の進化する世界では、Googleは常に先頭を走っています。彼らの最新の提供物であるGoogle Geminiも例外ではありません。
これまでで最も強力なAIモデルのスイートとして宣伝されているGeminiは、テクノロジー界で話題になっています。しかし、その話題のすべてが肯定的なわけではなく、その理由を理解することが重要です。
Geminiのデモにまつわる論争
GoogleのGemini発表に伴い、多くの人を驚かせたデモビデオが公開されました。このビデオは、話し言葉のプロンプトと画像認識を組み合わせたGeminiのマルチモーダル機能を披露しています。
AIが点つなぎの絵を認識し、数秒以内に反応し、さらにはカップとボールのゲームで紙の団子をリアルタイムで追跡する様子を想像してみてください。印象的ですよね?
しかし、YouTubeのビデオの説明をよく見ると、「このデモの目的のために、遅延は減少され、Geminiの出力は簡潔さのために短縮されています」という免責事項があります。
この告白は議論を引き起こしました。BloombergのコラムニストParmy Olson氏は、デモがリアルタイムのやりとりではなく、静止画フレームのシリーズであり、書かれたテキストプロンプトに基づいていたと指摘しました。
私も昨日、AI関連のYouTubeの動画を見ていて「こりゃ凄い!」と思って、元になる動画を見たら説明文の「…もっと見る」をクリックすると「For the purposes of this demo, latency has been reduced and Gemini outputs have been shortened for brevity.」の一文の記載があったので、”嘘をついている”と言うより”実際のスピードはどれくらいなんだろう?”実際のスピードを知りたいと思い、丁度そのことをXに投稿していました
Google Geminiの動画を使って凄いと言うのを多く見るのですが、説明に「For the purposes of this demo, latency has been reduced and Gemini outputs have been shortened for brevity.」とあり、実際の速さはどうなんでしょうか?https://t.co/UP968LJXaD
— 酔いどれ (@yoidoreo) December 8, 2023
編集と誤解を招く表現の微妙な境界線
技術的な問題を避けるために、デモビデオを編集することは企業にとって一般的です。しかし、Duplex AI音声アシスタントなど、疑わしいビデオデモの歴史を持つGoogleにとっては、眉をひそめるものです。
問題は、これらの編集されたビデオがAIの能力を正確に表現しているのか、それとも楽観的な絵を描いているのかということです。
Googleの反応と大局
懐疑論に対する回答として、GoogleのDeepMindの研究副社長であり、Geminiの共同リードであるOriol Vinyals氏は、「ユーザープロンプトとビデオの出力は実際のものであるが、簡潔さのために短縮された」と述べました。
彼は、ビデオがGeminiで構築されたマルチモードユーザーエクスペリエンスがどのように見えるかを示すために作られたと強調しました。
しかし、このアプローチがGoogleにとって最善かどうかは疑問です。
特に、公衆の目には、OpenAIのGPTに対して遅れをとっているように見えるGoogleにとっては。Googleが開発者を刺激する目的であれば、AIの能力を誤って表現していると思われる慎重に編集された映像ではなく、透明性と実際のテストを通じて行うべきかもしれません。
ジャーナリストや開発者にGeminiを直接体験させることで、その真の能力を示すことがより効果的な方法かもしれません。
まとめ
印象的ながらも論争の的となっているデモを持つGoogleのGeminiは、この交差点に立っています。
Geminiのプレゼンテーションを扱うGoogleの次のステップは、同社の評判だけでなく、AI開発の将来の軌道にも大きな影響を与える可能性があります。
LEAVE A REPLY