OpenAIの開発者カンファレンス「DevDay」での発表

OpenAIの開発者カンファレンス「DevDay」での発表

11月7日に開催されたOpenAIの年次カンファレンス「DevDay」は、AIコミュニティの開発者や愛好家にとって一大イベントであり、最新のイベントも例外ではありませんでした。

この日は、AIの能力とアクセス性を新たな高みに押し上げることが確実な発表でいっぱいでした。

GPT-4 Turbo with 128K Context

新しいGPT-4 Turboモデルは、300ページ以上のテキストを収容できるコンテキストウィンドウを備えた大幅なアップグレードであり、より広範で微妙な対話を可能にします。

このモデルは、2023年4月までの知識を持つだけでなく、入力トークンが従来のGPT-4モデルよりも3倍安く、出力トークンが2倍安いというコスト効率の良さも特徴です。

Assistants API

Assistants APIは画期的な追加機能であり、開発者がタスクを実行し、モデルやツールを呼び出すAIアプリを簡単に構築できるようにします。

このAPIは、Pythonコードの実行、グラフの生成、さまざまなデータ形式の処理など、複雑なタスクを処理するように設計されており、開発者が作成できる範囲を効果的に広げます。

マルチモーダル機能

OpenAIは、視覚、画像作成(DALL·E 3)、およびテキストから音声への変換(TTS)機能を含むマルチモーダル機能をプラットフォームに拡張しています。

これらの機能は、視覚障害者を支援することからブランドのためのオーダーメイド画像の作成まで、AIが世界とどのように対話するかを革命的に変えることになるでしょう。

関数呼び出しとJSONモード

関数呼び出し機能は、単一のメッセージで複数の関数を許可するように強化され、指示に従い有効なJSONを出力するモデルの能力を向上させました。

これは、関数呼び出しの外部でJSON応答を生成する必要がある開発者にとって特に便利です。

再現可能な出力とログ確率

新しい「seed」パラメータが導入され、デバッグやユニットテストの作成に不可欠な一貫した出力を可能にしました。さらに、OpenAIはまもなく、検索エクスペリエンスでのオートコンプリートなどの機能開発を支援する、最も可能性の高い出力トークンのログ確率を返す機能を立ち上げる予定です。

更新されたGPT-3.5 Turbo

GPT-4 Turboに加えて、OpenAIは16Kコンテキストウィンドウを備えたGPT-3.5 Turboの更新版をリリースしました。

このモデルは、12月11日までにgpt-3.5-turbo名を使用するアプリケーションで自動的にアップグレードされる予定です。

モデルのカスタマイズ

OpenAIは、GPT-4の微調整への実験的アクセスと、組織が特定のモデルを必要とするカスタムモデルプログラムを提供しています。

このプログラムにより、非常に大規模な独自のデータセットを持つドメイン(最小でも数十億のトークン)に対して、広範なカスタマイズが可能になります。

価格の引き下げとレートリミットの引き上げ

開発者にとって歓迎される動きとして、OpenAIはプラットフォーム全体で価格を引き下げ、GPT-4の顧客向けにレートリミットを増やしました。
これにより、これらの強力なツールをよりアクセスしやすく、スケーラブルにしています。

モデル名 旧モデルの価格 新モデルの価格
GPT-4ターボ 8K 入力: $0.03 出力: $0.06 ターボ 128K 入力: $0.01 出力: $0.03
GPT-4 32K 入力: $0.06 出力: $0.12
GPT-3.5ターボ 4K 入力: $0.0015 出力: $0.002 16K 入力: $0.001 出力: $0.002
GPT-3.5 ターボ 16K 入力: $0.003 出力: $0.004
GPT-3.5ターボ微調整 4K トレーニング: $0.008 入力: $0.012 出力: $0.016 4K および 16K 微調整 トレーニング: $0.008 入力: $0.003 出力: $0.006

この表は、旧モデルと新モデルの価格を比較するためのものです。新モデルでは、特にGPT-4ターボとGPT-3.5ターボの価格が低下していることがわかります。また、GPT-3.5ターボ微調整では、新モデルで入力と出力の価格が下がっている一方で、トレーニングの価格は変わっていません。

著作権保護

顧客を保護するために、OpenAIはCopyright Shieldを導入しました。これは、著作権侵害に関する法的な請求に直面した場合、顧客を守り、費用をカバーするものです。

Whisper v3とConsistency Decoder

Whisper large-v3のリリースは、言語を横断した自動音声認識の改善を示しています。オープンソース化されたConsistency Decoderは、Stable Diffusion 1.0+ VAEと互換性のある画像を強化することになるでしょう。

まとめ

こうした新サービスの登場により、テキスト・画像・音声を高度に処理できるAIの活用シーンが大きく広がることが期待されています。
時代は開発者がAIを上手く利用する力が問われる段階に入ったと言えそうです。OpenAIの発表内容をベースに、AIを使ったサービス開発競争が一層活発になりそうです。


LEAVE A REPLY

*
*
* (公開されません)