2024年5月13日の25:00頃から行われたOpenAIによる、ChatGPTの最新アップデートのYoutubeライブを見ました。
OpenAI社の最新リリース情報はこちら
【POINT】
・テキストやビジョンの機能の向上
・生成された文章や音声がより人間らしく、まるで人と会話しているかのように感情も読み取れる
OpenAIは、新たな主力生成AIモデルであるGPT-4oをリリースし、数週間にわたって開発者および消費者向けの製品全体でその機能を展開する予定だそうです。
テキスト、ビジョン、およびオーディオ全体でGPT-4の機能を向上させると説明。
GPT-4の拡張版であるGPT-4 Turboは、画像とテキストの両方をトレーニングし、画像からテキストを抽出したり、画像の内容を説明したりするなどのタスクを実行します。一方、GPT-4oはスピーチを追加しています。
これにより、様々なことが可能になります!
ユーザーはGPT-4oを搭載したChatGPTに質問し、回答中にChatGPTを中断できます。OpenAIによると、このモデルはリアルタイムで応答し、ユーザーの声から感情を読み取り、様々な感情のスタイルで音声を生成することができます。
さらに、GPT-4oはChatGPTのビジョン機能も向上させます。写真やデスクトップ画面を使用してChatGPTに質問すると、関連する質問に迅速に回答できます。
例えば、数学の計算を手伝ってと話かけて、紙に鉛筆で「3x+1=4」と書くと、それを読みとり音声で解き方を教えていってくれます!※上記のYoutubeで実演されています!
GPT-4oはより多言語対応になり、50の異なる言語でのパフォーマンスが向上しているそうです。
当記事に対してのコメントをご記載くださいませ!
いただいたコメントは運営者で確認・承認後に反映いたします。誹謗中傷に繋がるような内容・その他不適切な内容と運営者の方で判断したコメントは削除させていただきます。