AIの音声対話、人間並みに=年内投入、オープンAIに対抗―米グーグル

5/15 7:00 配信

時事通信

 【シリコンバレー時事】米グーグルは14日、米カリフォルニア州で開発者会議を開き、生成AI(人工知能)の音声対話能力を人間並みに引き上げる「プロジェクト・アストラ」を発表した。質問への応答を速め、音声や動画を交えた状況認識能力も向上した「AIアシスタント」を作る。年後半から一部機能を段階的に投入する。
 「チャットGPT」を手掛ける米オープンAIも13日、音声対話の速度を人間と同等にした新モデルを発表した。質問から応答までの時間を短縮し、使いやすさを高める競争が本格化している。
 グーグルは生成AIの基盤モデル「ジェミニ」に軽量版「1.5フラッシュ」を加え、開発者向けに試験公開した。汎用(はんよう)モデルの「1.5プロ」から重要な知識を移し、回答精度と効率性を両立させた。1.5プロは消費者向けの有料サービス「ジェミニ・アドバンスト」で提供を開始。日本語など35言語で使える。
 アストラの技術を使い、スマートフォンのカメラで写した映像を認識し、質問に回答する機能「ジェミニ・ライブ」も発表した。数カ月以内にアドバンストで提供を始める。デモ動画では、オフィス内を撮影しながらジェミニに眼鏡の場所を尋ねると「デスクの上でリンゴの近く」と音声で答えた。
 AI研究・開発部門グーグル・ディープマインドのハサビス最高経営責任者(CEO)は「文脈をより理解し、迅速に応答することでより自然な対話ができる」と述べた。 

時事通信

関連ニュース

最終更新:5/15(水) 14:00

時事通信

最近見た銘柄

ヘッドラインニュース

マーケット指標

株式ランキング