投稿一覧に戻る
(株)アドバンスト・メディア【3773】の掲示板 2024/01/26〜2024/04/03
-
641
>>640
山積みになって埃をかぶっている書類と議事録などの音声データ。
今生成AIの゙研究者界隈で大騒ぎになっているのが、マイクロソフトが一昨日出した論文。詳細は「Microsoft 1.58bit」でも検索窓に入れれば分かりますが、今は世界中で争奪戦になっているGPUが、先々は要らなくなるという衝撃的なお話。勿論、今すぐではないが、基盤からデータに関心が移るのは意外と早いかも。
poi 3月1日 22:17
さくらインターネットは、エヌビディアのGPUを搭載し生成AIの大規模言語モデルが機能するいわばハードの環境整備に貢献する。
ここAMIは、生成AIの大規模言語モデルが機能するための三要素の一つの音声言語のマテリアルを提供する役割を果たす。生成AIのために構築する大規模言語モデルのほとんどは業界特化型。
業界特化型の音声認識エンジン、音声認識API
で過去に蓄積した、そして現在進行形で蓄積された莫大な業界ごとの音声言語データ。
これがいわばマテリアルとして大規模言語モデルを機能させるために必要となる。
日本において、業界ごとに莫大な言語データを
ちくせきした会社はここしかおそらくない。
各企業が大規模言語モデルの構築に専心するなか、このマテリアルの必要性に気づいたとき
各企業がこのマテリアルに羨望のまなざしを
もつことになる。
おそらく、音声データというマテリアルに関していえばとくに業界ごとの音声データでいえば
ここ以外には、日本には見つからないない。
その気づきがいつかだけの問題であると
思います。