投稿一覧に戻る (株)アドバンスト・メディア【3773】の掲示板 2023/11/23〜2024/01/25 251 mou***** 2023年12月3日 06:19 >>250 ここには、創業以来集めた、とんでもない量のデータがあるわけですよ。「製品開発のために使わせて頂ければ、使用量を゙安くします」という形で顧客から買った言語、音声データが。多分、NICTの保有データが事前学習に使われ、ここのデータがファインチューニングやchatGPTでのwhisperにあたる部分を作るのに使われるのでしょう。 CEATECでも壮年のエンジニアにこの話題をぶつけてみました。「そこは社内でも話題になっているが、まだ具体的には始まっていない」という答えでした。エンジニアは嘘を付けない人が多いから、本当じゃないかな。10月の時点では個別企業等向けの開発には入っていない。鼻歌混じりで膨大なデータから個人情報にあたる部分などを゙切り取って準備している段階と思います。 そう思う10 そう思わない10 開く お気に入りユーザーに登録する 無視ユーザーに登録する 違反報告する 証券取引等監視委員会に情報提供する ツイート 投稿一覧に戻る
mou***** 2023年12月3日 06:19
>>250
ここには、創業以来集めた、とんでもない量のデータがあるわけですよ。「製品開発のために使わせて頂ければ、使用量を゙安くします」という形で顧客から買った言語、音声データが。多分、NICTの保有データが事前学習に使われ、ここのデータがファインチューニングやchatGPTでのwhisperにあたる部分を作るのに使われるのでしょう。
CEATECでも壮年のエンジニアにこの話題をぶつけてみました。「そこは社内でも話題になっているが、まだ具体的には始まっていない」という答えでした。エンジニアは嘘を付けない人が多いから、本当じゃないかな。10月の時点では個別企業等向けの開発には入っていない。鼻歌混じりで膨大なデータから個人情報にあたる部分などを゙切り取って準備している段階と思います。