投稿一覧に戻る エヌビディア【NVDA】の掲示板 2024/05/03〜2024/05/06 875 yos***** 5月6日 17:06 Githubで見つけたんですけど、NVIDIAは次はロボットのLLM?をはじめたみたいですよ。 「DrEureka」。 ドクターエウレカかドクターユリイカ。呼び方はわかりませんが。 https://github.com/eureka-research/DrEureka シミュレーションで学習したポリシーを現実世界に移すことは、ロボットのスキルを大規模に習得するための有望な戦略です。ただし、シミュレーションからリアルへのアプローチは通常、タスク報酬関数とシミュレーション物理パラメータの手動設計と調整に依存しており、プロセスが遅くなり、人的労力が集中します。このペーパーでは、大規模言語モデル (LLM) を使用してシミュレートからリアルへの設計を自動化および高速化する方法について調査します。 LLM ガイドによる sim-to-real アプローチでは、ターゲット タスクの物理シミュレーションのみが必要で、現実世界の転送をサポートするために適切な報酬関数とドメインのランダム化分布を自動的に構築します。まず、四足歩行や器用な操作タスクにおいて、人間が設計した既存の構成と競合するシミュレーションと現実の構成を発見できるアプローチを実証します。次に、私たちのアプローチが、反復的な手動設計を行わずに、四足歩行のバランスやヨガ ボールの上での歩行などの新しいロボットのタスクを解決できることを示します。 そう思う13 そう思わない0 開く お気に入りユーザーに登録する 無視ユーザーに登録する 違反報告する 証券取引等監視委員会に情報提供する ツイート 投稿一覧に戻る
yos***** 5月6日 17:06
Githubで見つけたんですけど、NVIDIAは次はロボットのLLM?をはじめたみたいですよ。
「DrEureka」。
ドクターエウレカかドクターユリイカ。呼び方はわかりませんが。
https://github.com/eureka-research/DrEureka
シミュレーションで学習したポリシーを現実世界に移すことは、ロボットのスキルを大規模に習得するための有望な戦略です。ただし、シミュレーションからリアルへのアプローチは通常、タスク報酬関数とシミュレーション物理パラメータの手動設計と調整に依存しており、プロセスが遅くなり、人的労力が集中します。このペーパーでは、大規模言語モデル (LLM) を使用してシミュレートからリアルへの設計を自動化および高速化する方法について調査します。 LLM ガイドによる sim-to-real アプローチでは、ターゲット タスクの物理シミュレーションのみが必要で、現実世界の転送をサポートするために適切な報酬関数とドメインのランダム化分布を自動的に構築します。まず、四足歩行や器用な操作タスクにおいて、人間が設計した既存の構成と競合するシミュレーションと現実の構成を発見できるアプローチを実証します。次に、私たちのアプローチが、反復的な手動設計を行わずに、四足歩行のバランスやヨガ ボールの上での歩行などの新しいロボットのタスクを解決できることを示します。