もっと詳しく

この記事は、最新の記事の一部です。 AI研究

人間にとって、変形可能なオブジェクトの操作は、硬いオブジェクトの処理よりもそれほど難しくありません。 私たちは自然にそれらを形作り、折り畳み、さまざまな方法で操作し、それでもそれらを認識することを学びます。

しかし、ロボットや人工知能システムの場合、変形可能なオブジェクトを操作することは大きな課題です。 生地のボールをピザの皮に形作るためにロボットが取らなければならない一連のステップを考えてみてください。 生地の形が変化するのを追跡すると同時に、作業の各ステップに適したツールを選択する必要があります。 これらは、より予測可能な状態を持つ剛体オブジェクトの処理においてより安定している現在のAIシステムにとって困難なタスクです。

ヒューマノイドのご挨拶

今すぐ購読して、お気に入りのAIストーリーの毎週の要約をご覧ください

現在、MIT、カーネギーメロン大学、カリフォルニア大学サンディエゴ校の研究者によって開発された新しい深層学習技術は、変形可能なオブジェクトの処理においてロボットシステムをより安定させる可能性を示しています。 と呼ばれる DiffSkill、この手法では、深いニューラルネットワークを使用して単純なスキルを学習し、スキルを組み合わせて複数のステップとツールを必要とするタスクを解決するための計画モジュールを使用します。

強化学習と深層学習による変形可能なオブジェクトの処理

AIシステムがオブジェクトを処理する場合は、その状態を検出して定義し、将来どのように見えるかを予測できる必要があります。 これは、リジッドオブジェクトで大部分が解決された問題です。 トレーニング例の良いセットで、 ディープニューラルネットワーク さまざまな角度から剛体を検出できるようになります。 ただし、変形可能なオブジェクトに関しては、可能な状態の空間ははるかに複雑になります。

「剛体の場合、その状態を6つの数字で表すことができます。XYZ座標を表す3つの数字と、方向を表す3つの数字です」Xingyu Lin、Ph.D. CMUの学生であり、DiffSkill論文の筆頭著者であると、TechTalksに語った。

「しかし、生地や布などの変形可能なボディには無限の自由度があるため、それらの状態を正確に記述することははるかに困難です。 さらに、それらが変形する方法も、剛体と比較して数学的な方法でモデル化するのが困難です。」

微分可能な物理シミュレータの開発により、変形可能なオブジェクト操作タスクを解決するための勾配ベースの方法の適用が可能になりました。 これは、従来の方法とは対照的です 強化学習 純粋な試行錯誤の相互作用を通じて環境とオブジェクトのダイナミクスを学習しようとするアプローチ。

DiffSkillはに触発されました PlasticineLab、2021年のICLR会議で発表された微分可能な物理シミュレータ。PlasticineLabは、微分可能なシミュレータが短期間のタスクに役立つことを示しました。

PlasticineLabは、変形可能なオブジェクト用の微分可能な物理ベースのシミュレータです。 勾配ベースのモデルのトレーニングに適しています。