DeepMindは本日、600を超えるさまざまなタスクを実行できる新しいマルチモーダルAIシステムを発表しました。
ガトと呼ばれるこのキットは、間違いなく、世界でこれまでに見られた中で最も印象的なオールインワンの機械学習キットです。
DeepMindによると ブログ投稿:
私たちがGatoと呼ぶエージェントは、マルチモーダル、マルチタスク、マルチボディのジェネラリストポリシーとして機能します。 同じ重みの同じネットワークで、Atari、キャプション画像、チャット、実際のロボットアームとのスタックブロックなどを再生でき、コンテキストに基づいて、テキスト、ジョイントトルク、ボタンの押下、またはその他のトークンを出力するかどうかを決定します。
そして、DeepMindラボの外部の研究者やユーザーがそれを手に入れたら、それがどれほどうまくいくかはまだわかりませんが、GatoはGPT-3が望むすべてのものであるように見えます。
これが私を悲しませている理由です: GPT-3は、世界で最も資金が豊富な人工知能(AGI)企業であるOpenAIによって作成された大言語モデル(LLM)です。
ただし、GPT-3とGatoを比較する前に、OpenAIとDeepMindの両方がビジネスとしてどこから来ているのかを理解する必要があります。
OpenAIはElonMuskの発案によるものであり、Microsoftからの数十億のサポートがあり、米国政府は基本的に規制と監視に関しては何をしているのかを気にする必要がありません。
OpenAIの 唯一の目的 AGI(同じアクセス権が与えられれば、人間ができることを何でも実行して学習できるAI)を開発および制御することですが、会社が何とか作成したすべてが本当に素晴らしいLLMであるのは少し怖いです。
誤解しないでください、GPT-3は印象的です。 実際、DeepMindのGatoとほぼ同じくらい印象的ですが、その評価には微妙な違いが必要です。
OpenAIは、単純な理由でAGIへのパスでLLMルートを失いました。AGIを機能させる方法を誰も知らないのです。
火事の発見から内燃機関の発明までに時間がかかったように、深層学習からAGIへの移行方法を理解することは一夜にして起こりません。
GPT-3は、少なくとも人間のように見える何かを実行できるAIの例です。つまり、テキストを生成します。
DeepMindがGatoで行ったことは、まあ、ほとんど同じことです。 それは、LLMのように機能するものを採用し、600以上の形式の名声を得ることができる奇術師に変えました。
ナイフとペイントブラシの研究集団のマイク・クックとして、 最近言った TechCrunchのKyleWiggers:
AIがこれらすべてのタスクを実行できることは非常にエキサイティングなことのように聞こえます。これは、テキストの記述がロボットの制御とは非常に異なるように思われるためです。
しかし実際には、これは通常の英語のテキストとPythonコードの違いを理解しているGPT-3とそれほど違いはありません。
これが簡単だと言っているわけではありませんが、外部の観察者には、AIがお茶を飲んだり、他の10〜50のタスクを簡単に学んだりできるように聞こえるかもしれませんが、それはできません。
基本的に、GatoとGPT-3はどちらも堅牢なAIシステムですが、どちらも一般的なインテリジェンスには対応していません。
これが私の問題です: 運のランダムな行為の結果として出現するAGIでのギャンブルを除いて、映画 短絡 頭に浮かぶのは、おそらく誰もがAGIのタイムラインを再評価するときです。
私は「決して」とは言いません。なぜなら、それは科学で唯一の呪われた言葉の1つだからです。 しかし、これはAGIが私たちの生涯で起こらないように思わせます。
DeepMindは10年以上AGIに取り組んでおり、2015年からOpenAIに取り組んでいます。また、どちらもAGIを解決するための最初の問題、つまりトレーニングなしで新しいことを学ぶことができるAIの構築に取り組むことができませんでした。
ガトは世界で最も先進的なマルチモーダルAIシステムになると思います。 しかし、DeepMindは、OpenAIと同じAGIの行き止まりの概念を採用しており、単に市場性を高めただけだと思います。
最終的な考え: DeepMindが行ったことは注目に値するものであり、おそらく会社に大金を稼ぐために成功するでしょう。
私がAlphabet(DeepMindの親会社)のCEOである場合、私はGatoを純粋な製品としてスピンアウトするか、DeepMindを研究よりも開発に向けて推進しています。
Gatoは、Alexa、Siri、またはGoogleアシスタント(適切なマーケティングと適切なユースケースを使用)よりも、消費者市場でより有利に機能する可能性があります。
しかし、GatoとGPT-3は、上記の仮想アシスタントほどAGIの実行可能なエントリポイントではありません。
Gatoの複数のタスクを実行する機能は、600の異なる方法でプレイできるゲームというよりも、600の異なるゲームを保存できるビデオゲームコンソールのようなものです。 これは一般的なAIではなく、事前にトレーニングされた狭いモデルがきちんとバンドルされたものです。
それがあなたが探しているものなら、それは悪いことではありません。 しかし、ガトの伴侶には何もありません 研究論文 これは、AGIにとって正しい方向を一目見ただけであり、踏み石ではないことを示しています。
ある時点で、DeepMindやOpenAIなどの企業が、AGIがすぐそこにあるという鋭い目での主張を通じて生み出した善意と資本は、ほんのわずかな配当さえも示さなければならないでしょう。
The post DeepMindの新しいGatoAIは、人間がAGIを達成することは決してないだろうと私に恐れさせます appeared first on Gamingsym Japan.