Nvidiaは、Llama-3.1の高度なバージョンであるNemotronを発表しました。これは、GPT-4 を含む、より高度な人工知能(AI)モデルを凌駕するように設計されています。
洗練されたデータと革新的なハードウェアのおかげで、Nemotronは人工知能の分野で比類のないパフォーマンスを約束します。この記事ではすべての詳細を見ていきましょう。
Summary
NvidiaのNemotronは、前例のないAI計算能力のおかげでGPT-4oとClaude-3を超える
予告通り、Nvidiaはその新しいモデルの人工知能、Llama-3.1-Nemotron-70B-Instructを発表し、破壊的な影響を与えました。
このモデルは、Nvidiaによると、現在流通している最も先進的なAIシステムを超えることを約束しています。例えば、OpenAIのGPT-4oやAnthropicのClaude-3などです。
Nvidia AI DeveloperのアカウントからXに投稿された発表は、業界の専門家たちの注目をすぐに集めました。
Nemotronモデルは、MetaのLlama-3.1-70B-Instructの修正版であり、改良されたバージョンで、オープンソースのAIプラットフォームです。
Nvidiaによって行われた変更は、名前の「Nemotron」部分で強調されており、企業の重要な技術的貢献を反映しています。これにより、モデルはパワーと多様性の新たな高みに達しました。
基本的な考え方は、このモデルがNvidia自身によって開発された最先端のハードウェアインフラストラクチャと洗練されたチューニング作業のおかげで、GPT-4やClaude-3のようなより人気のあるモデルに比べてより「役に立つ」かつパフォーマンスが高い可能性があるということです。
Nemotronは、lmarenaとして知られるチャットボットのアリーナの文脈の中で生まれました。これは、さまざまな人工知能モデルが比較される場です。
Meta, の「Llama」と呼ばれるAIモデルシリーズは、Nvidiaがこの新しいシステムを構築するための基盤を提供しました。
主な目的は、開発者がさらなるカスタマイズを行えるようにするオープンソースのAIモデルを作成することでした。
それにもかかわらず、Nvidiaはそのリソースを投入して、業界のリーダーと競い合い、そして超えることができる人工知能システムを作成することを目指しました。
Nemotronを特徴付けるものは何ですか?
ネモトロンが浮上することを可能にした重要な要素の一つは、慎重に選ばれたデータセットと高度に洗練された調整プロセスの使用です。
Nvidiaは、最先端のハードウェアを使用して、その巨大な計算能力を活用し、モデルLlama-3.1-70Bをその初期の限界を超えて押し上げました。
これにより、AIのバージョンがより強力であるだけでなく、実用的な観点からもより「役立つ」ものを作成することができました。
人工知能の分野では、多くの解釈を持つことができる用語ですが、一般的にはモデルが関連性があり、正確で、タイムリーな回答を提供する能力を指します。
ベンチマーキングは、人工知能モデルの効果を評価するために使用される方法の一つです。しかし、「最高」のモデルを決定するための唯一かつ決定的な方法論は存在しません。
これは、AIモデルの有用性と効率性がしばしば主観的な評価と、それが使用されるコンテキストに依存するためです。
実際、ベンチマーキングは、さまざまなAIモデルを同じテストにかけ、得られた結果を有用性と精度の観点から評価することを指します。
Nemotronの場合、Nvidiaはその新しいモデルがGPT-4oやClaude-3を含む主要な競合他社を大きく上回っていると主張しています。
チャットボットのアリーナでの競争は激しく、Nemotronはランキングを上昇する準備ができているようです。
まだlmarenaの公式ランキングに完全には掲載されていないものの、Nvidiaはそのモデルが「Difficile」テストで85のスコアを獲得したと主張しています。確認されれば、この評価はこの特定のカテゴリのトップに位置することになります。
この結果は、Llama-3.1-70B、Nemotronの基盤が、Llama-3.1の405Bバージョンと比較して中程度のレベルのモデルであり、はるかに複雑で、パラメータの数が大幅に多いことを考慮すると、さらに注目に値します。
オープンソースのベースとその他のパラメーター
AIモデルの規模と複雑さを示すために、OpenAIの最も先進的なモデルの一つであるGPT-4oは、1兆以上のパラメーター で開発されました。
パラメータの数は、人工知能モデルのパワーと能力の主要な指標の一つです。
それにもかかわらず、NvidiaはGPT-4oと比較してパラメータの数が比較的少ないにもかかわらず、Nemotronのパフォーマンスを最大化することに成功したようです。
もう一つの興味深い点は、Nemotronのオープンソース基盤であり、多くの開発者コミュニティにアクセス可能であることです。
このオープンソースのアプローチは、人工知能の分野での進歩をさらに加速させる可能性があります。なぜなら、世界中の専門家がモデルの改善とカスタマイズに貢献できるからです。
さらに、Nvidiaが自社の作業をLlama-3.1のようなオープンソースプロジェクトに基づいて行うことを決定したという事実は、技術進歩における協力と共有された革新の重要性を示しています。