インドのAIラボSarvamが新モデルを発表、オープンソースAIの実用性への大きな賭け

インドのAI研究所Sarvamは、インドAIインパクトサミットで新しい大規模言語モデルを発表しました。これらのモデルは、30Bおよび105Bのパラメータを利用し、専門家のミックス構造を採用しています。Sarvamのアプローチは、効率性と実世界への応用に重点を置いており、地元の言語に合わせたオープンソースの選択肢を提供することで、米国や中国の企業と競合する意向です。これらのモデルは、幅広いデータソースで訓練されており、将来的にはオープンソース化する予定です。
Key Points
- Sarvamは、それぞれ30 billionと105 billionのパラメータを持つ新しい言語モデルを発表しました。
- これらのモデルは、効率的なオープンソースの代替案を提供することで大手競合他社からの市場シェアを確保することを目指しています。
- 新しいモデルは、インドの言語に焦点を当てて数兆トークンを使ってゼロから訓練されました。
- 30Bモデルはリアルタイムの対話サポートを提供し、105Bモデルは複雑な推論をサポートしています。
- これらのモデルは、インドAIミッションのもとで政府の支援を受け、YottaとNvidiaのインフラを利用して開発されました。
- Sarvamは両モデルをオープンソース化し、単なる規模ではなく実用的なアプリケーションに焦点を当てる予定です。
Relevance
- Sarvamのローンチは、オープンソースのソリューションとAIの言語ローカライゼーションを重視する現在のトレンドと合致しており、発展途上国にとって重要です。
- 2025年現在、特定の市場向けにアクセス可能でカスタマイズされたAIモデルへの傾向が高まっており、外国の技術への依存を減らしています。
- 歴史的にインドは技術的独立を高めることを目指しており、この展開はより大きな国家戦略の一環となっています。
Sarvamの新しいAIモデルは、成長しているオープンソースのAI分野における戦略的な動きを示しており、効率性とローカライゼーションに焦点を当てています。これは、インドおよびその他の地域におけるAIテクノロジーの競争力に重要な影響を与える可能性があります。
