Today's Brief

Cohere、トランスクリプション専用のオープンソース音声モデルを発表

Cohereは、トランスクライブというオープンソースの自動音声認識モデルを発表しました。このモデルは、転写タスクに特化しており、20億のパラメータを持ち、14の言語をサポートしており、競合するモデルよりも高い精度を誇っています。トランスクライブは、1分間に525分間の音声を処理し、CohereのプラットフォームであるNorthに統合される予定であり、API経由でもアクセス可能です。これは音声認識技術への需要の増加を反映しています。

2026年3月26日Explorineer Edit

English 한국어 日本語 Tiếng Việt

핵심 정리

1
Cohereは、転写に焦点を当てた最初の音声モデルであるTranscribeを発表しました。このモデルには20億のパラメータがあり、消費者向けのGPUに適しており、14の言語をサポートしています。
2
Transcribeは、Hugging FaceのleaderboardでZoom ScribeやIBM Granite 4.0などの競合他社を上回る5.42の単語エラー率（WER）を達成しました。
3
強力な性能にもかかわらず、Transcribeはポルトガル語、ドイツ語、スペイン語の転写で不振でした。
4
このモデルは1分間に525分のオーディオを処理できるため、高い効率を示しています。
5
Transcribeは、CohereのNorthプラットフォームに統合する予定であり、APIを介して無料で利用できる予定です。
6
GranolaやWispr Flowなどのアプリケーションの需要が高まっていることから、音声認識ツールへの関心が高まっています。

CohereのTranscribeの導入は、音声認識技術の重要な革新であり、ユーザーに効率的で多言語対応の転写ツールを提供すると同時に、ビジネスアプリケーションでの音声技術の成長する役割を強調しています。