Today's Brief

Cohere, 오픈 소스 음성 모델 출시… 전사 전용

Cohere가 Transcribe를 출시했습니다. 이는 전사 작업에 특화된 오픈 소스 자동 음성 인식 모델입니다. 20억 개의 파라미터로 제작되어 14개 언어를 지원하며 정확도에서 경쟁 모델을 능가합니다. Transcribe는 1분에 525분의 오디오를 처리하며 Cohere의 플랫폼 North에 통합되어 API를 통해 사용할 수 있습니다. 이는 음성 인식 기술에 대한 증가하는 수요를 반영하고 있습니다.

2026년 3월 26일Explorineer Edit

English 한국어 日本語 Tiếng Việt

핵심 정리

1
Cohere는 전사에 초점을 맞춘 첫 번째 음성 모델 Transcribe을 출시했습니다. 이 모델은 20억 개의 매개변수를 보유하고 있으며 소비자용 GPU에 적합하며 14개 언어를 지원합니다.
2
Transcribe은 Hugging Face 리더보드에서 Zoom Scribe 및 IBM Granite 4.0과 같은 경쟁 업체들을 능가하는 5.42의 단어 오류율(WER)을 달성했습니다.
3
강력한 성능에도 불구하고 Transcribe은 포르투갈어, 독일어 및 스페인어의 전사 작업에서 성능이 저조했습니다.
4
이 모델은 1분에 525분의 오디오를 처리할 수 있으며 높은 효율성을 나타냅니다.
5
Transcribe은 Cohere의 North 플랫폼에 통합될 예정이며 API를 통해 무료로 이용할 수 있을 것입니다.
6
Granola 및 Wispr Flow와 같은 애플리케이션으로 인한 음성 인식 도구에 대한 관심의 증가로 수요가 증가하고 있습니다.

Cohere의 Transcribe 소개는 음성 인식 분야에서 중요한 혁신으로, 사용자에게 효율적이고 다국어 지원 텍스트 전사 도구를 제공함으로써 비즈니스 어플리케이션에서 음성 기술의 역할이 더욱 중요해지고 있음을 강조합니다.