
핵심 정리
- 1
Cohere는 전사에 초점을 맞춘 첫 번째 음성 모델 Transcribe을 출시했습니다. 이 모델은 20억 개의 매개변수를 보유하고 있으며 소비자용 GPU에 적합하며 14개 언어를 지원합니다.
- 2
Transcribe은 Hugging Face 리더보드에서 Zoom Scribe 및 IBM Granite 4.0과 같은 경쟁 업체들을 능가하는 5.42의 단어 오류율(WER)을 달성했습니다.
- 3
강력한 성능에도 불구하고 Transcribe은 포르투갈어, 독일어 및 스페인어의 전사 작업에서 성능이 저조했습니다.
- 4
이 모델은 1분에 525분의 오디오를 처리할 수 있으며 높은 효율성을 나타냅니다.
- 5
Transcribe은 Cohere의 North 플랫폼에 통합될 예정이며 API를 통해 무료로 이용할 수 있을 것입니다.
- 6
Granola 및 Wispr Flow와 같은 애플리케이션으로 인한 음성 인식 도구에 대한 관심의 증가로 수요가 증가하고 있습니다.
관련 태그
Transcribe 서비스 출시는 다양한 분야에서 AI 기반 전사 서비스의 채용 증가 트렌드와 일치한다.2025년까지 AI 기술, 특히 자연어 처리 및 음성 인식 기술이 비즈니스 프로세스에서 중요한 역할을 할 것으로 예상되어 생산성을 향상시킬 것으로 예측된다.Cohere의 모델은 기업들이 비용 효율적이고 높은 성능의 솔루션을 찾는 가운데 AI 경쟁 환경에 기여하고 있다.


