Cohere, 오픈 소스 음성 모델 출시… 전사 전용

Cohere, 오픈 소스 음성 모델 출시… 전사 전용

Cohere가 Transcribe를 출시했습니다. 이는 전사 작업에 특화된 오픈 소스 자동 음성 인식 모델입니다. 20억 개의 파라미터로 제작되어 14개 언어를 지원하며 정확도에서 경쟁 모델을 능가합니다. Transcribe는 1분에 525분의 오디오를 처리하며 Cohere의 플랫폼 North에 통합되어 API를 통해 사용할 수 있습니다. 이는 음성 인식 기술에 대한 증가하는 수요를 반영하고 있습니다.

Key Points

  • Cohere는 전사에 초점을 맞춘 첫 번째 음성 모델 Transcribe을 출시했습니다. 이 모델은 20억 개의 매개변수를 보유하고 있으며 소비자용 GPU에 적합하며 14개 언어를 지원합니다.
  • Transcribe은 Hugging Face 리더보드에서 Zoom Scribe 및 IBM Granite 4.0과 같은 경쟁 업체들을 능가하는 5.42의 단어 오류율(WER)을 달성했습니다.
  • 강력한 성능에도 불구하고 Transcribe은 포르투갈어, 독일어 및 스페인어의 전사 작업에서 성능이 저조했습니다.
  • 이 모델은 1분에 525분의 오디오를 처리할 수 있으며 높은 효율성을 나타냅니다.
  • Transcribe은 Cohere의 North 플랫폼에 통합될 예정이며 API를 통해 무료로 이용할 수 있을 것입니다.
  • Granola 및 Wispr Flow와 같은 애플리케이션으로 인한 음성 인식 도구에 대한 관심의 증가로 수요가 증가하고 있습니다.

Relevance

  • Transcribe 서비스 출시는 다양한 분야에서 AI 기반 전사 서비스의 채용 증가 트렌드와 일치한다.
  • 2025년까지 AI 기술, 특히 자연어 처리 및 음성 인식 기술이 비즈니스 프로세스에서 중요한 역할을 할 것으로 예상되어 생산성을 향상시킬 것으로 예측된다.
  • Cohere의 모델은 기업들이 비용 효율적이고 높은 성능의 솔루션을 찾는 가운데 AI 경쟁 환경에 기여하고 있다.

Cohere의 Transcribe 소개는 음성 인식 분야에서 중요한 혁신으로, 사용자에게 효율적이고 다국어 지원 텍스트 전사 도구를 제공함으로써 비즈니스 어플리케이션에서 음성 기술의 역할이 더욱 중요해지고 있음을 강조합니다.

Download the App

Stay ahead in just 10 minutes a day

Article ID: a71973b6-dae1-4e70-88bb-d781a73e210c