
핵심 정리
- 1
Cohere đã ra mắt mô hình giọng nói đầu tiên của mình, Transcribe, tập trung vào việc chuyển văn bản. Mô hình này có 2 tỷ tham số, phù hợp với GPU cấp tiêu dùng và hỗ trợ 14 ngôn ngữ.
- 2
Transcribe đạt được tỷ lệ lỗi từ 5,42, vượt trội so với các đối thủ như Zoom Scribe và IBM Granite 4.0 trên bảng xếp hạng của Hugging Face.
- 3
Mặc dù có hiệu suất mạnh mẽ, Transcribe lại thiếu hiệu quả trong việc chuyển văn bản tiếng Bồ Đào Nha, Đức và Tây Ban Nha.
- 4
Mô hình này có thể xử lý 525 phút âm thanh trong một phút, cho thấy khả năng hiệu quả cao.
- 5
Transcribe đang được lên kế hoạch tích hợp vào nền tảng North của Cohere và sẽ được cung cấp miễn phí thông qua API.
- 6
Sự quan tâm gia tăng về các công cụ nhận dạng giọng nói đang thúc đẩy nhu cầu cho các ứng dụng như Granola và Wispr Flow.
관련 태그


