Mistral ra mắt mô hình mã nguồn mở mới cho việc tạo ra giọng nói

Công ty trí tuệ nhân tạo người Pháp Mistral vừa ra mắt một mô hình chuyển văn bản thành giọng nói mã nguồn mở mang tên Voxtral TTS, nhằm mục tiêu ứng dụng trên trí tuệ nhân tạo giọng nói trong hỗ trợ khách hàng và bán hàng. Hỗ trợ cả chín ngôn ngữ, mô hình này có khả năng điều chỉnh giọng nói cá nhân với ít mẫu mẫu văn bản, mang lại hiệu suất thời gian thực và tính năng hiện đại với chi phí thấp. Bước tiến này khiến cuộc cạnh tranh trở nên khốc liệt với các công ty như ElevenLabs và OpenAI.
Key Points
- Mistral đã phát hành Voxtral TTS, một mô hình chuyển văn bản thành giọng nói mã nguồn mở.
- Mô hình cho phép doanh nghiệp tạo ra các trợ lý thoại cho hỗ trợ khách hàng và bán hàng.
- Nó hỗ trợ chín ngôn ngữ, cho phép tùy chỉnh với các mẫu dưới năm giây.
- Các tính năng bao gồm việc lưu giữ giọng điệu tinh tế và thời gian phản hồi nhanh (90ms TTFA).
- RTF là 6x, cho thấy khả năng hiệu quả trong việc tạo ra âm thanh thời gian thực.
- Mục tiêu của Mistral là tạo ra một giải pháp giọng nói toàn diện cho doanh nghiệp.
Relevance
- Nhu cầu tăng vọt cho các giải pháp trí tuệ nhân tạo với giọng nói tự nhiên phản ánh xu hướng đến năm 2025 về các công nghệ nói tiến tiến.
- Phương pháp mã nguồn mở của Mistral phù hợp với sở thích ngày càng gia tăng cho các giải pháp trí tuệ nhân tạo doanh nghiệp có thể tùy chỉnh.
- Sự cạnh tranh trong lĩnh vực chuyển văn bản thành giọng nói phản ánh bức tranh trí tuệ nhân tạo tổng thể nơi các công cụ mã nguồn mở đang thu hút sự chú ý.
Mistral's Voxtral TTS đặt công ty vào vị trí là một đối thủ mạnh mẽ trên thị trường trí tuệ nhân tạo giọng nói, phục vụ doanh nghiệp với các tính năng tiên tiến và tập trung vào tùy chỉnh có thể thay đổi chiến lược tương tác với người dùng và hỗ trợ khách hàng.
