Bộ công cụ nhận dạng giọng nói end-to-end với mô hình SOTA mở: nhận dạng tiếng nói, phát hiện hoạt động giọng nói và hậu xử lý văn bản. Vẫn nằm trên trending, đạt 15k sao.
Ứng dụng
- Tự động ghi biên bản cuộc họp từ file ghi âm
- Tạo phụ đề và bản chép cho video, podcast
- Xây tổng đài/voice bot có nhận dạng giọng nói
- Bóc băng cuộc họp, phỏng vấn, cuộc gọi thành văn bản
- Tự động tạo phụ đề / transcript cho video, podcast
- Phân tích cuộc gọi chăm sóc khách hàng (call center)
- Tự động tạo phụ đề, bóc băng cuộc họp và phỏng vấn
- Xây tổng đài AI ghi và phân tích cuộc gọi
Hướng kiếm tiền: Cung cấp dịch vụ bóc băng hoặc tạo phụ đề tự động tính phí theo phút, hoặc bán API nhận dạng giọng nói cho ứng dụng khác.
⭐ 15k · xuất hiện 4 lần · nhóm: AI ứng dụng công việc
Repo liên quan
- datagouv-mcp — cùng tag: automation, data
- Huginn — cùng tag: automation, data
Được nhắc trong bản tin
Đi tiếp: Xem Tổng hợp giải pháp để tìm cách đóng gói repo này thành dịch vụ hoặc sản phẩm.
