Giải pháp chuyển văn bản thành giọng nói của MobiFone

Xu hướng của nhiều hãng tin của các nước khác là ứng dụng trí tuệ nhân tạo, tích hợp giữa báo viết và báo nói.

Chuyển văn bản thành giọng nói (TTS – Text to Speech) là công nghệ mới xây dựng thương hiệu gần đây. Thay vì phải thu âm bằng người thật như trước, chỉ cần nhập nội dung, hệ thống sẽ tự động đọc lại văn bản.

MobiFone cho hay khoảng 5 tờ báo điện tử tại Việt Nam như Lao động, Người lao động, Đầu tư, Tuổi trẻ Thủ đô, Môi trường… đang áp dụng giải pháp TTS của nhà mạng này.

“Công nghệ này có thể phát âm những tiếng ngoài dữ liệu chuẩn, đồng thời đưa ra cách đọc các từ chưa chuẩn hoá theo ngữ cảnh một cách thông minh, dự đoán đọc từ viết tắt, từ mượn nước ngoài”, đại diện nhà mạng nói. Sản phẩm cho phép tất cả tòa soạn cập nhật từ điển, gồm các từ ngữ mới và các từ ngữ thường sử dụng theo đặc trưng của báo.

polyad

Công nghệ TTS của MobiFone.

Ứng dụng công nghệ trên nền tảng trí tuệ nhân tạo này đang tạo ra những trải nghiệm mới. Khi đang lái xe, việc tiếp cận thông tin trên báo chí sẽ dễ dàng hơn với kết nối qua bluetooth không dây. Theo MobiFone, ứng dụng này cũng phù hợp với người già và người khiếm thị thay bằng cách đọc báo phổ thông như trước đây.

Nhà mạng đưa ra thống kê, hiện có hơn 3 triệu người khiếm thị tại Việt Nam, trong đó 82% người khiếm thị nhận định đọc là một phần quan trọng trong cuộc sống. Tuy nhiên, chỉ 1% người khiếm thị có công dụng đọc được bằng chữ nổi. Người cao tuổi có thói quen nghe nhiều hơn đọc do thị lực giảm.

Một số chuyên gia công nghệ cho rằng, ứng dụng chuyển đổi văn bản thành giọng nói của MobiFone (MobiFone TTS) thể hiện rõ tính ưu việt, giọng nói nhân tạo có cảm xúc. Theo đó, MobiFone TTS xử lý được ngôn ngữ tiếng Việt theo nhiều cấp độ khác nhau, phù hợp quy chuẩn ngôn ngữ báo chí, các tòa soạn khác nhau với chất giọng tự nhiên, có cảm xúc gần giống giọng người thật.

Giải pháp cho các tòa soạn

Sản phẩm sử dụng công nghệ TTS được MobiFone nhận định là 1 trong công nghệ nền tảng của kỷ nguyên giao tiếp bằng giọng nói trong cuộc cách mạng 4.0. Do chỉ cần đầu vào là nội dung văn bản, hệ thống sẽ tự động chuyển đổi thành dạng audio. Từ đó các tòa soạn sẽ không phải có thêm nhân sự và thời gian để đọc từng bài báo, sau đó xử lý âm thanh qua các phần mềm phức tạp.

“Một số trong những yếu tố quan trọng mà giải pháp báo nói của MobiFone hướng tới là tính an toàn và tính ‘đọc đúng’ của báo nói”, Đại diện MobiFone cho biết. “Tiếng Việt mang nhiều ngữ cảnh và ý nghĩa, văn phong của mỗi báo cũng theo từng lĩnh vực mà hoàn toàn khác nhau. Vì vậy, giải pháp của MobiFone hướng tới không chỉ là giọng nói mà còn là hệ thống các từ điển, từ viết tắt, văn phạm, định dạng của mỗi báo”.

Theo đánh giá của giới chuyên gia, công nghệ TTS của MobiFone hứa hẹn mở ra những ứng dụng vô tận với hiệu năng mạnh mẽ, đáp ứng trong nhiều lĩnh vực như tổng đài với trợ lý ảo thông minh, giải pháp nhà thông minh, sản xuất nội dung thông minh…

Ngoài ra, mỗi cơ quan báo chí quá trình luyện tập công nghệ TTS của MobiFone sẽ tiết kiệm nhân sự, thời gian, chi phí để phát triển công nghệ tương tự; tối ưu hóa buổi giao lưu của nguồn nhân lực nhờ vào các máy móc tự động giao tiếp khách hàng, người dân…

“Hạt nhân” cho thành phố thông minh

Ứng dụng về công nghệ AI – TTS của MobiFone hiện tại gồm: tích hợp báo nói cho Cổng thông tin điện tử hoặc các site tin tức địa phương; thông báo thiên tai, cháy nổ, tình huống khẩn cấp qua hệ thống gọi tự động – Mobile Alert; tự động báo vi phạm giao thông; thông báo tình trạng giao thông qua radio một cách tự động, tích hợp với hệ thống giám sát giao thông thông minh…

“Tuy nhiên một số trong những ứng dụng thiết thực của công nghệ AI – TTS là nhằm xây dựng thành phố thông minh”, Đại diện MobiFone nói.

Mọi công nghệ AI – TTS của nhà mạng có đặc điểm nổi trội như: tự động xác định, nhận dạng mặt người, vật thể từ ảnh, video hoặc trực tiếp từ camera. Sử dụng trí thông minh nhân tạo để so sánh sự khác nhau và giống nhau các đặc điểm khuôn mặt chọn trước từ hình ảnh và cơ sở dữ liệu về khuôn mặt đã có từ trước. Ngưỡng chính xác mà công nghệ có thể nhận dạng lên tới 95% và có thể nhận diện từ nhiều năm về trước.

Trong ứng dụng nhằm xây dựng thành phố thông minh, công nghệ AI – TTS của MobiFone còn có thể ứng dụng để gia công các hệ thống giao thông thông minh, đếm các lưu lượng phương tiện tham gia giao thông nhằm giúp cho việc phân luồng được hiệu quả, hỗ trợ xử phạt nguội đối với những trường hợp vi phạm luật lệ giao thông qua việc nhận dạng các biển số xe.

Nhà mạng MobiFone kỳ vọng với các giải pháp mới ứng dụng trí tuệ nhân tạo có thể hỗ trợ các khối cơ quan chính quyền và doanh nghiệp trong việc giải quyết các vấn đề bức thiết hiện nay, khẳng định vai trò là 1 trong doanh nghiệp đi đầu về công nghệ và viễn thông.

Tuấn Vũ


Nguồn:vnexpress