Công nghệ mới này hiện đang được xây dựng bởi Frank Soong, kỹ sư phần mềm của Microsoft, hợp tác với phòng nghiên cứu Microsoft Research Asia, phòng nghiên cứu phần mềm lớn thứ 2 của Microsoft, có trụ sở đặt tại Bắc Kinh, Trung Quốc.
"Công nghệ của chúng tôi sẽ nhận dạng ngôn ngữ của giọng nói, sau đó dịch đoạn hội thoại đó và cuối cùng trích xuất ra nội dung ở ngôn ngữ mới, nhưng cũng bằng chính giọng điệu của người đã nói" - Soong giải thích về cơ chế hoạt động phần mềm của mình.
Theo Soong, công nghệ của mình có thể sử dụng để xây dựng các phần mềm sử dụng để hỗ trợ sinh viên trong việc học tập các ngôn ngữ mới, cũng như giúp đỡ các vị khách du lịch trong việc chuyển đổi ngôn ngữ khi du lịch ra nước ngoài. Soong hy vọng sẽ sớm tích hợp công nghệ này vào các ứng dụng di động để giúp người dùng có thể sử dụng dễ dàng hơn ở bất kỳ đâu.
Soong cho biết hiện công nghệ này đang được xây dựng để hỗ trợ chuyển đổi giữa 26 ngôn ngữ khác nhau, bao gồm cả tiếng Anh, tiếng Quan Thoại, tiếng Tây Ban Nha, Ý… Hiện Microsoft chưa tiết lộ thời điểm công nghệ này sẽ được xây dựng hoàn tất và sẽ được áp dụng rộng rãi.
Trước đây, Google cũng đã cung cấp tính năng dịch nội dung từ giọng nói sang 1 ngôn ngữ khác tại dịch vụ Translate của mình, tuy nhiên kết quả thu được sau khi dịch giọng nói được nhập cũng chỉ là văn bản chứ không phải là một đoạn hội thoại khác như công nghệ mà Microsoft đang phát triển.
(theo Dantri/TechReview)