Vlastimil Gular đã có bước ngoặt không mong đợi. 1 năm trước, ca phẫu thuật dây thanh quản cho biết anh bị ung thư vòm họng dẫn đến mất giọng. Tuy nhiên, người đàn ông 51 tuổi đã có 4 con này vẫn đang trò chuyện bằng giọng nói của mình chứ không phải sử dụng robot nhờ một ứng dụng có tính sáng tạo được 2 đại học ở Cộng hòa Czech phát triển. "Tôi nhận thấy ứng dụng này rất hữu ích", Gular cho biết về việc sử dụng ứng dụng để nói những gì ông muốn nói thông qua một điện thoại di động.
Ngoài ông Vlastimil Gular, một người phụ nữ khác có tên Jana Huttova đang trong quá trình thu âm giọng nói của mình trước một ca phẫu thuật nhỏ ở cổ họng. "Nếu sau ca phẫu thuật, tôi không thể nói lại được, tôi muốn những đứa con của tôi vẫn được nghe thấy giọng của mẹ chúng chứ không phải là từ một người máy", Jana Huttova chia sẻ.
Thiết bị silicon nhỏ gọn được cấy vào cổ họng cho phép ấn tay vào để điều chỉnh luồng khí qua thiết bị và tạo ra giọng nói.
Đây là dự án chung của Đại học Tây Bohemia ở Pilsen, Đại học Charles ở Prague cùng với 2 công ty tư nhân CertiCon và TechSpeech-được khởi động gần 2 năm trước. Công nghệ dùng để ghi âm giọng nói của bệnh nhân tạo ra lời nói tổng hợp có thể phát trên điện thoại di động, máy tính bảng hoặc máy tính xách tay thông qua ứng dụng.
Để hoàn thiện, bệnh nhân cần ghi hơn 10.000 câu hội thoại để cung cấp cho các nhà khoa học có đủ tài liệu tạo ra ứng dụng giọng nói. Nó có thể hoạt động trên điện thoại hay máy tính bảng thông qua một ứng dụng thông minh. Người dùng chỉ cần gõ ý mình muốn diễn đạt trên điện thoại, ứng dụng sẽ giúp họ thể hiện bằng lời nói.
Thiết bị silicon nhỏ gọn được cấy vào cổ họng cho phép người đàn ông nói bằng cách ấn tay vào để điều chỉnh luồng khí qua thiết bị và tạo ra giọng nói. Ứng dụng được phát triển dành cho bệnh nhân mất giọng sau khi phẫu thuật cắt bỏ thanh quản - một loại thủ thuật y khoa điển hình dành cho ung thư vòm họng giai đoạn tiến triển.
"Chúng tôi cùng nhau điều chỉnh thanh điệu riêng của từng người, do đó, chúng tôi cần nhiều câu đối thoại mẫu", ông Jindrich Matousek - một chuyên gia về ứng dụng văn bản chuyển thành giọng nói, giọng nói mô hình và âm thanh học, chủ nhiệm dự án tại Đại học Pilsen cho biết.
Thông thường, bệnh nhân sẽ cần ghi âm lại hơn 10.000 câu nói để tạo ra dữ liệu giọng nói tổng hợp của mình. "Bạn sử dụng thiết bị tạo giọng nói với các tham số nhất định để tạo ra giọng nói tổng hợp. Có nhiều dữ liệu vẫn tốt hơn, nhưng bạn có thể đạt chất lượng tốt khi có ít dữ liệu", ông Matouseck chia sẻ.
"Ứng dụng này cũng hướng dẫn người sử dụng tự tạo ra âm thanh và giọng nói cho riêng mình trong trường hợp cần thiết. Các câu được lựa chọn cẩn thận và âm vực từng cá nhân được ghi lại nhiều lần vì chúng được phát âm khác nhau bên cạnh âm điệu khác nhau hoặc khi bắt đầu hoặc khi kết thúc", ông cho biết thêm.
Tuy đã có các bước tiến nhảy vọt kể trên, song các chuyên gia cũng nhận định công nghệ dùng để ghi âm giọng nói có những hạn chế: Bệnh nhân chuẩn bị phẫu thuật cắt thanh quản thường có ít thời gian hoặc đủ sức lực để thực hiện bản ghi âm sau khi được chẩn đoán cần điều trị khẩn cấp.
"Thường phải mất vài tuần", Barbora Repova - một Giám đốc của Bệnh viện Đại học Motol đang phát triển dự án cho Đại học Charles cho biết. "Bệnh nhân cũng phải giải quyết các vấn đề như tình hình kinh tế, đời sống của họ sẽ bị đảo lộn và điều cuối cùng mà họ cần phải làm là ghi âm", bà cho biết thêm. Để giải quyết khó khăn này, các nhà khoa học đưa ra một phương pháp hợp lý hơn cho ứng dụng được hỗ trợ bởi Bộ Công nghệ Cộng hòa Czech.
Cho đến nay, các nhà khoa học không chỉ thu âm tiếng Czech mà còn tạo ra ứng dụng giọng nói bằng ngôn ngữ Anh. Hiện tại, 2 trường Đại học của Cộng hòa Czech vẫn đang tiếp tục công trình nghiên cứu này để có thể hoàn thiện ứng dụng hơn nữa.