Intel đã giúp mang lại giọng nói cho cyborg “đầu tiên trên thế giới” như thế nào

TẤN MINH,
Chia sẻ

Hay câu chuyện về quá trình biến đổi của tiến sỹ Peter Scott-Morgan sau khi được chẩn đoán mắc chứng MND.

Vào một ngày tháng 11 lạnh giá năm 2016, sau khi ngâm mình khá lâu trong bồn nước nóng, tiến sỹ Peter Scott-Morgan từ từ bước ra, lắc chân để rũ sạch nước. Nhưng bàn chân của anh không hề di chuyển.

Peter được chẩn đoán mắc bệnh thần kinh vận động (MND), căn bệnh không thể chữa được từng tước đi mạng sống của nhà khoa học Stephen Hawking.

Căn bệnh này gây thoái hoá các tế bào thần kinh cho phép chúng ta di chuyển, nói, thở, và nuốt. Khi phát bệnh, cơ thể bệnh nhân hoàn toàn bị liệt, trong khi bộ não của họ vẫn tỉnh táo và bị khoá cứng trong một cơ thể mà nó không còn kiểm soát được nữa. Các bác sỹ dự báo Peter chỉ còn sống được 2 năm nữa.

Nhưng Peter có một kế hoạch giúp ông đánh bại được số phận. Anh sẽ trở thành một cyborg - một sinh vật nửa người nửa máy.

Vị tiến sỹ này nắm lợi thế trong cuộc đua với căn bệnh oan nghiệt. Anh có bằng tiến sỹ đầu tiên sau một thời gian nghiên cứu tại một cơ sở robot ở Vương quốc Anh, một bằng cử nhân về khoa học máy tính, và một chứng chỉ sau đại học về AI. Anh còn là tác giả cuốn sách "The Robotics Revolution" (Cuộc Cách mạng Robot)

Peter đã sử dụng kinh nghiệm này để phát triển một tầm nhìn mà anh gọi là "Peter 2.0", một cyborg "không chỉ sống sót được, mà còn phát triển mạnh mẽ".

 - Ảnh 1.

Tiến sỹ Peter Scott-Morgan

"Peter 2.0" sẽ chống lại cơn đói bằng cách đưa thẳng chất dinh dưỡng vào dạ dày, và tránh ngạt bằng cách thở qua một đường ống. Khuôn mặt bị tê liệt của anh sẽ được thay thế bởi một avatar, và cơ thể tàn tật sẽ được bao bọc trong một khung xương ngoại (exoskeleton) đứng trên một phương tiện tự lái.

Tất nhiên, anh cũng cần một giọng nói mới nữa.

Giao tiếp máy tính

Vào đầu năm 2019, Peter đã có một bài phát biểu tại một hội thảo ở London. Trong số khán giả có Lama Nachman, giám đốc Phòng thí nghiệm Máy tính Dự đoán của Intel.

Lama từng có trải nghiệm của chính mình với bệnh MND. Nhóm của cô từng đảm nhận việc nâng cấp hệ thống giao tiếp đằng sau giọng nói vi tính hoá nổi tiếng của nhà khoa học Stephen Hawking.

 - Ảnh 2.

Lama Nachman

Đối với Hawking, Intel đã gắn một cảm biến hồng ngoại đỏ vào cặp kính của ông nhằm phát hiện chuyển động từ gò má - cách mà ông sử dụng để chọn các ký tự trên máy tính. Qua thời gian, hệ thống này học được cách chọn từ của Hawking để dự đoán những từ tiếp theo mà ông sẽ muốn sử dụng trong một câu nói.

Kết quả là, Hawking chỉ phải gõ chưa đến 20% tổng số các ký tự cần thiết để nói. Điều này giúp ông tăng gấp đôi tốc độ phát âm và cải thiện đáng kể khả năng thực hiện các công việc thường ngày, như duyệt web hay mở các tài liệu.

Intel đặt tên cho phần mềm này là Assistive Context-Aware Toolbox (ACAT). Sau này, công ty tung phần mềm ra cho cộng đồng dưới hình thức mã nguồn mở, để các nhà phát triển có thể thêm vào hệ thống nhiều tính năng mới.

Nhưng Lama ban đầu không muốn thay đổi ACAT cho phù hợp với nhu cầu của Peter.

Peter lúc bấy giờ đang sử dụng công nghệ theo dõi ánh nhìn để viết và điều khiển máy tính bằng mắt. Phát triển một hệ thống mới đơn giản chỉ khiến Intel lãng phí tài nguyên mà thôi.

"Nhưng rồi chúng tôi nhận ra tiền đề ban đầu của ACAT, thứ về cơ bản là một hệ thống mở hướng đến cải tiến, chính là thứ Peter cần đến" - Lama nói.

Nhóm của cô quyết định sử dụng ACAT để kết nối tất cả những ý tưởng bên trong tầm nhìn về cyborg của Peter: theo dõi ánh mắt, giọng nói tổng hợp, avatar động, và phương tiện tự hành.

"Chúng tôi tách thành hai nhóm: một sẽ nghiên cứu hệ thống phát sinh phản xạ, và một sẽ xem xét ACAT và thêm vào đó chức năng hỗ trợ điều khiển ánh nhìn".

Nhưng Peter vẫn cần một giọng nói mới.

Tìm kiếm một giọng nói

Stephen Hawking từng quyết định sử dụng giọng nói tổng hợp. "Tôi giữ nó bởi tôi chưa từng nghe một giọng nói nào khiến mình thích hơn cả, và bởi người ta đã quen thấy tôi cùng giọng nói đó rồi" - ông nói vào năm 2006. Nhưng Peter thì lại muốn tái tạo lại âm thanh của giọng nói sinh học của mình.

Tiến sỹ Matthew Aylett, một chuyên gia nổi tiếng thế giới về giọng nói tổng hợp, nghĩ rằng có thể giúp được.

Ông đã ghi âm Peter nói hàng ngàn từ, đủ để sử dụng vào việc tạo ra một giọng nói giống hệt. Peter sau đó sẽ sử dụng chuyển động mắt để điều khiển một avatar nói ra giọng của mình.

Aylett có khá ít thời gian để thực hiện công việc. Peter sẽ sớm phải thực hiện phẫu thuật cắt bỏ thanh quản để có thể thở thông qua một chiếc ống đặt phía trên lồng ngực. Nhưng cuộc phẫu thuật này cũng đồng nghĩa anh sẽ không bao giờ nói được nữa.

Ba tháng trước khi Peter chuẩn bị bước lên bàn mổ, giọng nói nhân bản đã sẵn sàng.

Aylett cho Peter nghe một bản demo, trong đó giọng nói nhân bản này hát bài hát "Pure Imagination" từ bộ phim Willy Wonka & Nhà máy Chocolate bản 1971.

Cuộc phẫu thuật của Peter sẽ diễn ra ngay trong tháng mà theo dự báo ban đầu cũng là tháng cuối cùng anh có thể sống được. Đêm trước phẫu thuật, Peter đã đăng tweet chào tạm biệt mọi người, cùng một bức ảnh chụp với chồng anh.

 - Ảnh 3.

Peter và chồng

"Đây là bài viết cuối cùng của tôi dưới danh tính Peter 1.0. Ngày mai, tôi sẽ đổi giọng nói để sống thêm hàng thập kỷ nữa, chờ đợi hoàn thành các thủ tục y khoa cuối cùng nhằm biến mình thành một cyborg hoàn chỉnh, vào tháng mà người ta nói rằng tôi sẽ chết. Tôi sẽ không chết, tôi đang biến đổi! Tôi yêu khoa học biết bao!!!"

Cuộc phẫu thuật đã thành công. Nhưng Peter lúc đó không thể nói được cho đến khi hệ thống giao tiếp của anh sẵn sàng hoạt động. Ở thời điểm này, khung xương ngoại và phương tiện tự hành đã tạm thời bị gác sang một bên, nhưng giọng nói điện tử và avatar vẫn là một phần trong kế hoạch.

Không lâu sau, hệ thống được chuyển đến. Nó có một bàn phím mà anh điều khiển bằng cách nhìn vào một giao diện, và một avatar đồng bộ với câu nói của anh. Peter 2.0 đã sẵn sàng.

 - Ảnh 4.

Hệ thống hỗ trợ Peter được thiết kế theo dạng mô-đun, có nghĩa các tính năng mới có thể được thêm vào một cách dễ dàng

Nâng cấp cyborg

Có một sự khác biệt lớn khác giữa tầm nhìn của Peter và Hawking đối với các hệ thống của họ. Trong khi Hawking muốn nắm quyền kiểm soát đối với AI, Peter ưu tiên tốc độ giao tiếp hơn.

Cách lý tưởng nhất là Peter sẽ tự mình lựa chọn những gì hệ thống được phép nói ra. Nhưng AI càng được giao nhiều quyền kiểm soát, nó sẽ càng hữu ích hơn.

"Thông thường, chúng tôi nghĩ rằng khi mình trao quyền kiểm soát cho người khác, họ làm gì là tuỳ vào họ" - Lama nói. "Nhưng nếu những gì họ có thể làm được bị hạn chế, thì bạn đang không thực sự trao cho họ quyền kiểm soát".

Tuy nhiên, trao quyền kiểm soát cho AI có thể sẽ buộc Peter phải trả một cái giá đắt: anh sẽ đứng trước nguy cơ phải hi sinh một phần ý chí của mình.

"Qua thời gian, hệ thống bắt đầu di chuyển theo một hướng nhất định, bởi bạn đang củng cố đi củng cố lại hành vi đó".

Avatar động của tiến sỹ Peter Scott-Morgan

Một giải pháp được đưa ra là huấn luyện AI hiểu được mong muốn của Peter tại bất kỳ thời điểm nào. Cuối cùng, nó có thể nắm quyền kiểm soát tạm thời khi Peter muốn đẩy nhanh một cuộc nói chuyện, mà không khiến cách thức hoạt động của nó thay đổi vĩnh viễn.

Lama đặt mục tiêu sẽ đạt được sự cân bằng tinh tế đó trong lần biến đổi tiếp theo của Peter: phát triển được một AI phân tích các cuộc nói chuyện của anh và đề xuất các câu phản đáp dựa trên tính cách của anh.

Một hệ thống như vậy có thể biến Peter trở thành một cyborg đúng nghĩa hơn - và đó chính xác là điều mà anh luôn muốn.

Tham khảo: TheNextWeb

Chia sẻ