Công nghệ nhận dạng và giả lập giọng nói
Công nghệ nhận dạng giọng nói Nhận diện giọng nói đã được biết đến hàng thập kỷ, tại sao chỉ đến bây giờ, công nghệ mới thực sự bùng...
Công nghệ nhận dạng giọng nói
Nhận diện giọng nói đã được biết đến hàng thập kỷ, tại sao chỉ đến bây giờ, công nghệ mới thực sự bùng nổ? Theo wikipedia, khó khăn cơ bản của nhận dạng tiếng nói đó là tiếng nói luôn biến thiên theo thời gian và có sự khác biệt lớn giữa tiếng nói của những người nói khác nhau, tốc độ nói, ngữ cảnh và môi trường âm học khác nhau. Sự ra đời của Deep Learning đã giúp nhận diện giọng nói chính xác, thậm chí ở ngoài môi trường phòng lab.
Ví dụ đối với Google Assistant bạn có thể dễ dàng tìm kiếm chỉ với giọng nói câu lệnh từ bạn. Nó là một phần của việc chuyển đổi giọng nói thành văn bản, ở một mức độ cao hơn, Google Assistant có thể hiểu được câu nói của bạn và phản hồi lại với một kết quả có thể nói là gần như hoàn hảo. Để có thể có được một mức độ thông minh như vậy thì AI cần nguồn dữ liệu lớn để học hỏi, quá trình này do người dùng cung cấp cũng như do chính bạn tương tác thường xuyên với Google Assistant.
Giả lập giọng nói
Rõ ràng, công nghệ nhận dạng giọng nói đem lại nhiều lợi ích, thuận tiện cho người dùng. Và công nghệ phát triển luôn luôn có hai mặt.
Liệu có hay không một công nghệ giả dạng giọng nói của bạn để có thể ra lệnh thay bạn giao tiếp vói Google Assistant hay với người khác? Đối với ngôn ngữ tiếng Anh, theo mình được biết dư án Lyrebird, một start-up về công nghệ giọng nói, có khả năng giả lập giọng nói của bạn. Lyrebird có khả năng tái tạo, giả lập giọng nói của bạn, với độ giống nhau mà tai người khó có thể nhận ra được. Trang tin Bloomberg từng có bài giới thiệu về Lyrebird:
Trong video, biên tập viên Ashlee Vance chỉ với vài click chuột và upload và mẩu giọng nói của mình, Lyrebird có thể tổng hợp thành giọng nói của anh ấy. Anh ấy còn thử trò chuyện với mẹ qua điện thoại với vài đoạn câu nói. Và dĩ nhiên mẹ anh ấy không thể nhận ra được giọng nói thật của con trai hay giọng nói được giả lập bằng AI trên máy tính.
Giả lập giọng nói với AI đã lên một tầm cao mới
Tháng 3 vừa qua, Nhật Bản có dự án cho ra mắt "Ca sĩ AI": dùng trí tuệ nhân tạo (AI) để tổng hợp giọng hát giống hệt ca sĩ nào đó.
Hơn nữa, dự án đã chế tạo ca sĩ robot đúng như nguyên mẫu và có giọng, sắc thái và phong cách biểu diễn như ca sĩ thật!!!
Ca sĩ Misora Hibari là ca sĩ thiên tài, đồng thời là diễn viên, người mẫu Kimono.
Cô là “Nữ hoàng thế giới ca khúc” ở Nhật Bản nửa sau thời Showa (1960-1989) với dòng nhạc dân gian. Nhật Bản đã làm được và tạo sự ngạc nhiên lớn... AI đã tái sinh Misora Hibari thật khi 52 tuổi vào năm 1989...
Chương trình biểu diễn của AI Misora Hibari vào cuối năm 2019 tại Nhà hát Đài truyền hình NHK, Tokyo, nhân kỷ niệm 30 năm ngày mất của ca sĩ Misora Hibari – nguyên mẫu của AI Misora Hibari.
Hơn nữa, dự án đã chế tạo ca sĩ robot đúng như nguyên mẫu và có giọng, sắc thái và phong cách biểu diễn như ca sĩ thật!!!
Ca sĩ Misora Hibari là ca sĩ thiên tài, đồng thời là diễn viên, người mẫu Kimono.
Cô là “Nữ hoàng thế giới ca khúc” ở Nhật Bản nửa sau thời Showa (1960-1989) với dòng nhạc dân gian. Nhật Bản đã làm được và tạo sự ngạc nhiên lớn... AI đã tái sinh Misora Hibari thật khi 52 tuổi vào năm 1989...
Chương trình biểu diễn của AI Misora Hibari vào cuối năm 2019 tại Nhà hát Đài truyền hình NHK, Tokyo, nhân kỷ niệm 30 năm ngày mất của ca sĩ Misora Hibari – nguyên mẫu của AI Misora Hibari.
Con dao hai lưỡi
Giống như DeepFake đã gây ra sóng gió trên toàn cầu, gây ảnh hưởng tới rất nhiều người từ người bình thường cho tới người có sức ảnh hưởng. Liệu rằng, công nghệ nhận dạng giọng nói có thể phân biệt được đâu là giọng nói từ con người đâu là giọng nói từ máy tính? Mục đích của việc giả lập giọng nói là gì? Nếu giọng nói của bạn bị giả lập, bạn sẽ không thể kiểm soát được những gì sẽ xảy ra. Những rủi ro có thể gây xáo trộn cuộc sống của bạn hoặc nghiêm trọng hơn là có người sử dụng giọng nói của bạn nhằm mục đích lừa đảo trong thời buổi mà thông tin cá nhân và các mối quan hệ xã hội của mỗi cá nhân đều không còn được bảo mật nữa.
Bài viết tham khảo từ Công nghệ giả lập giọng nói
Science2vn
/science2vn
Bài viết nổi bật khác
- Hot nhất
- Mới nhất