Trong số tất cả các nghiên cứu thực tế đang diễn ra về mạng lưới nơ-ron, máy học và trí tuệ nhân tạo, có rất nhiều…thí nghiệm ngớ ngẩn mà kết quả của chúng nằm ở ranh giới mong manh giữa thú vị và đáng sợ.
Xử lý hình ảnh tự động đã nổi lên như một công cụ tuyệt vời cho mạng nơ-ron, một phần là nhờ vào nhiều thập kỷ mọi người chia sẻ ảnh và ảnh tự sướng trực tuyến. Kết quả là một kho ảnh khuôn mặt khổng lồ để thu thập và sử dụng, và AI có thể được đào tạo để làm mọi thứ, từ mô phỏng người dùng già đi trong ứng dụng di động đến tạo ra bộ sưu tập ảnh siêu thực về những người thậm chí không tồn tại.
Ngành công nghiệp ảnh stock sẽ không bao giờ còn như cũ nữa, nhưng Mario Klingermann tự hỏi điều gì sẽ xảy ra nếu anh yêu cầu các mạng nơ-ron tạo ra hình ảnh khuôn mặt ảo đồng bộ với âm nhạc – và như bạn có thể thấy trong video bên dưới, chúng tôi đã có được một số khuôn mặt thực sự ấn tượng khi âm nhạc vang lên!
Kết quả đáng sợ khi AI tạo ra khuôn mặt ảo theo nhịp điệu âm nhạc
Klingermann đã sử dụng mạng nghịch đảo tạo sinh StyleGAN2, do Nvidia tạo ra và phát hành dưới dạng mã nguồn mở cách đây hơn một năm. Ông không tự mình thực hiện bất kỳ quá trình đào tạo hình ảnh tùy chỉnh nào, mà thay vào đó, ông đã điều chỉnh GAN để chuyển đổi đầu ra của nó dựa trên phổ của một tệp âm thanh nhất định—trong trường hợp này là Triggernometry của Kraftamt.
Một số người theo dõi Klingermann trên Twitter đề xuất anh ấy làm chậm video do GAN tạo ra một chút để thấy được sự kinh hoàng ẩn chứa trong đó. Bạn có thể xem hình ảnh bên dưới để thấy ngay sự kinh hoàng. Lưu ý rằng bạn không nên cuộn xuống nếu bạn có tiền sử bệnh tim hoặc đang đọc bài viết này vào lúc nửa đêm!
*** Cảnh báo cuối cùng! ***
Tham khảo: Gizmodo