Sistem Sintesis Text-to-speech
Komentar Ek muncul saat Spotify sedang mencari paten untuk sistem “sintesis text-to-speech” bertenaga AI. Paten diterbitkan pada 20 Juli dan diajukan kembali pada Februari.
Teknologi tersebut dapat mengambil teks dan mengubahnya menjadi audio ucapan mirip manusia yang menggabungkan emosi dan niat.
Sistem dapat membuat ucapan realistis yang mampu menyampaikan emosi seperti kemarahan, kebahagiaan atau kesedihan, bersama dengan maksud seperti sarkasme. Caranya adalah melakukannya dengan cara berbisik atau berteriak, dan dengan aksen.
Paten menunjukkan bahwa Spotify ingin melampaui fitur DJ-nya, yang hanya mengucapkan beberapa kalimat bertenaga AI di antara lagu.
Sistem sintesis text-to-speech memiliki potensi untuk digunakan untuk hal-hal seperti menarasikan buku audio menggunakan AI dengan cara yang terdengar alami.
Perlu dicatat, bahwa Apple meluncurkan narasi audio bertenaga AI untuk judul-judul tertentu di Apple Books awal tahun ini.
Pengajuan paten dan komentar Ek muncul karena Spotify telah berinvestasi dalam teknologi suara AI.
Tahun lalu, layanan streaming tersebut mengakuisisi Sonantic, startup yang berbasis di London yang telah membangun mesin AI untuk menciptakan suara manusia yang terdengar realistis dari teks, dengan jumlah yang dirahasiakan.
Spotify memanfaatkan akuisisi itu untuk mendukung fitur AI DJ-nya. (xin/lfr)