YouTube sedang uji coba fitur baru, cari lagu cukup dengan bersenandung

Advertisement

Techno.id - YouTube saat ini sedang menguji coba fitur baru yang memungkinkan pengguna menemukan lagu hanya dengan bersenandung. Eksperimen terbaru ini juga akan berfungsi jika pengguna meletakkan ponsel di dekat speaker atau sumber suara lain. 

Fitur ini membutuhkan tiga detik atau lebih dari audio untuk menemukan lagu yang dicari. Setelah lagu teridentifikasi, pengguna akan diarahkan ke konten musik resmi yang relevan.

foto: freepik-ijeab

Selain sumber resmi dari lagu tersebut, YouTube juga akan menampilkan artis atau label musik, termasuk daftar konten lain seperti Short dan klip. Eksperimen YouTube terbaru saat ini terbatas pada aplikasi Android dan sudah mulai menjangkau sejumlah kecil pengguna.

Pengguna dapat mengaksesnya dengan meluncurkan fitur pencarian suara di aplikasi YouTube, di mana pengguna bisa bersenandung alih-alih mendiktekan judul lagu atau detail artis.

Fitur baru YouTube

Bisa juga dicoba menggunakan Google Assistant

foto: freepik

Fitur bersenandung YouTube merupakan uji coba global. Sayangnya belum ada informasi yang jelas kapan fitur ini akan dirilis secara luas. Sementara itu, pengguna juga bisa mencoba fitur yang sama pada Google Assistant.

Asisten virtual Google ini menerima kemampuan yang sama pada tahun 2020. Fitur hum-to-search bekerja untuk lebih dari 20 bahasa dan dapat langsung diluncurkan dari dalam aplikasi Google.

foto: freepik/grinvalds

Implementasi ini sebenarnya menawarkan lebih banyak fleksibilitas, karena mengidentifikasi semua lagu yang mungkin cocok dengan senandung pengguna dan kemudian memungkinkan mereka menikmatinya di aplikasi musik apa pun yang dipilih, bukan hanya YouTube.

Keseluruhan sistem ini bergantung pada algoritma pembelajaran mesin untuk menemukan kecocokan potensial dengan menggunakan teknik sidik jari melodi. Ini agak mirip dengan model AI generatif yang berfokus pada audio, seperti yang dikembangkan Meta dan VALL-E milik Microsoft, yang hanya membutuhkan beberapa detik rekaman audio seseorang.

AI kemudian memilah-milah detail seperti nada dan gaya pengucapan yang khas. Semua data tersebut kemudian diringkas menjadi sebuah model yang dapat membaca setiap bagian yang menirukan suara asli seseorang. Sebuah perusahaan bernama ElevenLabs bahkan menawarkan model yang dapat menerjemahkan suara pengguna ke dalam 30 bahasa dengan ciri khas audio yang sama.

Advertisement


(brl/red)