Google kembali mengajari hal baru kepada “robot” alias program kecerdasan buatan DeepMind. Artificial Intelligence (AI) itu kini bisa membaca gerakan bibir manusia dan mengulangi kata-kata yang diucapkan.
Peneliti dari divisi AI Google dan Universitas Oxford menggunakan rekaman siaran TV BBC berdurasi hampir 5.000 jam untuk “melatih” kemampuan DeepMind membaca gerakan bibir melalui software bernama “Watch, Listen, Attend, and Spell”.
Rekaman video ini berisi sekitar 118.000 kalimat terucap dan 17.200 kata.
Saat diminta menerjemahkan gerakan bibir manusia dalam video menjadi kata-kata, Deepmind membuahkan tingkat akurasi sebesar 46,8 persen.
Angka tersebut lebih tinggi dibandingkan lip-reader profesional sekalipun yang hanya mampu mengulangi kata-kata yang diucapkan dengan tepat sebanyak 12,4 persen.
“Sebuah mesin yang bisa membaca gerakan bibir akan membuka berbagai macam kemungkinan,” sebut tim peneliti dalam laporannya, sebagaimana dirangkum KompasTekno dari ZD Net, Jumat (25/11/2016).
Contoh-contoh kemungkinan tersebut misalnya membantu orang dengan disabilitas pendengaran agar bisa mengerti percakapan, atau menggunakan personal assistant macam Siri dan Alexa di lingkungan yang bising.
Ada kekhawatiran terkait privasi karena program serupa bisa saja dipakai utnuk keperluan mata-mata, dengan membaca gerakan bibir seseorang tanpa perlu mendengar suaranya.
Peneliti DeepMind dan Oxford berencana mempubliikasikan hasil studi mereka untuk membantu riset para akedemisi lain.
Sumber : Kompas.com
Silahkan Berkomentar Sesuai Artikel EmoticonEmoticon