Maverick Yang Memberi Mesin Hadiah Penglihatan

AsianScientist (3 Desember 2021) – Bayangkan Anda sedang duduk di meja untuk makan malam dan secepat kilat, sesuatu melompat dan merenggut steak Anda. Anda mungkin bisa, hanya dengan melihat, secara naluriah mengatakan bahwa gerakan kabur itu adalah kucing peliharaan Anda. Sebuah komputer, di sisi lain, tidak akan merasa begitu mudah.

Sementara mesin sekarang dapat dengan mulus mengetahui apa yang mereka lihat—pikirkan mobil yang bisa mengemudi sendiri atau pengenalan wajah di layar kunci ponsel Anda—mengajari mereka cara melakukannya adalah tantangan yang sudah ada sejak beberapa dekade lalu.

Agar mesin dapat melihat seperti manusia, mereka harus dilengkapi dengan struktur pemrosesan visual yang sama dengan yang digunakan otak manusia. Hanya sedikit orang yang lebih mengenal fakta ini daripada Profesor Kunihiko Fukushima, pencipta neocognitron, jaringan saraf tiruan yang terinspirasi oleh otak mamalia.

Membangun dasar-dasar penglihatan

Sebagai salah satu jaringan saraf paling awal yang dapat melihat dan belajar, neokognitron Fukushima diakui sebagai dasar bagi perkembangan modern dalam kecerdasan buatan (AI) dan pembelajaran mesin dalam jaringan saraf. Namun, Fukushima tidak memulai karirnya dengan niat untuk bekerja pada AI — lagipula, baru pada tahun 1956 istilah itu pertama kali diciptakan, yang berarti bahwa bidang tersebut masih dalam masa pertumbuhan pada saat itu.

“Saya tidak tertarik pada pembelajaran mesin pada awalnya,” akunya. “Saya lebih tertarik pada otak dan bagaimana informasi diproses di otak hewan.”

Setelah lulus dengan gelar Sarjana dari Departemen Teknik Elektro Universitas Kyoto pada tahun 1958, Fukushima bergabung dengan Perusahaan Penyiaran Jepang (NHK). Di sana, ia mempelajari pengkodean sinyal TV di NHK Technical Research Laboratories, kemudian memperoleh gelar PhD di bidang teknik listrik dari Universitas Kyoto juga.

Pada tahun 1965, Fukushima bergabung dengan Laboratorium Penelitian Ilmu Penyiaran yang baru didirikan di NHK, di mana ia menyelami minat penelitiannya yang sebenarnya: mekanisme pemrosesan informasi visual dan pendengaran.

Pada tahun yang sama, bersama tim insinyur dan ahli biologi, Fukushima berusaha memahami bagaimana sinyal visual dan pendengaran yang disiarkan melalui radio TV diterima dan diproses oleh otak biologis—tujuan akhir dari sinyal tersebut.

Berfokus pada korteks visual mamalia, atau struktur otak yang bertanggung jawab untuk memproses rangsangan visual, ia mulai membangun model jaringan saraf di korteks visual untuk lebih memahami apa yang terjadi di otak saat melihat gambar.

Salah satu jaringan saraf awal yang dirancang Fukushima didasarkan pada model korteks visual primer kucing di mana dua jenis sel, sederhana dan kompleks, berperan dalam pengenalan pola. Dengan meniru sel-sel ini dan mengaturnya secara hierarkis, jaringan saraf yang baru lahir berhasil mengenali gambar dan pola.

Struktur dasar jaringan saraf yang dibangun oleh Fukushima pada tahun 1975. (Sumber: Kunihiko Fukushima)

Saat disajikan dengan gambar, sel akan bereaksi terhadap garis melengkung, tetapi tidak lurus. Beroperasi pada prinsip ini, model Fukushima dapat dengan andal mengenali dan menganalisis garis-garis gambar, membandingkannya dengan kumpulan data internal gambar untuk menentukan apa itu.

Cara melatih otak buatan

Sementara mengenali gambar yang tepat adalah suatu prestasi tersendiri, Fukushima juga ingin modelnya juga memiliki kemampuan untuk belajar—mengidentifikasi gambar dan pola baru yang belum dilatih secara manual oleh para peneliti.

Dengan meningkatkan lapisan jaringan dan melengkapinya dengan bentuk pembelajaran tanpa pengawasan yang disebut pembelajaran kompetitif, Fukushima berhasil menciptakan jaringan yang dapat mengenali pola secara mandiri tanpa pengawasan.

“Kami memberinya nama cognitron, menggabungkan pengartian dan -tron. Namanya mirip dengan perceptron, yang menggabungkan persepsi dan -tron. Perceptron—populer pada 1950-an dan 1960-an—menggunakan algoritma pembelajaran terawasi,” katanya.

Langkah selanjutnya adalah memajukan kemampuan kognitron untuk mengenali pola yang diskalakan, digeser, atau dikaburkan dalam beberapa cara.

Itu adalah masalah yang berat, dan Fukushima menemukan dirinya kembali ke penelitian sebelumnya tentang fisiologi otak untuk inspirasi: yaitu tektum optik, struktur pemrosesan visual di otak yang menerima input langsung dari retina.

Dia tertarik dengan bagaimana koneksi saraf antara retina dan tektum optik akan beregenerasi sendiri setelah terputus, bahkan jika separuh tektum atau retina dihilangkan bersamaan dengan pemotongan awal.

“Ini mengilhami saya untuk memperkenalkan sel benih yang dapat menghasilkan jaringan, memungkinkan jaringan saraf untuk mengatur diri sendiri untuk menjaga kondisi koneksi bersama,” jelas Fukushima.

Modifikasi ini membuat cognitron asli lebih besar, lebih berlapis dan mampu mengatur diri sendiri, sehingga memunculkan neocognitron, jaringan saraf berlapis dengan kemampuan pengenalan gambar yang lebih maju. Pada tahun 1980, Fukushima menerbitkan desain neokognitronnya, yang menetapkan dasar untuk jaringan saraf tiruan dalam beberapa dekade mendatang.

Dengarkan satu, pahami sepuluh

Kemampuan jaringan semacam itu untuk mengenali gambar dan pola sekarang memainkan peran yang sangat luas dalam kehidupan modern, mulai dari kamera hingga sistem keamanan dan mobil yang dapat mengemudi sendiri. Tetapi di masa-masa awal neocognitron, Fukushima tidak menyangka bahwa pembelajaran mesin atau AI secara keseluruhan pada akhirnya akan menjadi begitu luas.

“AI pada 1980-an sangat berbeda dengan yang ada sekarang,” kenangnya. “Pada saat itu, AI hanyalah teknik kecil.”

Namun sekarang, Fukushima mengharapkan aplikasi dan kemampuan teknologi untuk terus berkembang.

“Di Jepang, kami memiliki pepatah umum bahwa ketika Anda “mendengarkan satu, memahami sepuluh”, yang berarti mendengar satu kata sudah cukup untuk mendapatkan arti dari sepuluh kata. Saat ini, AI mendengarkan miliaran orang dan memahami jutaan orang,” katanya. “Tetapi tujuan AI di masa depan adalah mendengarkan jutaan orang dan memahami miliaran.”

Demikian juga, Fukushima sendiri tidak berniat melambat. Pada usia 85 tahun, ia tetap menjadi peneliti yang aktif dan produktif—telah menerbitkan makalah hampir setiap tahun sejak 1961, dengan publikasi terbarunya pada Januari 2021, dan saat ini sedang membuat jaringan yang hanya membutuhkan sedikit data pelatihan.

Pada saat yang sama, perintis yang rendah hati terus mengerjakan misi penelitian aslinya: untuk memahami mekanisme otak, dengan bantuan teknik AI yang sama yang telah ia rintis.

Sebagai seorang peneliti yang karirnya telah membentang lebih dari setengah abad, dan yang dampaknya akan terus bergema selama beberapa dekade lebih, saran Fukushima kepada peneliti muda adalah untuk selalu mempertimbangkan penelitian dari disiplin ilmu di luar bidangnya sendiri, terutama ketika dihadapkan pada masalah yang perlu dipecahkan.

“Cobalah menulis buku,” tutupnya. “Itu secara alami akan memaksamu untuk melakukannya.”

———

Hak Cipta: Majalah Asian Scientist; Foto: Kunihiko Fukushima.
Penafian: Artikel ini tidak mencerminkan pandangan AsianScientist atau stafnya.