
Pada suatu saat ketika Anda masih balita, Anda belajar bagaimana bangkit setelah jatuh dan akhirnya bagaimana berjalan dengan kedua kaki Anda sendiri. Kamu kemungkinan besar mendapat dorongan dari orang tuamu, tetapi sebagian besar, kamu belajar melalui coba-coba. Bukan itu cara robot seperti Spot dan Atlas dari Boston Dynamics belajar berjalan dan menari . Mereka diberi kode dengan cermat untuk menangani tugas yang kami berikan kepada mereka. Hasilnya dapat mengesankan, tetapi juga dapat membuat mereka tidak dapat beradaptasi dengan situasi yang tidak tercakup oleh perangkat lunak mereka. Tim peneliti gabungan dari Universitas Zhejiang dan Universitas Edinburgh mengklaim bahwa mereka telah mengembangkan cara yang lebih baik.
Dalam makalah terbaru yang diterbitkan di jurnal Science Robotics , mereka merinci pendekatan penguatan AI yang mereka gunakan untuk memungkinkan robot mirip anjing mereka, Jueying, untuk belajar berjalan dan pulih dari jatuh sendiri. Tim tersebut memberi tahu Wired bahwa mereka pertama kali melatih perangkat lunak yang dapat memandu versi virtual robot. Terdiri dari delapan AI "pakar" yang mereka latih untuk menguasai keterampilan tertentu. Misalnya, yang satu menjadi lancar berjalan, sementara yang lain belajar cara menyeimbangkan. Setiap kali robot digital berhasil menyelesaikan tugas, tim menghadiahinya dengan poin virtual. Jika semua itu terdengar familier, itu karena ini adalah pendekatan yang sama yang baru-baru ini digunakan Google untuk melatih algoritme MuZero Â
yang inovatifSetelah berhasil melatih delapan pakar, mereka mengembangkan jaringan tambahan untuk bertindak sebagai semacam pelatih kepala. Ini akan mengelola masukan dari delapan algoritme lainnya, memprioritaskan satu atau lebih sesuai kebutuhan dalam situasi tertentu. Anda dapat melihatnya beraksi di GIF di atas. Mereka kemudian memindahkan perangkat lunak mereka ke salah satu prototipe mereka dan mengujinya. Anda dapat melihat hukuman yang mereka berikan saat mereka menendang dan mendorongnya ke tanah. Setiap kali, ia bangkit kembali dan mulai berjalan lagi. Â
Zhibin Li, salah satu penulis laporan, memberi tahu Wired tujuan tim mereka s penelitian adalah untuk menciptakan "mesin yang lebih cerdas, yang mampu menggabungkan keterampilan yang fleksibel dan adaptif dengan cepat, untuk menangani berbagai tugas berbeda yang belum pernah mereka lihat sebelumnya." Namun, mungkin perlu beberapa saat sebelum kita melihat Jueying dan Spot sparring untuk penghargaan anjing robot terbaik. Salah satu tantangan yang harus dihadapi tim ini adalah mengurangi jumlah daya komputasi yang diperlukan untuk mensimulasikan pelatihan robot. Mereka harus melakukannya agar lebih berguna untuk aplikasi praktis.