Cara Komputer Mengenali Gerakan Tangan

oleh -73 views
gerakan tangan

Pengenalan gerakan tangan optik melihat peningkatan dalam akurasi dan kompleksitas dengan algoritme baru

Source:SPIE–International Society for Optics and Photonics

Summary: Kemajuan terbaru dalam sistem kamera, analisis gambar, dan pembelajaran mesin telah membuat pengenalan gerakan berbasis optik menjadi pilihan yang lebih menarik di sebagian besar konteks. Namun, metode saat ini terhalang oleh berbagai keterbatasan, termasuk kompleksitas komputasi yang tinggi, kecepatan rendah, akurasi yang buruk, atau sedikitnya jumlah gerakan yang dapat di kenali. (Dheva)

Dalam film blockbuster fiksi ilmiah tahun 2002, Minority Report, karakter Tom Cruise, John Anderton, menggunakan tangannya, yang dilapisi sarung tangan khusus, untuk berinteraksi dengan layar komputer transparan seukuran dinding. Komputer mengenali gerakannya untuk memperbesar, memperbesar, dan menggeser. Meskipun visi futuristik untuk interaksi komputer-manusia ini sudah berusia 20 tahun. Manusia saat ini masih berinteraksi dengan komputer dengan menggunakan mouse, keyboard, remote control, atau layar sentuh kecil. Namun, banyak upaya telah di curahkan oleh para peneliti untuk membuka bentuk komunikasi yang lebih alami tanpa memerlukan kontak antara pengguna dan perangkat. Perintah suara adalah contoh menonjol yang telah di temukan di smartphone modern dan asisten virtual. Memungkinkan kita berinteraksi dan mengontrol perangkat melalui ucapan.

Gerakan tangan merupakan mode penting lain dari komunikasi manusia yang dapat di adopsi untuk interaksi manusia-komputer. Kemajuan terbaru dalam sistem kamera, analisis gambar, dan pembelajaran mesin telah menjadikan pengenalan gerakan berbasis optik sebagai pilihan yang lebih menarik di sebagian besar konteks. Daripada pendekatan yang mengandalkan sensor yang dapat di kenakan atau sarung tangan data, seperti yang di gunakan oleh Anderton dalam Minority Report. Namun, metode saat ini terhalang oleh berbagai keterbatasan. Termasuk kompleksitas komputasi yang tinggi, kecepatan rendah, akurasi yang buruk, atau sedikitnya jumlah gerakan yang dapat di kenali.

Untuk mengatasi masalah ini, tim yang di pimpin oleh Zhiyi Yu dari Universitas Sun Yat-sen, Cina. Baru-baru ini mengembangkan algoritma pengenalan gerakan tangan baru yang menghasilkan keseimbangan yang baik antara kompleksitas, akurasi, dan penerapan. Sebagaimana dirinci dalam makalah mereka. Yang di terbitkan dalam Journal of Electronic Imaging. Tim mengadopsi strategi inovatif untuk mengatasi tantangan utama dan mewujudkan algoritme yang dapat dengan mudah di terapkan di perangkat tingkat konsumen.

Salah satu fitur utama dari algoritma ini adalah kemampuan beradaptasi dengan jenis tangan yang berbeda. Algoritme pertama-tama mencoba mengklasifikasikan jenis tangan pengguna sebagai ramping, normal, atau lebar berdasarkan tiga pengukuran. Yang memperhitungkan hubungan antara lebar telapak tangan, panjang telapak tangan, dan panjang jari. Jika klasifikasi ini berhasil, langkah selanjutnya dalam proses pengenalan gerakan tangan hanya membandingkan gerakan input dengan sampel yang di simpan dari jenis tangan yang sama. “Algoritme sederhana tradisional cenderung mengalami tingkat pengenalan yang rendah karena mereka tidak dapat mengatasi jenis tangan yang berbeda. Dengan terlebih dahulu mengklasifikasikan isyarat input berdasarkan jenis tangan. Dan kemudian menggunakan perpustakaan sampel yang cocok dengan jenis ini, kami dapat meningkatkan tingkat pengenalan keseluruhan dengan sumber daya yang hampir dapat di abaikan. konsumsi,” jelas Yu.

Aspek kunci lain dari metode tim adalah penggunaan “fitur pintasan” untuk melakukan langkah pengenalan awal. Meskipun algoritme pengenalan mampu mengidentifikasi isyarat masukan dari sembilan isyarat yang mungkin, membandingkan semua fitur isyarat masukan dengan sampel yang di simpan untuk semua isyarat yang mungkin akan sangat memakan waktu. Untuk mengatasi masalah ini, langkah pra-pengenalan menghitung rasio luas tangan untuk memilih tiga gerakan yang paling mungkin dari sembilan kemungkinan. Fitur sederhana ini cukup untuk mempersempit jumlah kandidat gestur menjadi tiga. Di mana gestur terakhir di putuskan menggunakan ekstraksi fitur yang jauh lebih kompleks dan presisi tinggi berdasarkan “momen invarian Hu”. Yu mengatakan, “Langkah pengenalan isyarat tidak hanya mengurangi jumlah kalkulasi dan sumber daya perangkat keras yang di perlukan. Tetapi juga meningkatkan kecepatan pengenalan tanpa mengurangi akurasi.”

Tim menguji algoritme mereka baik dalam prosesor PC komersial dan platform FPGA menggunakan kamera USB. Mereka memiliki 40 sukarelawan yang membuat sembilan gerakan tangan beberapa kali untuk membangun perpustakaan sampel, dan 40 sukarelawan lainnya untuk menentukan keakuratan sistem. Secara keseluruhan, hasil menunjukkan bahwa pendekatan yang di usulkan dapat mengenali gerakan tangan secara real time dengan akurasi melebihi 93%. Bahkan jika gambar gerakan input di putar, di terjemahkan, atau di skalakan. Menurut para peneliti, pekerjaan di masa depan akan fokus pada peningkatan kinerja algoritme di bawah kondisi kilat yang buruk dan meningkatkan jumlah gerakan yang memungkinkan.

Pengenalan gerakan memiliki banyak bidang aplikasi yang menjanjikan dan dapat membuka jalan bagi cara-cara baru untuk mengendalikan perangkat elektronik. Sebuah revolusi dalam interaksi manusia-komputer mungkin sudah dekat!

Journal Reference:

  1. Qiang Zhang, Shanlin Xiao, Zhiyi Yu, Huanliang Zheng, Peng Wang. Hand gesture recognition algorithm combining hand-type adaptive algorithm and effective-area ratio for efficient edge computingJournal of Electronic Imaging, 2021; 30 (06) DOI: 10.1117/1.JEI.30.6.063026

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

No More Posts Available.

No more pages to load.