Mengatasi Permasalahan High Dimensional Space dalam Klasifikasi Multikelas Big Data pada Data Gambar dengan DCSVM

  • Siti Sarah Sobariah Lestari Universitas Islam Bandung
  • Gina Purnama Insany Universitas Nusa Putra
  • Dede Sukmawan Universitas Nusa Putra
  • Faiz Dzulfikar Yusuf Universitas Nusa Putra
Keywords: Data Parsity, High Dimensional Space, Multiclass Classification

Abstract

Masalah pada unstructured data khususnya pada data gambar menjadi tantangan dalam pemodelan klasifikasi big data yang berkaitan dengan akurasi dari model, sehingga memerlukan solusi untuk mengatasinya. Data gambar memiliki atribut yang disajikan dalam satuan piksel, satuan data tersebut berada pada dimensi yang tinggi. Sehingga menimbulkan ketidak beraturan pada dimensi, fenomena ini disebut sebagai the curse of dimensionality. Kenaikan dimensi pada data secara bersamaan mengakibatkan kenaikan volume pada ruang yang menyebabkan fenomena sparsity yang terjadi pada high dimensional space. Ketersediaan data jenis huruf dalam bentuk gambar, membuat data berada pada kondisi data sparsity pada high dimensional space, sehingga diperlukan metode yang mampu melakukan proses klasifikasi yang memberikan akurasi tinggi. Tujuan yang ingin dicapai dari penelitian ini adalah memperoleh model yang tepat dan akurat dalam melakukan klasifikasi multikelas dengan kondisi data sparsity dalam high dimensional space. Support Vector Machine (SVM) merupakan salah satu metode klasifikasi yang paling sering digunakan, karena SVM sensitif terhadap noise dan kaidah VC-dimension mampu menangani masalah the curse of dimensionality. Algoritma Divide and Conquer, membantu proses SVM dalam melakukan klasifikasi pada data sparsity dengan baik. Hal ini ditunjukkan dengan akurasi DCSVM (Divide and Conquer Support Vector Machine) lebih tinggi dibandingkan dengan klasifikasi dengan menggunakan SVM biner dan one vs one SVM

Published
2023-12-28
How to Cite
[1]
Siti Sarah Sobariah Lestari, Gina Purnama Insany, Dede Sukmawan, and Faiz Dzulfikar Yusuf, “Mengatasi Permasalahan High Dimensional Space dalam Klasifikasi Multikelas Big Data pada Data Gambar dengan DCSVM”, Restikom, vol. 5, no. 3, pp. 340 - 351, Dec. 2023.
Section
Article