�Jurnal Syntax Admiration |
Vol. 1 No. 7 November 2020 |
p-ISSN : 2722-7782 e-ISSN : 2722-5356 |
Sosial Teknik |
PENGELOMPOKAN DATA DENGAN MENGGUNAKAN METODE FUZZY
C-MEANS UNTUK WILAYAH RAWAN BENCANA TANAH LONGSOR [u1]
INFO
ARTIKEL |
ABSTRAK |
Diterima 02 November 2020 Diterima dalam bentuk revisi 17 November 2020 Diterima dalam bentuk revisi |
Bencana tanah longsor merupakan salah satu bencana alam yang sering terjadi di beberapa daerah di Indonesia. Kabupaten Kuningan salah satu daerah dengan lokasi dataran yang secara geografis merupakan daerah yang memiliki permukaan tanah relatif datar dengan variasi berbukit-bukit menyebabkan beberapa wilayah di Kabupaten Kuningan sangat rawan terjadinya longsor saat musim hujan. Dalam penanganan pra- bencana di wilayah tersebut, pemerintah dan BPBD (Badan Penanggulangan Bencana Daerah) Kabupaten Kuningan melakukan mitigasi bencana yang bertujuan untuk meminimalisir kemungkinan terjadinya longsor. Perlu adanya sistem yang lebih terstruktur sebagai upaya mitigasi bencana longsor, dengan mengolah data kejadian bencana menjadi suatu sistem informasi penanganan pra-bencana. Pengolahan data bencana alam dalam penelitian ini yaitu menggunakan teknik data mining, data yang diolah dengan teknik ini kemudian menghasilkan suatu sistem informasi baru yang bersumber dari data lama. Clustering atau pengelompokan data merupakan� salah� satu� konsep� penganalisaan� Data� Mining� dengan� metode� penganalisaan� proses� partisi� satu set objek data ke dalam himpunan bagian yang disebut dengan cluster. Algoritma yang digunakan adalah Fuzzy C-Means (FCM). Algoritma ini memberi kebebasan dalam hal jumlah cluster yang akan dibuat, juga memiliki tingkat akurasi yang tinggi. |
Kata kunci: Pengelompokkan
Data; Metode Fuzzy
C-Means; Bencana Longsor |
Pendahuluan
Tanah longsor biasa terjadi pada musim hujan di dataran tinggi atau pegunungan, tetapi longsor juga dapat terjadi pada dataran yang relatif rendah. Kabupaten Kuningan dengan lokasi dataran yang secara geografis merupakan daerah dengan dataran� yang� memiliki� permukaan� tanah relatif datar dengan variasi berbukit-bukit menyebabkan beberapa wilayah di Kabupaten Kuningan sangat rawan terjadinya longsor saat musim hujan.
Informasi tentang jumlah kejadian bencana longsor sangat dibutuhkan untuk penanggulangan bencana di Kabupaten Kuningan. Perlu adanya sistem yang lebih terstruktur sebagai upaya mitigasi bencana longsor, yaitu dengan mengolah data tersebut menjadi suatu sistem informasi penanganan pra-bencana. Pengolahan data bencana alam yang dilakukan peneliti yaitu menggunakan teknik Data Mining, karena metode ini dapat menjadi langkah awal dalam kegiatan mitigasi bencana melalui teknik penanganan non- fisik dengan menganalisa data historis dari data bencana longsor yang ada. Dari banyaknya konsep penganalisaan Data Mining, Clustering atau klasterisasi atau pengelompokkan yakni salah satu metode penganalisaan dengan proses partisi satu set objek data ke dalam himpunan bagian yang disebut dengan cluster. Partisi pada proses clustering tidak dilakukan secara manual melainkan dengan suatu algoritma (Pamusti, 2018). Algoritma yang akan digunakan untuk penelitian ini adalah Fuzzy C-Means (FCM) (Bifawaidati, 2017). Algoritma Fuzzy C- Means memberi kebebasan dalam hal jumlah cluster yang akan dibuat. Kelebihan lainnya adalah ia dapat melakukan clustering lebih dari satu variabel secara sekaligus. Data-data beserta parameternya dapat dikelompokkan dalam beberapa����������� cluster� sesuai�� dengan kecenderungannya. Fuzzy C-Means juga memiliki tingkat akurasi yang tinggi dan waktu komputasi yang cepat (Arista et al., 2017). diharapkan sistem informasi terkait dapat dijadikan acuan untuk antisipasi dan kewaspadaan dalam proses mitigasi peristiwa longsor serta dapat menjadi solusi atas permasalahan penanggulangan bencana tanah longsor di wilayah tersebut.
Metode Penelitian
Metode yang digunakan peneliti adalah metode kuantitatif. Karena penelitian ini menggunakan sample data berupa angka-angka dan penekanan pada pengukuran hasil yang objektif menggunakan analisis statistik. Fokus metode kuantitatif adalah mengumpulkan data dan melakukan generalisasi untuk menjelaskan fenomena khusus yang dialami oleh populasi. Tujuannya membentuk hipotesis dan mendeskripsikan suatu fenomena. Jika suatu hipotesis lolos uji berkali-kali, hipotesis tersebut dapat menjadi suatu teori ilmiah baru.
Metode kuantitatif dapat diartikan sebagai metode penelitian yang berlandaskan pada filsafat positivisme, digunakan untuk meneliti pada populasi atau sampel tertentu, pengumpulan data menggunakan instrumen penelitian, analisis data bersifat kuantitatif/statistik, dengan tujuan untuk menguji hipotesis yang telah ditetapkan (Sugiyono, 2016).
A.
Hasil Penelitian
Pada penelitian ini menghasilkan sebuah sistem dengan
alir data yang digambarkan
pada digram konteks dan dapat dilihat pada Gambar 1 sesuai dengan permasalahan
yang telah dirumuskan.
Gambar 1 Diagram Konteks
Berdasarkan dari diagram konteks pada Gambar
1, maka dapat menghasilkan sebuah sistem yang memiliki desain prosedur sebagai berikut:
1) Prosedur Input Data
a) Admin login terlebih dahulu
b) Apabila login berhasil maka akan
masuk ke dalam tampilan halaman utama. Jika proses login gagal maka sistem
akan mengkonfirmasi bahwa login gagal.
c) Admin dapat melakukan olah data seperti menambah data admin, mengedit data admin dan menghapus
data admin.
d) Admin mengupload data
berupa file excel yang sudah
di praproses data berisi rekap data kejadian bencana longsor 3 tahun terakhir per- kecamatan di Kabupaten Kuningan untuk dimasukan kedalam data pengujian yang akan dikelompokan.
2) Prosedur Pengelompokan Data Fuzzy C-Means
a) Admin menentukan jumlah klaster yang diinginkan.
b) Admin menentukan nilai maksimum iterasi.
c) Sistem akan membaca data yang dikelompokkan dari data pengujian dengan proses clustering menggunakan
algoritma Fuzzy C-Means.
d) Sistem akan membaca jumlah
kriteria yang sudah ditentukan.
e) Sistem membaca jumlah cluster yang diinput.
f) Sistem menentukan nilai bilangan random secara acak dengan nilai
keanggotaan pada interval 0 sampai
dengan 1.
g) Sistem menghitung fungsi objektif� pada proses iterasi.
h) Jika proses melebihi maksimum iterasi maka proses Fuzzy C-Means berhenti.
i) Kemudian admin dapat menyimpan hasil clustering
Fuzzy C-Means.
3) Prosedur Pencetakan Hasil Pengelompokan
Data
a) Setelah data diproses,
program akan menghasilkan nilai Cluster berdasarkan Cluster
yang ditentukan, atribut kecamatan dan tahun kejadian.
b) Klik tombol �Cetak Laporan�
untuk mencetak hasil clustering.
B. Pembahasan
1)
Data Mining
Data mining adalah analisis pengamatan database
untuk menemukan hubungan yang tidak terduga dan untuk meringkas data dengan cara atau metode
baru yang dapat dimengerti dan bermanfaat kepada pemilik data (Melilisa, 2011).
Konsep utama dari sebuah
transformasi dalam data mining yakni
suatu kumpulan data yang bersumber dari database yang berukuran
besar yang diekstrak dan dirangkum untuk menemukan suatu pola berupa informasi
yang bermanfaat dan mengandung
sebuah pengetahuan yang dapat digunakan untuk membantu pengambil keputusan dalam mengambil kebijakan yang tepat untuk kepentingan sebuah organisasi.
2) Pengelompokan Data
Clustering atau pengelompokan data mempertimbangkan sebuah pendekatan penting untuk mencari kesamaan
dalam data dan menempatkan
data yang sama ke dalam kelompok-kelompok (Syahputra et al., 2018). Clustering membagi
kumpulan data ke dalam beberapa kelompok dimana kesamaan dalam sebuah kelompok adalah lebih besar
diantara kelompok-kelompok.
Metode clustering
secara umum dapat dibagi menjadi
dua, yaitu hierarchical clustering� dan partitional clustering (Tan, 2017).
a) Hierarchical
Clustering
Pada hierarchical� clustering data
dikelompokan melalui suatu bagan yang berupa hirarki, dimana terdapat penggabungan dua grup yang terdekat disetiap iterasinya ataupun pembagian dari seluruh set data kedalam cluster. Contoh metode hierarchy clustering: Single Linkage,�� Complete�� Linkage,���
Average Linkage, Average Group Linkage.
b) Partitional
Clustering
Partitional clustering yaitu data yang dikelompokan ke dalam beberapa
bagian menjadi sejumlah cluster tanpa adanya struktur
hirarki antara satu dengan yang lainnya. Pada����� metode����� partitional����� clustering� setiap cluster
memiliki� titik�� yang�� menjadi pusat cluster
(Centroid) dan secara umum metode ini memiliki
fungsi tujuan yaitu meminimumkan jarak� (Dissimilarity)� dari� seluruh�� data��
ke� pusat cluster masing-masing. Beberapa
metode bagian dari partitional clustering: K-Means, Fuzzy C-means dan
Mixture Modelling. Adapun manfaat dari
clustering atau
pengelompokan data, yaitu:
1)
Clustering merupakan metode segmentasi data yang sangat berguna dalam analisis
masalah bisnis tertentu. Misalnya segmentasi pasar, marketing
dan pemetaan zona wilayah.
2)
Identifikasi obyek dalam berbagai bidang seperti computer vision dan image processing.
3) Analisis Cluster
Analisis Cluster Variance digunakan untuk
mengukur nilai hasil penyebaran data-data hasil clustering (Alfina et al., 2012). Variance
pada clustering ada
2 (dua) jenis, yaitu:
a) Variance
within cluster merupakan jenis varian yang mengacu pada jarak antar anggota pada cluster.
b) Variance
between cluster merupakan jenis varian yang mengacu pada jarak antar cluster.
Untuk dapat melakukan analisis cluster ialah dengan cara melalui
tahapan atau algoritma sebagai berikut:
a) Mencari nilai varian sebuah
cluster dengan
cara dihitung dengan menggunakan rumus sebagai berikut:
Keterangan:
�=
variance pada cluster ke c
c = 1 � k ,dimana k = jumlah cluster
nc =
jumlah data pada cluster c
di = data
ke-i pada suatu cluster
�= rata-rata dari data pada suatu cluster
b) Setelah nilai variance cluster telah diperoleh,
kemudian dapat mencari nilai variance within cluster dan variance between cluster dengan menggunakan rumus sebagai berikut:
1) Variance
within cluster
Keterangan:
N = jumlah seluruh data
K = jumlah cluster
ni = jumlah
data pada cluster ke-i
Vi2 = variance pada cluster ke-i
2) Variance
between cluster
Keterangan:
�= rata-rata dari
c) Kemudian setelah
memperoleh nilai variance
within cluster dan variance between cluster, selanjutnya
yaitu dengan menghitung nilai variance minimum dan variance maximum dengan rumus berikut:
4) Metode
Fuzzy C-Means
Metode Fuzzy C-Means adalah teknik pembuatan cluster dimana keberadaan tiap titik data dalam suatu cluster ditentukan oleh derajat keanggotaannya (Kemala et al., 2019). Berikut merupakan Flowchart Fuzzy C-Means yang dijelaskan pada Gambar 2.
Gambar
2 Flowchart Fuzzy C-Means
Algoritma Fuzzy C-Means adalah
sebagai berikut:
a.
Input data di cluster X, berupa
matriks berukuran n x m (n=jumlah sample data, m=atribut setiap data). Xij = data sample ke-i (i=1,2,�,n), atribut ke- j(j=1,2,�,m).
b.
Keterangan ketentuan nilai:
Jumlah
cluster = c;
Pangkat = w;
Maksimum iterasi = MaxIter; Error terkecil (epsilon) = 0,00001;
Fungsi obyektif awal = P0 =0;
Iterasi awal = t=1;
c.
Bangkitkan nilai acak μik, i=1,2,�,n; k=1,2,�,c; sebagai elemen-elemen matriks partisi awal u. μik adalah derajat keanggotaan yang merujuk pada seberapa besar kemungkinan suatu data dapat menjadi anggota ke dalam suatu
cluster. Posisi dan nilai matriks dibangun secara random. Dimana nilai keangotaan terletak pada interval
0 sampai dengan 1. Hitung jumlah setiap
kolom (atribut).
Q adalah jumlah nilai derajat
keanggotaan perkolom = 1 dengan j=1,2,�m.
Hitung:
d.
Hitung pusat Cluster ke-k: Vkj ,dengan k=1,2,�n; dan j=1,2,�n.
e.
V = Nilai centroid atau
pusat cluster didapat dari perhitungan total μik kuadrat dikali Xij (X atribut
data) dibagi total μik
kuadrat.
f.
Hitung fungsi obyektif pada iterasi awal. Fungsi obyektif digunakan sebagai syarat perulangan untuk mendapatkan pusat cluster yang tepat. Sehingga diperoleh kecenderungan data untuk masuk ke cluster mana pada step akhir.
g.
Tahap ini menghitung jumlah Xij (data atribut) dikurangi nilai pusat cluster dikali nilai pembobot. Kemudian perbaiki derajat keanggotaan dengan menghitung nilai perubahan matriks partisi setiap data pada setiap cluster. Hitung perubahan matriks partisi: dengan: i=1,2,�n;dan k=1,2,..m.
Perhitungan perubahan matriks berfungsi untuk mengetahui hasil data yang masuk kedalam pengelompokan
yang sudah ditentukan.
h.
Cek kondisi berhenti:
Jika: ( |Pt - Pt-1
|<_ ) atau (t>maxIter)
maka berhenti. Jika iterasi berhenti, ditentukan cluster dari tiap-tiap data. Cluster dipilih berdasarkan nilai matriks partisi terbesar.; jika tidak: t=t+1, ulangi langkah ke-4.
5) Metode
Prototype
Model Prototype dimulai dari mengumpulkan spesifikasi
kebutuhan hingga tahap implementasi, sehingga membantu tim pengembang perangkat
lunak untuk memahami lebih baik apa yang akan dikembangkan serta terbayang apa
yang sebenarnya diinginkan. Adapun tahapannya dijelaskan melalui Gambar 3
sebagai berikut.
Gambar
3 Tahapan Model Prototype
Sumber: (Roger & Pressman, 2012)
a.
Pengumpulan Data
Pada tahap ini merupakan pengumpulan
data yang terdiri dari data
primer dan data sekunder. Pengumpulan
data primer dihasilkan dari
observasi studi kasus, kemudian melakukan wawancara dengan instansi. Sedangkan pengumpulan data sekunder dihasilkan dari dokumen observasi
yang dilakukan dengan mempelajari dokumen-dokumen yang ada untuk memperoleh
data dan informasi serta melakukan riset dengan merujuk pada buku-buku yang berhubungan dengan penelitian guna untuk memecahkan
masalah pada penilaian ini.
b.
Perancangan Sistem
Membangun sistem dengan membuat
perancangan sementara yang berfokus kepada kebutuhan aplikasi dan alat bantu pemodelan.
c.
Pengujian dan Evaluasi
Pada tahap ini dilakukan uji coba sistem yang telah dirancang dan mengevaluasi sistem untuk memastikan bahwa sistem sudah
dapat digunakan dengan�� baik�� dan�� benar�� sesuai�� dengan�� yang diharapkan.
6) Analisis Sistem Berjalan
Analisis prosedur sistem yang memberikan gambaran
tentang sistem yang saat ini sedang berjalan. Analisis prosedur sistem bertujuan
untuk mengetahui bagaimana cara kerja sistem tersebut sehingga kelebihan dan
kekurangan sistem dapat diketahui.
Berdasarkan pengamatan yang dilakukan di BPBD
(Badan Penanggulangan Bencana
Daerah) Kabupaten Kuningan mengenai Clustering Data Kejadian
Bencana Longsor yaitu sistem yang berjalan pada BPBD Kabupaten Kuningan dalam pengelolaannya, informasi diperoleh berdasarkan data kejadian bencana yang dicatat oleh Seksi Pencegahan dan Kesiapsiagaan yang
selanjutnya catatan tersebut diserahkan kepada Seksi Kedaruratan
dan Logistik sehingga data catatan tersebut diproses dan menjadi data rekapitulasi kejadian kebencanaan. Kemudian informasi data rekapitulasi tersebut diserahkan oleh Kepala Peaksana menjadi laporan data kejadian.
Berikut
diagram sistem prosedur
lama yang digunakan oleh BPBD Kabupaten
Kuningan:
Gambar
4 Diagram Flowmap
Prosedur Sistem Berjalan
7) Perancangan Sistem (Desain Prosedur)
Terdapat beberapa prosedur
sistem yang dibangun, yakni meliputi prosedur input data, prosedur clustering
fuzzy c- means, dan prosedur mencetak
hasil clustering fuzzy c-means, berikut penjelasan dari keseluruhan prosedur sistem tersebut:
a.
Admin
login terlebih dahulu.
b.
Apabila login berhasil maka akan masuk
ke dalam tampilan halaman utama. Jika proses login gagal maka sistem akan
mengkonfirmasi bahwa login gagal.
c.
Admin
dapat melakukan olah data seperti menambah data admin, mengedit data admin dan
menghapus data admin.
d.
Admin
mengupload data berupa file excel yang sudah di praproses data berisi rekap
data kejadian bencana longsor 3 tahun terakhir per- kecamatan di Kabupaten
Kuningan untuk dimasukan kedalam data pengujian yang akan dikelompokan.
e.
Admin
menentukan jumlah klaster yang diinginkan.
f.
Admin
menentukan nilai maksimum iterasi.
g.
Sistem
akan membaca data yang dikelompokkan dari data pengujian dengan proses clustering menggunakan algoritma fuzzy c-means.
h.
Sistem
akan membaca jumlah kriteria yang sudah ditentukan.
i.
Sistem
membaca jumlah cluster yang diinput.
j.
Sistem
menentukan nilai bilangan random secara acak dengan nilai keanggotaan pada
interval 0 sampai dengan 1.
k.
Sistem
menghitung fungsi objektif� pada proses
iterasi.
l.
Jika
proses melebihi maksimum iterasi maka proses fuzzy c-means berhenti.
m.
Kemudian admin dapat menyimpan hasil clustering fuzzy
c-means.
n.
Setelah
data diproses, program akan menghasilkan nilai Cluster berdasarkan klaster yang ditentukan, atribut kecamatan dan
tahun kejadian.
o.
Klik
tombol �Cetak Laporan� untuk mencetak hasil clustering.
8) Data Flow Diagram (DFD) (Li & Chen, 2009)
a.
Diagram Konteks
Gambar
5 Diagram Konteks
b.
DFD Level
0
Gambar
6 DFD Level 0
c. Entity
Relationship Diagram
Gambar
7 Entity Relationship Diagram
Sumber: (Yeh et al., 2008)
Berdasarkan dari hasil penelitian yang telah dilakukan sesuai dengan skenario
pengujian terhadap sistem yang dibangun, maka dapat disimpulkan
bahwa: 1). Sistem ini dapat mempermudah
instansi BPBD Kabupaten Kuningan dalam melakukan analisis data kebencanaan khususnya bencana longsor berdasarkan wilayah kecamatan dengan lebih terstruktur.
2). Aplikasi ini berhasil melakukan clustering atau
pengelompokkan dengan teknik Fuzzy C-Means yang mana menghasilkan
pengelompokan data bencana longsor berdasarkan kecamatan dalam pemanfaatannya kepada instansi BPBD Kabupaten Kuningan dalam rangka melakukan analisis lanjutan. 3). Proses clustering dalam
aplikasi ini dapat digunakan oleh pihak BPBD Kabupaten Kuningan dalam rangka melaksanakan proses mitigasi bencana.
� �
Bibliografi
Alfina, T., Santosa, B., & Barakbah, A. R. (2012).
Analisa perbandingan metode hierarchical clustering, k-means dan gabungan
keduanya dalam cluster data (studi kasus: Problem kerja praktek teknik industri
its). Jurnal Teknik Its, 1(1), A521�A525.
Arista, R. R., Asmara, R. A., &
Puspitasari, D. (2017). Pengelompokan Kejadian Gempa Bumi menggunakan Fuzzy
C-Means Clustering. Jurnal Teknologi Informasi Dan Terapan (J-TIT), 4(2),
103�110.
Bifawaidati, I. (2017). Penerapan
Algoritma Fuzzy C-Means Untuk Klasifikasi Citra Tenun Berdasarkan Fitur Tekstur.
Institut Teknologi Sepuluh Nopember.
Kemala, R. F., Astuti, I. F., &
Maharani, S. (2019). Penerapan Metode Fuzzy C-Means Pada Aplikasi Simulasi
Toefl (Test Of English As A Foreign Language) Berbasis Web (Studi Kasus:
Fakultas Mipa Universitas Mulawarman). Jurnal Ilmiah Ilmu Komputer, 14(1),
17.
Li, Q., & Chen, Y.-L. (2009). Data flow
diagram. In Modeling and Analysis of Enterprise and Information Systems
(pp. 85�97). Springer.
Melilisa, I. (2011). analisis data
pembayaran kredit nasabah bank menggunakan metode data mining. Universitas
Multimedia Nusantara.
Pamusti, R. (2018). Studi Kinerja
Algoritma Optimasi pada Metode Quantum Clustering dengan Kernel Entropy
Component Analysis untuk Reduksi Dimensi. Institut Teknologi Sepuluh
Nopember.
Roger, P., & Pressman, P. D. (2012).
Rekayasa Perangkat Lunak. Yogyakarta: Andi.
Sugiyono, S. (2016). Metode penelitian
kuantitatif dan kualitatif dan R&D. Alfabeta Bandung.
Syahputra, T., Halim, J., & Sintho, E.
P. (2018). Penerapan Data Mining Dalam Menentukan Pilihan Jurusan Bidang Studi
Sma Menggunakan Metode Clustering Dengan Teknik Single Linkage. JURTEKSI
(Jurnal Teknologi Dan Sistem Informasi), 4(2), 205�208.
Tan. (2017). Clustering. Retrieved from
Bina Nusantara School of Computer Science.
https://socs.binus.ac.id/2017/03/09/clustering/
Yeh, D., Li, Y., & Chu, W. (2008).
Extracting entity-relationship diagram from a table-based legacy database. Journal
of Systems and Software, 81(5), 764�771.
[u1]?