Jurnal Syntax Admiration |
Vol. 2 No. 3 Maret 2021 |
p-ISSN : 2722-7782 e-ISSN : 2722-5356 |
Sosial Teknik |
PENGEMBANGAN
ALGORITMA C4.5 BERBASIS PARTICLE SWARM OPTIMIZATION UNTUK PENENTUAN KELAYAKAN
ASURANSI
Jatmiko Indriyanto,
Miftakhul Huda dan Ida Afriliana
Universitas Harapan Bangsa, Banyumas Jawa Tengah, Indonesia
Politeknik Harapan Bersama Tegal Jawa Tengah, Indonesia
Politeknik Harapan Bersama Tegal Jawa Tengah, Indonesia
Email: dewajat@gmail.com,� [email protected]
dan [email protected]
INFO
ARTIKEL |
ABSTRACT |
Diterima 25 Februari 2021 Diterima dalam bentuk revisi 15 Maret 2021 Diterima dalam bentuk revisi |
The purpose of this study is for the
Development of Particle Swarm Optimization-Based C4.5 Algorithm For Determining Insurance Eligibility. logistic regresion methods, decision trees, k-nearest neighbors,
na�ve bayes and vector machines support.�
The model will determine or predict the future status of consumers.
Similar observations have also been made, but in different ways. In this
research, C4.5 classification algorithm based on Particle Swarm Optimization
(PSO), the desired accuracy result is better than using only C4.5 algorithm
to solve problems in the case of insurance product selection. it can be
concluded that the accuracy value obtained in the PSO-based C4.5 algorithm
model is 98.93% better when compared to the C4.5 algorithm model of 97.84%.
From the results obtained the difference between the two models is worth
0.4%. While for the study using ROC curve for both models is, for the C4.5
algorithm model the AUC value is 0.970 with the Excellent Classification
diagnostic sequence, and for the PSO-based C4.5 algorithm model the AUC value
is 0.968 with the Excellent Classification diagnostic sequence. ABSTRAK Tujuan penelitian ini adalah untuk Pengembangan Algoritma C4.5 Berbasis Particle Swarm Optimization Untuk Penentuan Kelayakan Asuransi. metode logistic regresion,
decision trees, k-nearest neighbors, na�ve bayes dan support vector
machines.� Model tersebut akan menentukan atau memprediksi status konsumen dimasa mendatang. Observasi yang mirip juga pernah dilakukan, tetapi dengan cara berbeda. Pada penilitian ini, akan digunakan algoritma klasifikasi C4.5 berbasis Particle Swarm Optimization (PSO), hasil ketepatan yang diinginkan lebih bagus dibandingkan hanya memakai algoritma C4.5 untuk mengatasi permasalahan pada kasus pemilihan produk asuransi. dapat disimpulkan bahwa nilai akurasi
yang didapatkan pada model algoritma
C4.5 berbasis PSO adalah
98.93% lebih bagus jika dibandingkan dengan model algoritma C4.5 yaitu 97.84%. Dari hasil tersebut didapatkan perbedaan antara kedua model yaitu senilai 0.4%. Selagi untuk penelaahan menggunakan ROC curve bagi kedua model ialah,untuk
model algoritma C4.5 nilai
AUC adalah 0.970 dengan urutan diagnosa� Excellent Classification, dan untuk model algoritma C4.5 berbasis PSO nilai AUC adalah� 0.968 dengan urutan diagnosa Excellent
Classification. |
Keywords: C4.5
algorithm; PSO; insurance Kata Kunci: algoritma C4.5; PSO; asuransi |
Coresponden Author
Email:
dewajat@gmail.com
Artikel dengan akses terbuka dibawah lisensi
Pendahuluan
Banyak perusahaan yang bersedia untuk membayar kerugian yang sedikit pada masa sekarang agar terhindar dari risiko kerugian yang besar yang mungkin terjadi di masa dating (Utari & Wibowo, 2020). Karena kemungkinan kerugian di masa datang telah dipindahkan
kepada pihak lain yang mau menanggungnya, misalnya perusahaan asuransi (Umam, 2018). Banyak masyarakat tidak menyadari risiko yang akan dihadapi di hari tua, risiko
biaya pendidikan bagi anak� yang tiap tahunnya selalu bertambah, risiko biaya kesehatan baginya dan keluarga,� risiko kendaraan pribadi yang digunakan, risiko bagi keluarga yang ditinggalkan (Maralis & Triyono, 2019).
Asuransi adalah suatu metode
untuk meminimalisir risiko dengan jalan
memindahkan dan mengkombinasikan
ketidakjelasan akan adanya kehilangan keuangan (Indriyanto & Purwanto, 2014). Dengan adanya� perusahaan asuransi, kita dapat memindahkan resiko (ketidakpastian) yang kita hadapi� menjadi kepastian (Santoso et al., 2018).
Sesuai Undang-Undang Republik Indonesia
no.2 tahun 1992 tentang usaha perasuransian, ada pasal 1 ayat
3, ���dengan tujuan untuk memberikan perlindungan dasar bagi kesejahteraan masyarakat.� yang merupakan tujuan utama dari
perusahaan asuransi (Siswanti, 2017). Masyarakat Indonesia
pada biasanya, masih tidak mau atau
tidak mengindahkan pentingnya perancangan asuransi (Ermawati, 2019). Bila mereka dikunjungi
oleh agen asuransi, maka mereka akan
mengelak. Agen asuransi seringkali menjual produk yang tidak sesuai dengan
kebutuhan kliennya, sehingga klien merasa kehilangan. Agen asuransi juga sering menawarkan produk asuransi, langsung pada produknya, padahal sebagian besar penduduk belum mengerti tentang asuransi (Santoso et al., 2018). Ada agen asuransi yang belum tahu benar
mengenai produk yang akan ditawarkan, tetapi langsung terjun ke masyarakat
(Rani, 2015). Ada polis asuransi yang sudah di acc, tetapi ditengah jalan atau pada akhir masa polis bermasalah, dikarenakan informasi yang diberikan tidak tepat.Sehingga menentukan produk asuransi sering tidak akurat
(sulistiyanto, 2018).
����������������������������������������������������� ����������������
Metode Penelitian
1. Pengumpulan data
Pada tahap ini
diplotkan data yang akan diolah. Mencari data yang tersedia, mendapat data tambahan yang diinginkan, menggabungkan semua data kedalam dataset, termasuk� variabel
yang diperlukan dalam
proses. Hal yang dilakukan dalam
pengumpulan data, menentukan
poin-poin apa saja data yang akan disimpan dan diperlukan dari nasabah asuransi
�(Utama, 2013).
2. Pengolahan awal data
Ditahap ini dilakukan pemilihan
data, data dibersihkan dan dirubah
kebentuk yang� diinginkan sehingga dapat dilakukan persiapan dalam pembuatan model. Hal yang dilakukan� dalam pengolahan data, merubah data yang diinput oleh nasabah asuransi, menjadi data yang� berguna bagi nasabah
asuransi dan perusahaan asuransi (Karlia, 2021).
3. Metode yang diusulkan (ProposedMethod)�
Pada tahap ini data diobservasi, dibagi-bagi variabel mana yang berkorelasi dengan satu� sama
lainnya. Setelah data diobservasi
lalu diimplementasikan
model-model yang sesuai dengan
jenis data. Pembagian data kedalam data uji coba (training
data) dan data uji (testing data) juga� diperlukan untuk pembuatan model yang dilakukan dalam poin ini, mengkaitkan
data yang� satu
dengan lainnya, agar menjadi data yang lebih berguna bagi pengguna
aplikasi nasabah asuransi.
4. Eksperimendan pengujian model (Model Testing and Experimen)�
Pada tahap ini
model yang dajukan akan diuji untuk melihat
hasil berupa aturan yang akan� dimanfaatkan
dalam pengambilan keputusan. Dalam tahap ini, aplikasi
dicoba langsung oleh� nasabah
asuransi.�
5. Evaluasi dan validasihasil (Result Evaluation)�
Pada tahap ini
dilakukan penilaian terhadap model yang ditetapkan untuk memahami tingkat keakurasian model.
Setelah aplikasi dicoba akan muncul kekurangan-kekurangan
dari aplikasi tersebut, dan biasa dibenahi. Hasil yang diharapkan dari penelitian ini adalah: jumlah
nasabah asuransi aktif, alamat tempat� bekerja, dan
biodata nasabah asuransi.�
����������������������������������������������������� ������
A. Pengumpulan data
Ada dua tipe dalam
pengumpulan data, yaitu pengumpulan data primer dan pengumpulan� data sekunder
. Data primer adalah data yang dikumpulkan
pertama kali untuk melihat� apa yang sesungguhnya terjadi sedangkan data sekunder adalah data yang sebelumnya� pernah dibuat oleh seseorang baik di terbitkan atau tidak (Martono, 2010). Pengumpulan� data primer bisa didapat dari model interview terhadap
responden, maupun dengan� model observasi terhadap suatu badan yang sedang diteliti (Bustami, 2013). Pada observasi� ini
digunakan pengumpulan data sekunder.
1. Pengolahan Awal Data
Untuk memperoleh data yang lebih bagus terdapat teknik preprocessing yang� digunakan pada penelitian ini, yaitu: �data integration and transformation, untuk menaikkan akurasi dan efisiensi algoritma (Novianto, 2019). Data yang digunakan dalam penulisan ini bernilai kategorikal.
Data dirubah kedalam angka menggunakan aplikasi Rapid Miner.
2. Metode Yang Diusulkan (Proposed
Method)�
Adapun
model algoritma yang dipakai
dalam penelitian ini adalah:
a.
Algoritma C4.5 yaitu model untuk merubah data menjadi pohon keputusan
dengan aturan-aturannya (rules).
b.
Particle Swarm Optimization yaitu mendapatkan solusi yang terbaik dengan� meningkatkan
atribut (attribute
wighting), berupa partikel yang bergerak kearah posisi� yang terbaik dari posisi sebelumnya.
3. Eksperimen Dan Pengujian Model (Model
Testing And Experimen)�
Pada tahap ini dilakukan
eksperimen dan pengujian
model yaitu mengkalkulasi
dan mendapatkan rule-rule yang ada
pada model algoritma yang diusulkan.
Setelah itu, diuji rule tadi kedalam model cross validation untuk
mendapatkah hasil yang lebih baik. Evaluasi
dan validasi hasil (Result Evaluation)
B. Model Algoritma C4.5
Algoritma C4.5 untuk model yang
pertama dilakukan. Berikut tahap-tahap yang akan dilakukan sebagai berikut:
1.
Mengkalkulasi jumlah kasus class ya dan class tidak serta nilai
entropy dari
semua kasus. Kasus dibagi berdasarkan
atribut, jumlah kasus 2268 record,
kelas ya ada 94 record dan
kelas tidak sebanyak 2174 record sehingga didapat entropy:
2.
Hitung nilai gain dari setiap atribut,
sebagai contoh untuk 3 data nasabah asuransi: ≤
6989.500 = 2203/2268 > 6989.500 = 65/2268 Atribut� nasabah asuransi<
6989.500 terdiri dari 32
class ya dan 2171 class tidak,
dan� untuk atribut nasabah asuransi > 6989.500 terdiri dari
62 class
ya dan 3 class tidak. Nilai
Entropynya dapat dikalkulasi sebagai berikut:
3.
Algoritma C4.5 berbasis Particle
Swarm Optimization Algoritma C4.5 menggunakan metode particle
swarm optimization untuk model yang kedua� dilakukan (JULIA, 2020). Berikut langkah-langkah yang akan dilakukan adalah mengkalkulasi jumlah kasus class ya dan class tidak serta nilai
entropy dari semua kasus. kasus dibagi
berdasarkan atribut dengan jumlah kasus
2268 record, kelas ya ada 94 record dan kelas tidak sebanyak 2174 record
sehingga didapat entropy:
4.
Hitung nilai Gain dari setiap atribut
sebagai contoh untuk 3 data nasabah asuransi: ≤
6989.500 = 2203/2268 > 6989.500 = 65/2268 Atribut� nasabah asuransi<
6989.500 terdiri dari 32 class
ya dan 2171 class tidak,
dan� untuk atribut nasabah asuransi > 6989.500 terdiri dari 62 class ya dan 3 class tidak. Nilai entropynya dapat dikalkulasi sebagai berikut:
5.
Hitung nilai Gain dari masing-masing atribut sebagai contoh untuk nasabah asuransi:
≤ 3854.001
= 2149/2268
C.
Pohon Keputusan C4.5
Adapun tata cara yang didapatkan dari observasi adalah sebagai berikut:
D.
Evaluasi Confension Matrix C4.5 Berbasis PSO
Tabel 2
�Konversi
Confusion Matrix Algoritma Klasifikasi
C4.5 Berbasis PSO
|
True layak |
True tidak |
Class precision |
Pred SESUAI |
293 |
5 |
98,88% |
Pred TIDAK |
12 |
823 |
98,83% |
Class recall |
98,93% |
99,15% |
|
Banyaknya True Positive (TP) adalah 293 record dikelompokkan sebagai sesuai dan False Negative (FN) sejumlah 9 record dikelompokkan sebagai sesuai tetapi tidak. Berikutnya 823 record untuk True Negative (TN) dikelompokkan seperti tidak, dan 3 record False Positive (FP) diklasifikasi sebagai tidak ternyata sesuai.
Tabel 3
Hasil Perhitungan Algoritma
C4.5 Berbasis PSO
|
Nilai(%) |
Accuracy |
98,93% |
Sensitivity |
96,95% |
Specitivity |
99,52% |
PPV |
97,99% |
NPV |
98,98% |
Melihat Tabel 3 menunjukan bahwa, tingkat akurasi menggunakan algoritma klasifikasi C4.5 berbasis particle swarm optimization adalah sebesar 98,93%.
E.
Penilaian dengan ROC C4.5 Berbasis PSO
Gambar
3
Nilai
AUC dalam grafik ROC algoritma C4.5 berbasis(PSO)
Pada Gambar 3 menunjukkan grafik ROC dengan nilai AUC (Area Under Curve) sejumlah 0,989 dengan golongan diagnosa Excellent Classification.
Kesimpulan��������������������������������������������������������������
Dari hasil analisa
optimasi dapat disimpulkan bahwa nilai akurasi
yang didapatkan pada model� algoritma
C4.5 berbasis PSO adalah 98.93%
lebih bagus jika dibandingkan dengan model� algoritma C4.5 yaitu 97.84%. Dari
hasil tersebut didapatkan perbedaan antara kedua model� yaitu senilai 0.4%. Selagi untuk penelaahan menggunakan ROC curve
bagi kedua model ialah untuk model algoritma C4.5 nilai AUC adalah 0.970 dengan urutan diagnosa Excellent Classification, dan untuk model algoritma C4.5 berbasis PSO nilai AUC adalah� 0.968 dengan
urutan diagnosa Excellent Classification. Dari evaluasi ROC curve tersebut� tampak bahwa model algoritma C4.5 berbasis PSO lebih kecil walaupun tidak� merubah tingkat diagnosa, ini disebabkan
karena terjadinya imbalance terhadap
data atau tidak sama antara ya
terpilih dan tidak terpilih. lalu diuji kembali� menggunakan
uji statistik t-test dan mendapatkan
hasil bahwa algoritma C4.5 berbasis PSO lebih bagus nilai
akurasinya. Akhirnya dapat diambil keputusan
akhir bahwa algoritma C4.5 berbasis particle swarm optimization lebih akurat dalam
menentukan kelayakan asuransi.
�
BIBLIOGRAFI
Bustami, B. (2013). Penerapan Algoritma
Na�ve Bayes Untuk Mengklasifikasi Data Nasabah Asuransi. Techsi-Jurnal
Teknik Informatika, 5(2).
Ermawati, E. (2019). Algoritma Klasifikasi
C4. 5 Berbasis Particle Swarm Optimization Untuk Prediksi Penerima Bantuan
Pangan Non Tunai. Sistemasi: Jurnal Sistem Informasi, 8(3),
513�528.
Indriyanto, J., & Purwanto, C. S.
(2014). Algoritma K-Nearest Neighbor Berbasis Chi-Squared Untuk Prediksi
Nasabah Asuransi. Pascasarjana Teknik Informatika Universitas Dian
Nuswantoro.
Julia, A. (2020). Analisa History Data
Claim Member Asuransi Kesehatan Menggunakan Algoritma C4. 5 Untuk Menentukan
Proses Pembayaran Persetujuan Pengobatan. Universitas Mercu Buana Jakarta.
Karlia, J. A. (2021). Penerapan
Algoritma C4. 5 Untuk Klasifikasi Keterlambatan Pembayaran Premi Asuransi.
Universitas Katolik Musi Charitas.
Maralis, R., & Triyono, A. (2019). Manajemen
Resiko. Deepublish.
Martono, N. (2010). Metode Penelitian
Kuantitatif: Analisis Isi Dan Analisis Data Sekunder (Sampel Halaman Gratis).
Rajagrafindo Persada.
Novianto, R. (2019). Penerapan Data Mining
Menggunakan Algoritma K-Means Clustering Untuk Menganalisa Bisnis Perusahaan
Asuransi. Jatisi (Jurnal Teknik Informatika Dan Sistem Informasi), 6(1),
85�95.
Rani, L. N. (2015). Klasifikasi Nasabah
Menggunakan Algoritma C4. 5 Sebagai Dasar Pemberian Kredit. Komputer
Teknologi Informasi, 2(2).
Santoso, F., Syukur, A., & Fanani, A.
Z. (2018). Algoritma C4. 5 Dengan Particle Swarm Optimization Untuk Klasifikasi
Lama Menghafal Al-Quran Pada Santri Mahadul Quran. Jurnal Cyberku, 14(2),
92�103.
Siswanti, D. D. (2017). Penentuan
Klasifikasi Pasien Asuransi Dan Non Asuransi Pada Rsud Nganjuk Dengan Metode
Algoritma C4. 5. Sekolah Tinggi Teknik-Pln.
Sulistiyanto. (2018). Penerapan C4 . 5
Berbasis Particle Swarm Optimization (Pso) Dalam Memprediksi Siswa Lolos
Seleksi Perguruan Tinggi. Semin. Nas. Teknol. Dan Bisnis, 162�170.
Umam, K. (2018). Memahami Dan Memilih
Produk Asuransi. Mediapressindo.
Utama, Y. H. (2013). Penerapan Algoritma
C4. 5 Untuk Membantu Calon Konsumen Dalam Menentukan Program Asuransi Yang
Sesuai (Studi Kasus: Pt. Asuransi Bintang Tbk.). University Of Muhammadiyah
Malang.
Utari, D. R., & Wibowo, A. (2020).
Pemodelan Prediksi Status Keberlanjutan Polis Asuransi Kendaraan Dengan Teknik
Pemilihan Mayoritas Menggunakan Algoritma-Algoritma Klasifikasi Data Mining. Prosiding
Seminar Nasional Teknoka, 5, 19�24.
��������������������������������������������������������������������������������