PENERAPAN DATA MINING UNTUK MENENTUKAN STRATEGI PENJUALAN PADA TOKO BUKU GRAMEDIA MENGGUNAKAN METODE CLUSTERING
Toko Buku Gramedia
merupakan salah satu perusahaan yang bergerak dibidang bisnis ritel dengan
produk utama buku dan alat-alat tulis. Dimana perusahaan ini setiap harinya
harus memenuhi kebutuhan konsumen dan dituntut untuk dapat mengambil keputusan
yang tepat dalam menentukan strategi penjualan. Untuk dapat melakukan hal
tersebut, perusahaan membutuhkan sumber informasi yang cukup banyak untuk
dianalisis lebih lanjut.
Pada Toko Buku Gramedia,
terdapat beberapa permasalahan yang kerap muncul mengenai penjualan buku.
Perusahaan sulit mendapatkan informasi-informasi strategis seperti tingkat
penjualan buku pelajaran sekolah. Ketersediaan data penjualan yang besar pada
Toko Buku Gramedia Palembang tidak digunakan semaksimal mungkin, sehingga data
penjualan tersebut tidak dimanfaatkan secara optimal untuk merancang sebuah
strategi bisnis dalam meningkatkan penjualan.
Melihat kondisi diatas maka penulis tertarik untuk melakukan penerapan data mining untuk menentukan
strategi penjualan pada Toko Buku Gramedia.
Adapun metode untuk
menganalisis data dalam penerapan data mining ini adalah dengan menggunakan
tahapan Knowledge Discovery in Database (KDD) yang terdiri dari beberapa
tahapan, yaitu data selection, preprocessing, transformation, data mining, dan
evaluation. (Kusrini, 2009:7). Berikut adalah tahapan Knowledge Discovery in
Database (KDD) yang ditunjukkan pada gambar di bawah ini.
Tahapan Knowledge Discovery in Database (KDD)
Data Selection
Data yang digunakan dalam penelitian ini berasal dari
Toko Buku Gramedia Palembang yaitu data transaksi penjualan buku pelajaran
SD,SMP, SMA dan SMK dari tahun 2011, 2012 dan 2013. Dari semua atribut yang ada
pada tabel transaksi penjualan tersebut terdapat 6 atribut yang akan digunakan
dalam proses knowledge discovery in databases (kdd). Atribut tersebut yaitu:
1. KODE BUKU merupakan atribut yang terdapat pada
tabel transaksi penjualan yang menjelaskan tentang informasi mengenai kode buku
.
2. KATEGORI merupakan atribut yang terdapat pada tabel
transaksi penjualan yang menjelaskan tentang kategori jenis buku tersebut.
3. KELAS merupakan atribut yang terdapat pada tabel
transaksi penjualan berdasarkan kategori jenis buku.
4. PENERBIT merupakan atribut yang terdapat pada tabel
transaksi penjualan yang menjelaskan tentang penerbit buku tersebut.
5. TAHUN merupakan atribut yang terdapat pada tabel
transaksi penjualan yang menjelaskan tentang tahun penjualan buku tersebut.
6. JUMLAH merupakan atribut yang terdapat pada tabel
transaksi penjualan yang menjelaskan
jumlah penjualan per tahun.
Pre-Prosecessing
Pada tahapan pre-processing ini akan
dilakukan beberapa langkah untuk menghasilkan dataset yang bersih sehingga
dapat digunakan dalam tahap berikutnya yaitu mining dengan tujuan memperoleh
pola penjualan yang terjadi terhadap seluruh transaksi penjualan yang telah
dilakukan. Berikut langkah-langkah yang dimaksud diatas :
a. Integrasi Data, tahap integrasi data
adalah tahap penggabungan data dari berbagai sumber. Proses penggabungan
dilakukan dengan merelasikan proses integrasi data tersebut dengan query
seperti yang terlihat pada gambar di bawah.
Query diatas menjelaskan bahwa atribut
tersebut diambil dari proses penggabungan tiga data source yaitu tabel
penjualan tahun 2011 , tabel penjualan tahun 2012, dan tabel penjualan tahun
2013. Dimana atribut penghubungnya adalah Kode Buku.
b. Data Cleaning , tahap pembersihan data merupakan
tahap awal dari proses KDD. Seluruh atribut pada dataset di atas selanjutnya
akan diseleksi untuk mendapatkan atribut-atribut yang berisi nilai yang
relavan. Tidak missing value, dan tidak redundant, dikatakan missing value jika
atribut-atribut dalam dataset tidak berisi nilai atau kosong, sementara itu
data dikatakan redundant jika dalam satu dataset yang sama terdapat lebih dari
satu record yang berisi nilai yang sama. Untuk menampilkan data missing value
dapat menggunakan query seperti yang terlihat pada kode program di bawah.
Query diatas
artinya data yang akan ditampilkan adalah data yang dimana kondisi salah satu
dari atribut jumlah 2011, jumlah 2012,
dan jumlah 2013 terdapat data yang N NULL atau kosong.
Penerapan Clustering dengan Algoritma K-Means
Setelah melakukan
proses transformasi data kedalam bentuk data yang sesuai untuk penerapan data
mining dengan teknik custering maka tahapan ini dapat dilakukan. Clustering
merupakan proses membagi data dalam suatu himpunan ke dalam beberapa kelompok
yang kesamaan datanya dalam suatu kelompok lebih besar dari pada kesamaan
tersebut dengan data kelompok lainnya (Santoso,2007). Dalam tahapan penemuan
aturan clustering ini, langkah yang dilakukan adalah
mengembangkan
aturan yang mungkin akan menjadi informasi data penjualan. Data tahapan awal
untuk menghasilkan informasi aturan clustering dari setiap data transaksi
penjualan dihitung dengan dataset. Cluster secara umum merupakan wujud himpunan
bagian dari suatu himpunan data dan metode clustering dapat diklasifikasikan
berdasarkan himpunan bagian yang dihasilkan : apakah fuzzy atau crisp (hard).
Algoritma K-Means
K-Means merupakan
salah satu metode pengelompokan data nonhierarki (sekatan) yang berusaha
mempartisi data yang ada ke dalam bentuk dua atau lebih kelompok. Metode ini
mempatisi data kedalam kelompok sehingga data yang berkarakteristik berbeda
dikelompokkan ke dalam kelompok yang lain. Adapun tujuan pengelompokan data ini
adalah untuk meminimalkan variasi di dalam suatu kelompok dan memaksimalkan
variasi antar kelompok (Eko Prasetyo,2012).
Pengelompokkan data dengan metode Kmeans ini secara
umum dilakukan dengan algoritma sebagai berikut :
1. Tentukan jumlah kelompok.
2. Alokasikan data ke dalam kelompok secara acak.
3. Hitung pusat kelompok (sentroid/rata-rata) dari
data yang ada di masing-masing kelompok.
4. Alokasikan masing-masing data ke sentroid /
rata-rata terdekat.
5. Kembali ke langkah 3, apabila masih ada data yang
berpindah kelompok, atau apabila perubahan nilai pada fungsi objektif yang
digunakan masih diatas nilai ambang yang ditentukan.
Interpretasi
Berdasarkan dari penelitian yang telah dilaksanakan
dan sudah diuraikan dalam penerapan data mining dari data transaksi penjualan
buku tersebut, maka dapat ditarik kesimpulan sebagai berikut :
1. Penerapan data mining dengan teknik clustering dan
algoritma k-means yang dilakukan menghasilkan sebuah informasi mengenai
kategori dan penerbit buku dimana dari informasi tersebut didapat jumlah buku
pelajaran yang paling banyak terjual yaitu buku SD berjumlah 7.0577 dan buku
SMA berjumlah 5.5713 .
2. Dari hasil diatas maka dapat diketahui penerbit
buku yang paling banyak diminati pada Toko Buku Gramedia Palembang yaitu buku
pelajaran penerbit Erlangga dan
Esis.
3. Semakin kecil batasan nilai data transaksi
penjualan yang ditentukan maka semakin sedikit pula pola/aturan yang dapat
dihasilkan dan waktu yang diperlukan lebih sedikit.
4. Perhitungan yang dilakukan secara teoritis dan
aplikatif menghasilkan nilai data transaksi penjualan yang ditentukan.
5. Waktu yang diperlukan untuk pemrosesan tergantung
pada spesifikasi komputer, jumlah transaksi yang diolah dan jumlah item yang
terlibat sehingga perumusan yang tepat untuk perhitungan waktu belum dapat
ditentukan.
Daftar Pustaka :
http://eprints.binadarma.ac.id/2031/1/Jurnal%2010142018.pdf