A. Pengertian
  • Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat pada basis data.
  • Datamining terutama digunakan untuk mencari pengetahuan yang terdapat dalam basis data yang besar sehingga sering disebut Knowledge Discovery Databases (KDD).
  • Data Mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data.
B. Latar Belakang
  • Dilatar belakangi dengan keadaan berlimpahnya data (overload data) dan Ledakan informasi (explotion information) yang dialami oleh perusahaan, institusi atau organisasi.
  • Berlimpahnya data merupakan akumulasi dari datra transaksi yang terekam bertahun-tahun.
  • Data transaksi tersebut umumnya menggunakan aplikasi OLTP (On-Line transaction Processing)
C. Manfaat
  • Pemanfaatan data mining dilihat dari dua sudut pandang, yaitu sudut pandang komersial dan sudut pandang keilmuan.
  • Dari sudut pandang komersial, pemanfaatan datamining dapat digunakan untuk menangani meledaknya volume data, dengan menggunakan teknik komputasi dapat digunakan untuk menghasilkan informasi-informasi  yang dibutuhkan  yang merupakan asset yang dapat meningkatkan daya saing suatu institusi.
Contohnya:
  1. bagamana mengetahui hilangnya pelanggan karena pesaing
  2. Bagaimana mengetahui item produk atau konsumen yang memiliki kesamaan karakteristik
  3. Bagaimana mengidentifikasi produk-produk yang terjual bersamaan dengan produk lain
  4. bagaimana memprediksi tingkat penjualan
  5. Bagaimana menilai tingkat resiko dalam menentukan jumlah produksi suatu item
  6. Bagaimana mempresiksi perilaku bisnis dimasa yang akan dating

·         Dari sudut pandang keilmuan, data mining dapat digunakan untuk mengcapture, menganalisis serta menyimpan data yang bersifat real time dan sangat besar, misalnya:
1.      Remote semsor yang ditempatkan pada suatu satelit
2.      Telescope yang digunakan untuk memindai langit
3.      Simulasi saintifik yang membangkitkan data dalam ukuran terrabytes





D.Proses
  • Data mining merupakan salah satu dari rangkaian Knowledge Discovery in Database(KDD). KDD berhubungan dengan teknik integrasi dan penemuan ilmiah, interpretasi dan visualisasi dari pola-pola sejumlah data.
  • Serangkaian proses tersebut memiliki tahap sbb (Tan, 2004):


1.      Pembersihan data dan integritas data (Cleaning & Integration)
Proses ini digunakan untuk membuang data yang tidak konsisten dan bersifat noise dari data yang terdapat di berbagai basisdata yang mungkin berbeda format maupun platform yang kemudian dinintegrasikan dalam satu database datawarehouse
2.      Seleksi dan transformasi data (selection and transformation)
Data yang ada dalam database datawarehouse kemudian direduksi untuk mendapatkan hasil yang akurat. Beberapa cara seleksi, antara lain:
Ø  Sampling, adalah seleksi subset representative dari populasi data yang besar
Ø  Denoising, adalah proses menghilangkan noise dari data yang akan ditranformasikan
Ø  Feature extraction, adalah proses membuka spesifikasi data yang signifikan dalam konteks tertentu.
Transformasi data diperlukan sebagai tahap pre-procecing, dimana data yang siap untuk ditambang. Beberapa cara transformasi, antara lain (Santosa, 2007):
Ø  Centering, mengurangi setiap data dengan rata-rata setiap atribut yang ada
Ø  Normalisation, membagi setiap data yang dicentering dengan standar deviasi dari atribut yang bersangkutan
Ø  Scaling, mengubah data sehingga berada dalam skala tertentu
3.      Penambangan data (data mining)
Data yang telah ditransformasi, kemudian ditambang dengan berbagai teknik. Proses data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunkan fungsi-fungsi tertentu. Fungsi atau algoritma dalam data mining sangat bervariasi, dimana pemilihannya bergantung pada tujuan dan proses pencarian pengetahuan secara menyeluruh.
4.      Evaluasi pola dan presentasi pengetahuan
Tahap ini merupakan bagian dari proses pencarian pengetahuan yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya. Langkah terakhir KDD adalah mempresentasikan pengetahuan dalam bentuk yang mudah dipahami pengguna.
E. Fungsi-Fungsi
  • Fungsi-fungsi yang umum diterapkan dalam data mining (Haskett, 2000)
  1. Assosiation, adalah proses untuk menemukan aturan assosiatif antara suatu kombinasi item dalam suatu waktu
  2. Sequence, proses untuk menemukan aturan assosiatif antara suatu kombinasi item dalam suatu waktu dan diterapkan lebih dari satu periode
  3. Clustering, adalah proses pengelompokan seumlah data/obyek ke dalam kelompok data sehingga setiap kelompok berisi data yang mirip
  4. Classification, proses penemuan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui.
  5. Regretion, adalah proses pemetaan data dalam suatu nilai prediksi
  6. Forecasting, adalah proses pengestimasian nilai prediksi berdasarkan pola-pola di dalam sekumpulan data.
  7. Solution, adalah proses penemuan akar masalah dan problem solving dari persoalan bisnis yang dihadapkai atau paling tidak sebagai informasi dalam pengambilan keputusan.

G. Disiplin ilmu dan teknik-teknik
·         Data mining dalam penerapannya menggabungkan berbagai bidang ilmu, antara lain: Sistem basis data, statistic, sistem cerdas, pembelajaran mesin, pengenalan pola, dan visualisasi
·         Contoh aplikasi beserta fungsi dan teknik yang dipergunakan


F. Penerapan
  1. Analisa Pasar & Manajemen
Sumber data yang digunakan seperti transaksi kartu kredit, kartu anggota club tertentu, kupon diskon, keluhan pembeli, ditambah dengan studi tentang gaya hidup public.
Beberapa solusi yang dapat diselesaikan dengan data mining antara lain:
    • Menembak target pasar
Data mining dapat melakukan pengelompokan(clustering) dari model-model pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang diinginkan seperti kedukaan yang sma, tingkat penghasilan yang sama, kebiasaan membeli dan karakteristik lainnya.
    • Melihat pola beli pemakai dari waktu ke waktu
Data mining dapat digunakan untuk melihat pola beli dari waktu ke waktu. Sebagai contoh, ketika seorang menikah bias saja dia kemudian memutuskan untuk pidah dari single account ke joint account.
    • Cross Market Analysis
Kita dapat memanfaatkan untuk melihat hubungan antara penjualan satu produk dengan produk lainnya.
    • Profil Customer
Data mining dapat melihat profil customer sehingga dapat mengetahui kelompok customer tertentu suka membeli produk apa saja.
    • Identifikasi kebutuhan customer
Dapat mengidentifikasi produk apa saja yang terbaik untuk tiap kelompok customer dan factor apa saja yang dapat menarik konsumen baru.
    • Menilai Loyalitas Customer
    • Informasi Summary
Dapat digunakan untuk membuat laporan summary yang bersifat multi dimensi dan dilengkai dengan informasi statistic lainnya.
  1. Analisa Perusahaan dan Manajemen Resiko
  • Perencanaan Keuangan dan Evaluasi AsetData mining dapat membantu melakukan analisi dan prediksi cash flow serta dapat melakukan contingent claim analysis untuk mengevaluasi aset. Selain itu dapat menggunakan untuk analisis trend.
  • Perencanaan Sumber DayaDengan melihat ringkasan informasi serta pola pembelanjaan dan pemasukan dari masing-masing resource. Maka dapat memanfaatkan untuk resouce planning.
  • PersainganData mining dapat membantu untuk memonitor pesaing-pesaing dengan melihat market direction mereka.
  • Data mining juga dapat melakukan pengelompokan customer dan dapat memberikan variasi harga untuk masing-masing grup.

  1. Telekomunikasi

Data mining melihat jutaan transaksi yang masuk, dan melihat transaksi mana sajakah yang masih harus ditangani secara manual. Tujuannya adalah untuk menambah layanan otomatis.

0 komentar:

Posting Komentar