Büyük ölçekli veriler arasından "değerli olan"
bilgiyi elde etme işidir. Klasik istatistiksel uygulamalara benzer. Bu
uygulamalar düzenli ve çoğunlukla özet veriler üzerinde çalıştırılır.
Veri madenciliğinde ise çok sayıda veri ve değişken ile ilgilenilir.
Özkan Y., "Veri Madenciliği Yöntemleri", Papatya Yayıncılık, 2008.
Büyük veri yığınlarını işleyebilmek amacıyla geleneksel
veri analiz yöntemlerini karmaşık algoritmalar ile harmanlayan
bir teknolojidir.
Tan P., Steinbach M., Kumar V., "Introduction to Data Mining",
Pearson Education, 2006.
Büyük veri yığınlarından ilginç desenlerin
ve bilginin ortaya çıkarılması işlemidir. Şu adımlardan
oluşur; (1) Veri Temizliği (2) Veri Tümleştirme (3) Veri
Seçimi (4) Veri Dönüşümü (5) Veri Madenciliği (6) Desen Değerlendirme
(7) Bilginin Sunumu.
Han J., Kamber M., Pei J., "Data Mining Concepts and Techniques",
Morgan Kaufmann, 2012.
(1) Sınıflandırma
(2) Kümeleme
(3) Tekrar Eden Desenlerin, İlişkilerin ve İlintilerin Bulunması
(4) Eğilim Analizi
(5) Aykırı Değer Tespiti