29 Mart 2015 Pazar

VERİ MADENCİLİĞİ

VERİ MADENCİLİĞİ
Basit bir tanım yapmak gerekirse veri madenciliği, büyük ölçekli veriler arasından bilgiye ulaşma, bilgiyi madenleme işidir. Ya da bir anlamda büyük veri yığınları içerisinden gelecekle ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranmasıdır.
Bunların arasındaki en yaygın kullanım Veritabanlarında Bilgi Keşfi 'dir. Alternatif olarak veri madenciliği aslında bilgi keşfi sürecinin bir parçası şeklinde kabul görmektedir. Bu adımlar:
  1. Veri temizleme (gürültülü ve tutarsız verileri çıkarmak)
  2. Veri bütünleştirme (birçok veri kaynağını birleştirebilmek)
  3. Veri seçme (yapılacak olan analizle ilgili olan verileri belirlemek )
  4. Veri dönüşümü (verinin veri madenciliği tekniğinden kullanılabilecek hale dönüşümünü gerçekleştirmek)
  5. Veri madenciliği (veri örüntülerini yakalayabilmek için akıllı metotları uygulamak)
  6. Örüntü değerlendirme (bâzı ölçümlere göre elde edilmiş bilgiyi temsil eden ilginç örüntüleri tanımlamak)
  7. Bilgi sunumu (mâdenciliği yapılmış olan elde edilmiş bilginin kullanıcıya sunumunu gerçekleştirmek)

Veri Madenciliği Nasıl Kullanılır ?
“Veritabanlarında Bilgi Keşfi” isimli verilerin anlamlandırılması süreci, veri ile ilgili bütün işlemlerin üst çatısı konumundadır. Veritabanlarında bilgi keşfi bazı adımlardan meydana gelmektedir. Bu adımlar; veri seçimi, ön işleme, dönüşüm, veri madenciliği, yorumlama ve değerlendirmeden oluşmaktadır.
Aslında bir alt madde olan veri madenciliğinin de 6 temel bileşeni vardır. Bunlar; veritabanı, veritabanı sunucusu, bilgitabanı, veri madenciliği motoru, örüntü değerlendirme ve kullanıcı arayüzüdür. Bu bileşenler ile birlikte kullanılan istatistiksel yöntemler, bellek tabanlı yöntemler, yapay sinir ağları ve karar ağaçları ile veriler anlamlandırılır.
Eskiden süpermarketlerde kullanılan kasalar basit bir hesap makinesinden ibaretken, günümüzde kullanılan satış noktası terminalleri ile hem malların zaman içindeki hareketlerini hem de müşterilerin aslışkanlıklarını detaylı analiz edebilme veri madenciliği için kolay anlaşılabilir bir örnektir.
Firmalar, dev internet siteleri, bankalar, sosyal medya, mağaza zincirileri ve hatta devletler, çeşitli veri madenciliği yöntemleri ile birçok konuda analizlere ulaşmaktadırlar. Örneğin “İlk üç taksidinden iki veya daha fazlasını geç ödemiş olan müşteriler %60 olasılıkla kanuni takibe gidiyor.” veya “X şirketinin hisse fiyatları ile Y şirketinin hisse fiyatları benzer hareket ediyor.” gibi analizleri ve “Normalden farklı davranış gösteren müşterilerim var mı?” veya “Arşivimde bu dokümana benzer hangi dokümanlar var?” gibi soruların cevapları veri madenciliği ve yorumlanması ile anlamlandırılır. Bu gibi analizler ve geleceğe yönelik tahminler firmalar için paha biçilemez bilgilerdir.
Dünyada; Facebook’un arkadaş ve sayfa önerileri, Amazon’un bookmatcher uygulaması veri madenciliği uygulamalarına örnektir. Ülkemizde ise İMKB 100 endeksi analizi programları, ÖSYM tarafından yapılan ÖSS başarı faktörleri analiz programları ve Gima Türk A.Ş.’nin müşteri ve mal analiz programları çeşitli yüksek lisans tezleri ve araştırmalar dahilinde kullanılmıştır.

Hiç yorum yok:

Yorum Gönder