Bu yazıda “Preprocessing and Mining Web Log Data for Web Personalization” adlı makale özetlenmiştir. Özet Makalede veri ve web madenciliği teknikleri kullanılarak bir web sunucusunun loglarından, web site kullanıcısının davranış modellerinin çıkarılması amaçlanmıştır. Bunun için iki deney seti oluşturularak; ilk deney setinde ziyaret edilen web sayfalarına göre kullanıcının cinsiyeti tahmin edilmeye çalışılmış; ikinci deney setinde kullanıcının ziyaret ettiği web sitesine ilgi duyup duymadığı incelenmiştir. İlk deney setinde, ilişkilendirme algoritması kullanıldığında %68 doğruluk oranı elde edilmektedir. [ Read More ]
Teknolojinin gelişmesi, saklanacak veri sayısı ve veri boyutunun artmasıyla birlikte gün geçtikçe veri madenciliğine olan ihtiyaç artmaktadır. Bununla birlikte saklanacak verilerin saklanması için bilgisayar ortamına ihtiyaç duyulmakta ve istenilen performanslar, tespitler, sınıflandırmalar vs. için veri madenciliğine yönelim gerçekleşmektedir. Bu makalede ise veri madenciliği uygulamalarından olan, karar ağaçları incelenecek olup, az sayıda veri setinden oluşan küçük bir örnek uygulama gerçekleştirilecektir. Örnek uygulama sırasında yaklaşık 10-15 veriye sahip bir eğitim kümesi oluşturulacak, karar ağacı algoritmalarından bir tanesi [ Read More ]
Naive Bayes Sınıflandırıcı adını İngiliz matematikçi Thomas Bayes’ten alır. Naive Bayes Sınıflandırıcı Örüntü tanıma problemine ilk bakışta oldukça sınırlayıcı görülen bir önerme ile kullanılabilen olasılıkçı bir yaklaşımdır. Bu önerme, örüntü tanıma da kullanılacak her bir tanımlayıcı nitelik ya da parametrenin istatistiksel açıdan bağımsız olması gerekliliğidir. Bu önerme her ne kadar Naive Bayes Sınıflandırıcısının kullanım alanını sınırlasa da, genelde istatistik bağımsızlık koşulu esnetilerek kullanıldığında da daha karmaşık Yapay sinir ağları(YSA) gibi metotlarla karşılaştırabilir sonuçlar vermektedir. Naive Bayes, [ Read More ]