Bolu Beyi tarafından yazıldı Ağustos - 15 - 2016 0 Yorum

Bu makalede, https://github.com/PatMartin/Dex/blob/master/data/bank-data.csv linkinde yer alan “bank-data” veri seti kullanılarak, WEKA programı üzerinde Apriori algoritmasının kullanımı açıklanmıştır.

İşlem Basamakları

1- Veri seti incelendiğinde 11 adet nitelik olduğu görülmektedir. “id” kolonu tekil değere sahip olmakla birlikte; veri madenciliği algoritmalarında bir yararı olmayacağı için silinmiştir. Yeni veriseti “bank-data2.csv” adıyla kaydedilmiştir.

2- Bazı niteliklerin ayrık veriler olduğu, bazı verilerin ise sürekli veriler olduğu görülmektedir. Apriori algoritması sürekli verilerle çalışmayacağı için, sürekli verilere sahip “age” ve “income” nitelikleri WEKA programı ile 3 parçaya bölünmüştür. Bunun için, “age” ve “income” nitelikleri seçilerek, “Filter” kısmından;

choose –> filters –> unsupervised –> attribute –> Discretize

işlemleri gerçekleştirilmiştir. Sonrasında 3 parçaya bölmek için “bins” özelliği 3 olarak belirlenmiştir. “Apply” butonuna bastıktan sonra yeni veriseti “bank-data3.csv” adıyla kaydedilmiştir.

weka1

 

 

 

 

 

 

 

 

3- Veri seti hazır hale getirildikten sonra “Associate” sekmesinden Apriori algoritması seçilmiştir. Ödevde 100 adet kural oluşturulması istendiği için “numRules” 100 olarak ayarlanmıştır. Minimum confidence değeri varsayılan değerde (0.9) bırakıldığında 47 adet kural oluştuğu gözlemlenmiştir. En az 100 adet kural oluşması için minimum confidence değeri 0.8 olarak belirlenmiştir.

weka2

 

 

 

 

 

 

 

4- Son olarak “Start” butonuna basılarak ilişkilendirme kurallarının oluşturulması sağlanmıştır.

Sonuç

Minimum confidence değeri 0.8, kural sayısı 100 olarak seçildiğinde, WEKA programının 100 adet kural oluşturduğu; en sonuncusunun minimum confidence değerinin 0.82 olduğu görülmüştür. En başarılı ilk üç kural şu şekildedir:

  1. income='(43758.136667-inf)’ 80 ==> save_act=YES 80 conf:(1)
  2. age='(50.666667-inf)’ income='(43758.136667-inf)’ 76 ==> save_act=YES 76 conf:(1)
  3. income='(43758.136667-inf)’ current_act=YES 63 ==> save_act=YES 63 conf:(1)
  1. Kural:

“income” niteliği 43758’in üzerinde olan 80 adet veri olduğu ve bunların tamamının “save_act” niteliğinin YES olduğu görülmektedir. Yani confidence değeri %100 (1) olarak çıkmaktadır.

  1. Kural:

“Age” niteliği 50’nin üzerinde, “income” niteliği 43758’in üzerinde olan 76 adet veri olduğu ve tamamının “save_act” değerinin YES olduğu görülmektedir. 1. kuralda olduğu gibi confidence değeri %100 (1)’dür.

  1. Kural:

“income” niteliği 43758’in üzerinde ve “current_act” niteliği YES olan 63 adet veri mevcuttur. Bunların tamamında “save_act” niteliğinin değerinin YES olduğu görülmektedir. İlk iki kuralda olduğu gibi confidence değeri %100 (1) çıkmıştır.

WEKA programında Apriori algoritmasının uygulanması sonucu çıkan 100 adet kural şu şekildedir:

  1. income='(43758.136667-inf)’ 80 ==> save_act=YES 80 conf:(1)
  2. age='(50.666667-inf)’ income='(43758.136667-inf)’ 76 ==> save_act=YES 76 conf:(1)
  3. income='(43758.136667-inf)’ current_act=YES 63 ==> save_act=YES 63 conf:(1)
  4. age='(50.666667-inf)’ income='(43758.136667-inf)’ current_act=YES 61 ==> save_act=YES 61 conf:(1)
  5. income='(43758.136667-inf)’ current_act=YES 63 ==> age='(50.666667-inf)’ 61 conf:(0.97)
  6. income='(43758.136667-inf)’ save_act=YES current_act=YES 63 ==> age='(50.666667-inf)’ 61 conf:(0.97)
  7. income='(43758.136667-inf)’ current_act=YES 63 ==> age='(50.666667-inf)’ save_act=YES 61 conf:(0.97)
  8. children='(-inf-1]’ save_act=YES mortgage=NO pep=NO 81 ==> married=YES 78 conf:(0.96)
  9. age='(-inf-34.333333]’ married=YES car=NO 69 ==> income='(-inf-24386.173333]’ 66 conf:(0.96)
  10. age='(-inf-34.333333]’ children='(-inf-1]’ car=NO 69 ==> income='(-inf-24386.173333]’ 66 conf:(0.96)
  11. sex=FEMALE children='(-inf-1]’ mortgage=NO pep=NO 69 ==> married=YES 66 conf:(0.96)
  12. children='(-inf-1]’ save_act=YES current_act=YES mortgage=NO pep=NO 63 ==> married=YES 60 conf:(0.95)
  13. children='(-inf-1]’ mortgage=NO pep=NO 120 ==> married=YES 114 conf:(0.95)
  14. income='(43758.136667-inf)’ 80 ==> age='(50.666667-inf)’ 76 conf:(0.95)
  15. income='(43758.136667-inf)’ save_act=YES 80 ==> age='(50.666667-inf)’ 76 conf:(0.95)
  16. income='(43758.136667-inf)’ 80 ==> age='(50.666667-inf)’ save_act=YES 76 conf:(0.95)
  17. children='(-inf-1]’ current_act=YES mortgage=NO pep=NO 93 ==> married=YES 88 conf:(0.95)
  18. age='(-inf-34.333333]’ car=NO mortgage=NO 68 ==> income='(-inf-24386.173333]’ 64 conf:(0.94)
  19. children='(-inf-1]’ car=NO mortgage=NO pep=NO 68 ==> married=YES 64 conf:(0.94)
  20. age='(-inf-34.333333]’ region=INNER_CITY married=YES 64 ==> income='(-inf-24386.173333]’ 60 conf:(0.94)
  21. age='(-inf-34.333333]’ car=NO save_act=YES 64 ==> income='(-inf-24386.173333]’ 60 conf:(0.94)
  22. age='(-inf-34.333333]’ save_act=YES current_act=YES pep=NO 64 ==> income='(-inf-24386.173333]’ 60 conf:(0.94)
  23. age='(-inf-34.333333]’ car=NO 107 ==> income='(-inf-24386.173333]’ 100 conf:(0.93)
  24. age='(-inf-34.333333]’ car=NO current_act=YES 86 ==> income='(-inf-24386.173333]’ 80 conf:(0.93)
  25. age='(-inf-34.333333]’ current_act=YES mortgage=NO 95 ==> income='(-inf-24386.173333]’ 88 conf:(0.93)
  26. age='(-inf-34.333333]’ married=YES current_act=YES mortgage=NO 67 ==> income='(-inf-24386.173333]’ 62 conf:(0.93)
  27. age='(-inf-34.333333]’ region=INNER_CITY children='(-inf-1]’ 66 ==> income='(-inf-24386.173333]’ 61 conf:(0.92)
  28. age='(-inf-34.333333]’ car=NO pep=NO 66 ==> income='(-inf-24386.173333]’ 61 conf:(0.92)
  29. age='(-inf-34.333333]’ married=YES current_act=YES pep=NO 66 ==> income='(-inf-24386.173333]’ 61 conf:(0.92)
  30. age='(-inf-34.333333]’ children='(-inf-1]’ mortgage=NO 77 ==> income='(-inf-24386.173333]’ 71 conf:(0.92)
  31. married=NO children='(-inf-1]’ mortgage=NO 76 ==> pep=YES 70 conf:(0.92)
  32. age='(-inf-34.333333]’ current_act=YES pep=NO 95 ==> income='(-inf-24386.173333]’ 87 conf:(0.92)
  33. age='(-inf-34.333333]’ save_act=YES pep=NO 82 ==> income='(-inf-24386.173333]’ 75 conf:(0.91)
  34. age='(-inf-34.333333]’ children='(-inf-1]’ current_act=YES 99 ==> income='(-inf-24386.173333]’ 90 conf:(0.91)
  35. income='(-inf-24386.173333]’ pep=YES 109 ==> children='(-inf-1]’ 99 conf:(0.91)
  36. age='(-inf-34.333333]’ married=YES current_act=YES 98 ==> income='(-inf-24386.173333]’ 89 conf:(0.91)
  37. age='(-inf-34.333333]’ sex=FEMALE current_act=YES 75 ==> income='(-inf-24386.173333]’ 68 conf:(0.91)
  38. age='(-inf-34.333333]’ save_act=YES current_act=YES 95 ==> income='(-inf-24386.173333]’ 86 conf:(0.91)
  39. age='(-inf-34.333333]’ children='(-inf-1]’ 125 ==> income='(-inf-24386.173333]’ 113 conf:(0.9)
  40. age='(-inf-34.333333]’ mortgage=NO 125 ==> income='(-inf-24386.173333]’ 113 conf:(0.9)
  41. income='(-inf-24386.173333]’ current_act=YES pep=YES 83 ==> children='(-inf-1]’ 75 conf:(0.9)
  42. children='(-inf-1]’ mortgage=YES pep=NO 72 ==> save_act=YES 65 conf:(0.9)
  43. age='(-inf-34.333333]’ current_act=YES 153 ==> income='(-inf-24386.173333]’ 138 conf:(0.9)
  44. age='(-inf-34.333333]’ sex=MALE 102 ==> income='(-inf-24386.173333]’ 92 conf:(0.9)
  45. age='(-inf-34.333333]’ children='(-inf-1]’ save_act=YES 71 ==> income='(-inf-24386.173333]’ 64 conf:(0.9)
  46. age='(-inf-34.333333]’ save_act=YES mortgage=NO 80 ==> income='(-inf-24386.173333]’ 72 conf:(0.9)
  47. age='(-inf-34.333333]’ mortgage=NO pep=NO 80 ==> income='(-inf-24386.173333]’ 72 conf:(0.9)
  48. age='(-inf-34.333333]’ married=YES mortgage=NO 89 ==> income='(-inf-24386.173333]’ 80 conf:(0.9)
  49. age='(-inf-34.333333]’ sex=MALE children='(-inf-1]’ 69 ==> income='(-inf-24386.173333]’ 62 conf:(0.9)
  50. age='(-inf-34.333333]’ married=YES pep=NO 88 ==> income='(-inf-24386.173333]’ 79 conf:(0.9)
  51. age='(-inf-34.333333]’ sex=MALE current_act=YES 78 ==> income='(-inf-24386.173333]’ 70 conf:(0.9)
  52. age='(-inf-34.333333]’ region=INNER_CITY 97 ==> income='(-inf-24386.173333]’ 87 conf:(0.9)
  53. age='(-inf-34.333333]’ married=NO 67 ==> income='(-inf-24386.173333]’ 60 conf:(0.9)
  54. income='(-inf-24386.173333]’ married=YES pep=YES 67 ==> children='(-inf-1]’ 60 conf:(0.9)
  55. age='(-inf-34.333333]’ pep=NO 124 ==> income='(-inf-24386.173333]’ 111 conf:(0.9)
  56. age='(-inf-34.333333]’ save_act=NO 76 ==> income='(-inf-24386.173333]’ 68 conf:(0.89)
  57. age='(-inf-34.333333]’ region=INNER_CITY current_act=YES 76 ==> income='(-inf-24386.173333]’ 68 conf:(0.89)
  58. age='(-inf-34.333333]’ 195 ==> income='(-inf-24386.173333]’ 174 conf:(0.89)
  59. age='(-inf-34.333333]’ married=YES children='(-inf-1]’ 83 ==> income='(-inf-24386.173333]’ 74 conf:(0.89)
  60. age='(-inf-34.333333]’ save_act=YES 119 ==> income='(-inf-24386.173333]’ 106 conf:(0.89)
  61. age='(-inf-34.333333]’ married=YES 128 ==> income='(-inf-24386.173333]’ 114 conf:(0.89)
  62. age='(-inf-34.333333]’ pep=YES 71 ==> income='(-inf-24386.173333]’ 63 conf:(0.89)
  63. age='(-inf-34.333333]’ married=YES save_act=YES 77 ==> income='(-inf-24386.173333]’ 68 conf:(0.88)
  64. age='(50.666667-inf)’ married=YES car=YES 68 ==> save_act=YES 60 conf:(0.88)
  65. age='(-inf-34.333333]’ sex=FEMALE 93 ==> income='(-inf-24386.173333]’ 82 conf:(0.88)
  66. save_act=NO pep=YES 95 ==> children='(-inf-1]’ 83 conf:(0.87)
  67. age='(-inf-34.333333]’ mortgage=YES 70 ==> income='(-inf-24386.173333]’ 61 conf:(0.87)
  68. income='(-inf-24386.173333]’ mortgage=NO pep=YES 70 ==> children='(-inf-1]’ 61 conf:(0.87)
  69. car=NO mortgage=NO pep=YES 89 ==> current_act=YES 77 conf:(0.87)
  70. save_act=NO current_act=YES pep=YES 71 ==> children='(-inf-1]’ 61 conf:(0.86)
  71. car=YES save_act=YES mortgage=NO pep=NO 74 ==> married=YES 63 conf:(0.85)
  72. region=INNER_CITY children='(-inf-1]’ pep=NO 87 ==> married=YES 74 conf:(0.85)
  73. mortgage=YES pep=YES 92 ==> children='(-inf-1]’ 78 conf:(0.85)
  74. region=INNER_CITY current_act=YES mortgage=NO pep=NO 78 ==> married=YES 66 conf:(0.85)
  75. save_act=YES mortgage=NO pep=NO 142 ==> married=YES 120 conf:(0.85)
  76. age='(-inf-34.333333]’ pep=YES 71 ==> children='(-inf-1]’ 60 conf:(0.85)
  77. age='(50.666667-inf)’ pep=NO 83 ==> save_act=YES 70 conf:(0.84)
  78. children='(-inf-1]’ car=NO save_act=YES mortgage=NO 83 ==> current_act=YES 70 conf:(0.84)
  79. save_act=YES current_act=YES mortgage=NO pep=NO 108 ==> married=YES 91 conf:(0.84)
  80. age='(-inf-34.333333]’ car=YES 88 ==> income='(-inf-24386.173333]’ 74 conf:(0.84)
  81. age='(50.666667-inf)’ sex=MALE 80 ==> save_act=YES 67 conf:(0.84)
  82. age='(50.666667-inf)’ children='(-inf-1]’ mortgage=NO 79 ==> current_act=YES 66 conf:(0.84)
  83. married=NO children='(-inf-1]’ save_act=YES 85 ==> current_act=YES 71 conf:(0.84)
  84. region=INNER_CITY mortgage=NO pep=NO 96 ==> married=YES 80 conf:(0.83)
  85. married=NO car=NO save_act=YES 72 ==> current_act=YES 60 conf:(0.83)
  86. sex=FEMALE children='(-inf-1]’ pep=NO 101 ==> married=YES 84 conf:(0.83)
  87. sex=FEMALE region=INNER_CITY pep=NO 77 ==> current_act=YES 64 conf:(0.83)
  88. married=NO save_act=YES pep=YES 77 ==> current_act=YES 64 conf:(0.83)
  89. married=NO save_act=YES pep=YES 77 ==> mortgage=NO 64 conf:(0.83)
  90. sex=FEMALE save_act=YES mortgage=NO pep=NO 77 ==> married=YES 64 conf:(0.83)
  91. sex=MALE mortgage=NO pep=NO 94 ==> married=YES 78 conf:(0.83)
  92. age='(-inf-34.333333]’ sex=FEMALE income='(-inf-24386.173333]’ 82 ==> current_act=YES 68 conf:(0.83)
  93. age='(50.666667-inf)’ married=YES children='(-inf-1]’ 82 ==> save_act=YES 68 conf:(0.83)
  94. income='(24386.173333-43758.136667]’ mortgage=NO pep=NO 76 ==> married=YES 63 conf:(0.83)
  95. age='(50.666667-inf)’ married=YES 128 ==> save_act=YES 106 conf:(0.83)
  96. sex=FEMALE region=INNER_CITY save_act=YES 86 ==> current_act=YES 71 conf:(0.83)
  97. current_act=YES mortgage=YES pep=NO 86 ==> save_act=YES 71 conf:(0.83)
  98. children='(-inf-1]’ save_act=YES mortgage=NO pep=YES 86 ==> current_act=YES 71 conf:(0.83)
  99. region=INNER_CITY married=YES mortgage=NO pep=NO 80 ==> current_act=YES 66 conf:(0.83)
  100. married=NO save_act=YES 137 ==> current_act=YES 113    conf:(0.82)

Time limit is exhausted. Please reload CAPTCHA.