Veri Madenciliğinde İstisna Kuralları – Ödev Hazırlatma – Proje Yaptırma – Tez Yaptırma Fiyatları – Sunum Örnekleri – Ücretli Ödev Yaptırma – Ödev Yaptırma Ücretleri
Veri Madenciliğinde İstisna Kuralları
Veri madenciliği, mevcut veritabanlarından yeni, beklenmedik, değerli kalıpları keşfetme sürecidir. Veri madenciliği, uzun bir geçmişe sahip bir alanın evrimi olmasına rağmen, terimin kendisi ancak nispeten yakın zamanda, 1990’larda tanıtıldı.
Veri madenciliği en iyi şekilde istatistik, yapay zeka ve makine öğrenimindeki tarihsel ve son gelişmelerin birleşimi olarak tanımlanır. Bu teknikler daha sonra verileri incelemek ve önceden gizlenmiş eğilimleri veya kalıpları bulmak için birlikte kullanılır.
Veri madenciliği, başka türlü bulamayacakları eğilimleri keşfetmek için büyük miktarda veriyi analiz etmesi gereken bilim ve iş alanlarında giderek artan bir kabul görmektedir. Farklı uygulamalar, farklı veri madenciliği teknikleri gerektirebilir.
Bir veri tabanından keşfedilebilecek ana bilgi türleri, birliktelik kuralları madenciliği, sıralı örüntü madenciliği, sınıflandırma ve kümeleme olarak kategorize edilir. Bu yazıda istisna kuralları madenciliğine odaklanıyoruz.
İstisna kuralları madenciliği çok fazla araştırma ilgisini çekmiştir. İstisna kuralları, düşük desteğe ve yüksek güvene sahip kurallar olarak tanımlanmıştır. İstisna kurallarının geleneksel bir örneği, Champagne=>Caviar kuralıdır. Kural yüksek desteğe sahip olmayabilir, ancak güveni yüksektir. Öğeler pahalıdır, bu nedenle veritabanında sık görülmezler, ancak kuralın yüksek güveni olması için her zaman bir araya getirilirler. İstisna kuralları, veritabanı kalıpları hakkında değerli bilgiler sağlar.
İstisna kuralları keşfi, yönlendirilmiş veya yönlendirilmemiş olarak sınıflandırılabilir. Yönlendirilmiş bir arama, her biri kullanıcı tarafından belirlenen bir inançla çelişen bir dizi istisna kuralı elde eder. Yönsüz bir arama, bir istisna kuralı ve bir genel kural çifti elde eder.
Yönlendirilmiş istisna kuralları araması daha sonra açıklanacaktır. Önce kullanıcı tarafından belirlenen inançlar elde edilir. Keşfedilen istisna kurallarının her biri, kullanıcı tarafından sağlanan inançlarla çelişir.
Liu’da, en ilginç kalıpları belirlemek için keşfedilen veritabanı kalıplarının analizi yapılır. Teknik, kullanıcıdan önceki bilgilerine veya sezgisel hislerine göre bir dizi kalıp belirlemesini istemekle karakterize edilir.
Bu belirlenmiş örüntü seti daha sonra bir bulanık eşleştirme algoritması tarafından keşfedilen örüntüleri eşleştirmek ve sıralamak için kullanılır. Bu tekniğin varsayımı, bir miktar alan bilgisinin ve kullanıcının çıkarlarının örtük olarak onun belirtilen kalıplarına gömülmesidir. Genel olarak, keşfedilen modeller, kullanıcının bilgisine uygunluklarına veya beklenmedik olmalarına veya eyleme geçirilebilirliklerine göre sıralanır.
Beklenmediklik açısından, örüntüler beklenmeyen veya kullanıcılar tarafından önceden bilinmiyorsa ilginçtir. Eyleme geçirilebilirlik açısından, kullanıcılar kendi avantajları için onlarla bir şeyler yapabiliyorsa, kalıplar ilginçtir. Bu tür sıralamalarla, bir kullanıcı sezgilerini (veya önceki bilgilerini) doğrulamak veya beklentilerine aykırı kalıpları bulmak veya bu kalıpları keşfetmek için listenin en üstündeki birkaç kalıbı kontrol edebilir. harekete geçirilebilir.
Veri MADENCİLİĞİ Ders Notları PDF
Veri MADENCİLİĞİ Ders Notları AÖF
Veri madenciliği tekniğine getirilen olumsuz eleştiriler
Veri MADENCİLİĞİ Nedir
Veri Madenciliği Karar ağaçları
Veri MADENCİLİĞİ proje örnekleri
Veri MADENCİLİĞİ Yöntemleri
Veri MADENCİLİĞİ Vize Soruları
Padmanabhan ve Tuzhilin (2000) beklenmedik örüntüleri keşfetmeye odaklanır ve daha az sayıda örüntü keşfeden ve ilginç olanların çoğunu koruyan minimal bir dizi beklenmedik örüntü keşfetmek için yöntemler önerir. Yaklaşım, bir pazarlama alanında bir vaka çalışması uygulaması kullanılarak deneysel olarak test edilmiştir.
A=>B kuralı Padmanabhan ve Tuzhilin’de (2000) D veri kümesindeki X=>Y inancına göre beklenmedik olarak tanımlanmıştır, eğer B ve Y mantıksal olarak birbiriyle çelişiyorsa, inancın öncülleri ve kuralın devam etmesi D’nin istatistiksel olarak aynı büyük alt kümesi ve A, X=>B kuralı geçerlidir.
Şimdi istisna kurallarını aramanın yönsüz yöntemi açıklanacaktır. İstisna kuralları, genel kurallara veya sağduyu kurallarına dayalı olarak elde edilecektir.
Hussain’de, ilgili sağduyu kuralına ve referans kuralına göre ilginçliği tahmin eden yeni bir ölçüye dayanan istisna kuralları madenciliği için bir yöntem sunulmaktadır. Sağduyu kuralları, yüksek destek ve yüksek güven içeren kurallardır. Referans kuralları, düşük destek ve düşük güven içeren kurallardır. İstisna kuralları, düşük desteğe ve yüksek güvene sahip kurallar olarak tanımlanır.
Göreceli ilginçlik formülü RI’yi Hussain ve ark. (2000), bilgi teorisi ve istatistiklere dayalı olarak türetilmiştir. Ölçünün, kuralın desteğine dayalı ilginçlik ve kuralın güvenine dayalı ilginçlik olmak üzere iki bileşeni vardır.
Suzuki bir kalıbın bir çift istisna kuralı ve buna karşılık gelen güçlü kuralı temsil ettiği, istisna kurallarının yönlendirilmemiş keşfini tanıtmaktadır. Bir meta-kalıp tarafından yönlendirilen önerilen zamanlanmış keşif ve istisna kuralı keşfi, veri kümeleri üzerinde açıklanır ve test edilir.
Suzuki (2002b), alana özgü bilgi içermeyen bir veri kümesinden istisna kurallarını keşfetmek için bir algoritma sunar. Yöntem, sağlam budama ve olasılıksal tahmine dayanmaktadır. Çok terimli dağılımların normal yaklaşımları, bir kural çiftinin güvenilirliğini değerlendirme yöntemi olarak kullanılır. Yöntem, makine öğrenimi topluluğunda iki tıbbi veri seti ve iki kıyaslama veri seti kullanılarak doğrulanmıştır.
Ya amada ve Suzuki’nin (2002) ana katkısı, ilginç istisna kuralları için sarmal keşfin resmileştirilmesi ve başlangıç bilgisi, MDL tabanlı ayrıklaştırma ve keşfedilen kural çiftlerinin sayısının azaltılmasını kullanan bir yöntem. Deneysel değerlendirme menenjit veri seti üzerinde yapıldı.
İSTİSNA KURALLARI
Bu bölümde mayın istisna kurallarına yeni bir yaklaşım önerilecektir. Yaklaşım, yönlendirilmiş arama kategorisine aittir. İstisna kuralları ile güçlü birliktelik kuralları arasında bir ara bağlantı dikkate alınacaktır. Önceki bölümde açıklanan araştırma çalışmasının aksine, hem güçlü pozitif hem de negatif birliktelik kuralları dikkate alınır.
Veritabanındaki pozitif ve negatif birliktelik kuralları hakkındaki bilgilere dayanarak aday istisna kuralları oluşturulacaktır. Aday istisna kurallarını değerlendirmek için yeni bir istisna ölçüsü önerilecektir. Yüksek istisnaya sahip aday istisnalar, istisna kurallarının son setini oluşturacaktır.
Önerilen yaklaşımı formüle etmek için birkaç veri madenciliği terimi tanımlanmalıdır. Itemset, bir veritabanı öğeleri kümesidir. Örneğin, öğe kümesi XY, X ve Y öğelerinden oluşan bir küme anlamına gelir. Birliktelik kuralı, X ve Y’nin veritabanı öğe kümeleri olduğu X=>Y formunun bir uygulamasıdır. Birliktelik kuralına bir örnek, birlikte satın alınan Chips=>Cola süpermarket ürünleri olabilir.
X =>Y kuralı, tüm işlemlerin %s’si hem X hem de Y’yi içeriyorsa s’yi destekler. X =>Y kuralı c güvenine sahiptir, eğer X içeren işlemlerin %c’si de Y içerir. -belirtilen minimum destek (minsup) ve minimum güven (minconf) verilmiştir.
Minsup’a eşit veya daha büyük desteği ve minconf’a eşit veya daha büyük güveni olan birliktelik kurallarına güçlü kurallar denir.
Desteği en az minsup’a eşit olan öğe kümelerine sık öğe kümeleri denir. Negatif öğe kümeleri, hem öğeleri hem de olumsuzlarını içeren öğe kümeleridir. Örneğin, X~Y negatif öğe kümesini düşünün. Bu öğe kümesinde ~Y, Y öğesinin olumsuzlanması anlamına gelir (veritabanı kaydında Y öğesinin olmaması).
Negatif birliktelik kuralı, X=>~Y , ~X=>Y , ~X=>~Y formunun bir uygulamasıdır, burada X ve Y veritabanı öğeleridir, ~X, ~Y veritabanı öğelerinin olumsuzlamalarıdır. Negatif bir birliktelik kuralına örnek olarak Coke=>~Pepsi verilebilir; bu, insanların Coca Cola ve Pepsi’yi birlikte almadıkları anlamına gelir.
Veri MADENCİLİĞİ Ders Notları AÖF Veri MADENCİLİĞİ Ders Notları PDF Veri Madenciliği Karar ağaçları Veri MADENCİLİĞİ Nedir Veri MADENCİLİĞİ proje örnekleri Veri madenciliği tekniğine getirilen olumsuz eleştiriler Veri MADENCİLİĞİ Vize Soruları Veri MADENCİLİĞİ Yöntemleri