Veritabanlarından Sınıflandırma – Ödev Hazırlatma – Proje Yaptırma – Tez Yaptırma Fiyatları – Sunum Örnekleri – Ücretli Ödev Yaptırma – Ödev Yaptırma Ücretleri

Veritabanlarından Sınıflandırma Kurallarının Keşfi

Tanımlayıcı veri madenciliğinde amaç, bazı verilerin davranışı veya özellikleri hakkında fikir veren anlaşılır bir model oluşturmaktır. Veri, her biri bir dizi özellik veya niteliğe değerler atayan bir dizi kayıttan oluşur. Bu özelliklerden biri hedef özellik olarak belirlenmiştir; bu özelliğin değeri, kaydın sınıfı olarak tanımlanır.

Örneğin, araba ve sürücü ayrıntılarını ve hasar geçmişini açıklayan özellikleri içeren bir dizi motor sigortası kaydı verildiğinde, sürücüleri hasar geçmişlerine göre yüksek veya düşük riskli olarak sınıflandıracak bir model oluşturmak isteyebiliriz. Bu model daha sonra yeni müşteriler için primleri değerlendirirken kullanılabilir. Yeni pazarlama kampanyalarının onları çekmeyi hedefleyebilmesi için düşük riskli sürücüleri neyin karakterize ettiğini anlamak da isteyebiliriz.

Genellikle karar ağaçları tarafından üretilen gibi tam sınıflandırma, verilerdeki her kayda bir sınıf atar. Oluşturulan modeller genellikle çok büyük ve anlaşılması zor olduğundan, bu genellikle tanımlayıcı veri madenciliği görevi için uygun değildir. Ayrıca, genellikle sınıflandırıcıyı oluşturmak için yol gösterici kriter olarak kullanılan genel sınıflandırma doğruluğu, azınlık sınıflarının (yani, temsili kaydı az olan sınıflar, örneğin yüksek sigorta riski) doğru sınıflandırılmasını garanti etmez.

Kısmi sınıflandırma (ayrıca külçe keşfi olarak da bilinir), belirli bir sınıfın “güçlü” tanımlarını temsil eden basit ve anlaşılır kalıpları bulmaya çalışır. Bu tür kalıpları ifade etmek için kuralları kullanmak genellikle uygundur.

Burada kısmi sınıflandırma göreviyle, özellikle kural keşfi sorunuyla ilgileniyoruz. İlk olarak, kullanılan sınıflandırma kurallarının yapısını ve kuralların nasıl değerlendirilebileceğini açıklıyoruz. Daha sonra sınıflandırma kurallarının keşfi için geliştirilmiş çeşitli teknikleri açıklamaya devam edeceğiz.

Bunlar:

• Modern Sezgisel Yöntemler – Optimizasyon algoritmalarının kullanımı.
• Çok Amaçlı Yöntemler – Çok amaçlı evrimsel algoritmaların kullanımı.
• Tüm Kural Arama – Kısıtlı arama algoritmalarının kullanımı.

KURAL YAPISI

Oluşturulabilecek kuralların sayısı genellikle çok büyüktür ve genellikle sonsuzdur, ancak kuralların yapısına kısıtlamalar getirmek bunu azaltabilir. Son derece esnek formatlar, bir sınıfın daha güçlü açıklamalarını içerebilen zengin bir kalıp ifadesine izin verir, ancak arama alanının boyutu çok büyük olabilir. Tersine, eğer format çok kısıtlayıcı ise, yeterli ilgi çekici kalıpları ifade etmek mümkün olmayacaktır.

Birçok kural keşif tekniği, öncüllerin bir öznitelik testleri, AT’ler birleşimini içerdiği ve sonucun sınıf açıklamasını temsil eden tek bir AT’yi içerdiği bir kural formatı ile sınırlıdır.

Kural formatındaki bu kısıtlama ile bile, arama uzayının boyutu herhangi bir gerçek dünya problemi için genellikle çok büyüktür. Normalde tüm kuralları bulmak mümkün değildir. Sonuç olarak, daha önce açıklandığı gibi, arama uzayı içinde etkin bir şekilde arama yapabilen kural bulma tekniklerini kullanmak gereklidir.

SINIFLAMA KURALLARININ KEŞFİ İÇİN TEKNİKLER

Modern Buluşsal Yöntemler

Simüle edilmiş tavlama, genetik algoritmalar ve tabu arama gibi modern buluşsal optimizasyon teknikleri, belirli bir ilgi ölçüsüne göre en iyi sınıflandırma kurallarını çıkarmak için kullanılabilir. Külçe keşfine yönelik bu yaklaşımda, güçlü sınıf tanımları bulma problemi bir optimizasyon problemi haline gelir.

Bu soruna bir çözüm olarak birleşik bir sınıflandırma kuralı sunuyoruz ve belirli bir kural formatı verilen mevcut tüm sınıflandırma kuralları arama uzayını oluşturuyor. Daha sonra bazı ilgi ölçütlerini kullanarak sınıflandırma kurallarını değerlendiririz, böylece arama bu ölçüye göre en ilginç kurallara yönlendirilebilir. Böyle bir ölçü, uygunluk ölçüsüdür.

Veri tabanı sistemleri Nedir
Veritabanı Yönetim Sistemleri
Veritabanı yönetim sistemleri Nedir
Veritabanı Türleri
Veri Tabanı Yönetim Sistemleri DERS NOTLARI
Veritabanı Yönetim Sistemleri pdf
Veritabanı Nedir
Veri tabanı Yönetim Sistemleri örnekleri

Bu denklemde a ve c daha önce açıklandığı gibi yorumlanır. Bu ölçü, belirli kısıtlamalar altında güven ve kapsama göre kuralları kısmen sıralama yeteneğine sahiptir. Tanımlanan kısmi sıralamaya göre, eğer iki kural aynı güvene sahipse daha yüksek kapsama kuralı tercih edilir ve iki kural aynı kapsama sahipse daha yüksek güven kuralı tercih edilir. Bir kuralın diğerinden hem daha yüksek kapsamı hem de güveni varsa, o zaman ilk kural tercih edilir.

Kısmi sıralama, buluşsal tekniklerin çözüm arayacağı yüksek bir güven/kapsam sınırını tanımlar. λ parametresindeki varyasyonlar, algoritmaların yüksek güven veya yüksek kapsam kuralları aramayı teşvik ederek üst güven/kapsam sınırının farklı alanlarını keşfetmesine izin verir.

De la Iglesia ve diğerlerinde verilen uygulamada, bir çözüm veya kural bir bit dizisi olarak temsil edilir. Her özniteliğe, bir alt ve üst limit tarafından tanımlanan sayısal öznitelikler ve bir dizi etiket tarafından tanımlanan kategorik öznitelikler ile bir dizi bit atanır.

Sınıf etiketinin sabit olduğu için temsil edilmesine gerek yoktur. Değerlendirme, kuralın öncülü ve sonucu için desteğin sayılması için veri tabanının incelenmesi ve ardından kullanılan değerlendirme fonksiyonunun hesaplanması ile gerçekleştirilir. Modern buluşsal optimizasyon algoritmaları daha sonra aramayı arama uzayının gelecek vaat eden alanlarına yönlendirmek için kullanılır.

Modern buluşsal yöntemler tarafından çözülen problem, çok amaçlı bir optimizasyon problemi olarak yeniden tanımlanabilir. Bu durumda, uygunluk ölçüsü gibi kuralın bireysel özelliklerinin bir kombinasyonunu temsil eden bireysel bir değerlendirme fonksiyonu kullanmak yerine, kuralın her bir ilgi veya kuvvet ölçüsünü optimize edilecek ayrı bir hedef olarak ele alacağız. Modern buluşsal yaklaşım için kullanılanla aynı kural kodlamasını kullanabiliriz. Ancak arama motoru olarak çok amaçlı bir evrimsel algoritma (MOEA) kullanacağız.

Son yıllarda, örneğin Niched Pareto Genetik Algoritması, Knowles ve Corne (1999) tarafından önerilen P AES algoritması ve daha yakın zamanda Fast Elitist Domine Edilmeyen Sıralama gibi bir dizi Pareto tabanlı MOEA rapor edilmiştir.

Çok amaçlı yaklaşımın önceki yaklaşıma göre çeşitli avantajları vardır. İlk olarak, algoritmanın her çalışmasında ayrı bir kural bulmak yerine, üst güven/kapsam sınırına bir yaklaşımı temsil eden bir dizi çözüm bulabiliriz.

İkincisi, çok amaçlı bir yaklaşımda güç veya ilgi ölçülerinin kullanılması, daha esnek bir araştırmaya izin verir. Örneğin, elde edilen modelin basitliği önemliyse, kuraldaki AT’lerin sayısına dayalı üçüncü bir optimizasyon hedefine sahip olmak dahil edilebilir.

Bu yaklaşımın NSGA-II kullanılarak uygulanması, yaklaşımın büyük veritabanlarında verimli olduğunu ve güven/kapsam sınırına yayılmış güçlü külçeler bulduğunu gösterdi.

akademi delisi

Biyografinin Tamamını Gör

Veri tabanı sistemleri Nedir Veri Tabanı Yönetim Sistemleri DERS NOTLARI Veri tabanı Yönetim Sistemleri örnekleri Veritabanı Nedir Veritabanı Türleri Veritabanı Yönetim Sistemleri Veritabanı yönetim sistemleri Nedir Veritabanı Yönetim Sistemleri pdf

Veritabanlarından Sınıflandırma – Ödev Hazırlatma – Proje Yaptırma – Tez Yaptırma Fiyatları – Sunum Örnekleri – Ücretli Ödev Yaptırma – Ödev Yaptırma Ücretleri