Yapay Veri Kümesi
Yapay Veri Kümesi Üzerinde Deneyler
İki sarmal sınıflandırma, örüntü tanımadaki klasik problemlerden biridir. İki sarmal fonksiyon örneklerinin dağılımları şekil 1’de gösterilmiştir.
t parametresinin değerleri 0,02 ila 10 arasındadır ve adım 0,02’dir. Her sınıfta beş yüz örnek var. Birinci sınıf pozitif örnek seti olarak gösterilir ve ikincisi negatiftir.
Deneylerin amacı, dengesiz veri setli sınıflandırma problemlerinde SVDD modelinin SVM modeline göre öğrenme ve öngörme doğruluğunun gelişimini göstermektir. Farklı sayıda örneklem kullanılarak öğrenme ve tahmin etme deneyleri gerçekleştirilir.
Tablo 1, birkaç farklı sayıda pozitif ve negatif örnekle her iki modeli kullanarak iki sarmal fonksiyonun bir grup öğrenme ve tahmini sonuçlarını göstermektedir. Bu deney grubu aşağıdaki gibi tasarlanmıştır. Denklem(24)’ün çekirdek fonksiyonunun δ parametresi 2’dir ve C1 ve C2 ceza faktörlerinin her ikisi de.
Tablo 1’de, n+ ve n−, pozitif ve negatif örneklerin sayısını belirtir. Öğrenme sürecinde, gösterilen yapay iki sarmallı veri setinden rastgele n+ pozitif ve n- negatif örneklem seçilir. Karşılaştırma deneylerinin her grubunda her iki modelde de aynı öğrenme örnekleri kullanılmıştır.
Tahmin işleminde, yapay veri setinin kalan kısımları tahmin edilecek numuneler gibidir. Birinci tabloda, (n+ , n− ) öğrenme örneklerinin sayısını, ARL öğrenmenin doğruluk oranını ve ARP tahminin doğruluk oranını gösterir. Öğrenmenin doğruluk oranı, doğru sınıflandırılan örneklerin toplam öğrenme örneklerine oranıdır.
Tahminin doğruluk oranı, doğru sınıflandırılmış örneklerin toplam tahmin edilen örneklere oranıdır. Tüm deneyler aşağıdaki koşullar altında gerçekleştirilir.
Gösterilen deneysel sonuçlardan, pozitif örnek sayısı negatif örnek sayısına eşit olduğunda, WLS-SVM modelinin SVDD modelinden biraz daha yüksek öğrenme ve tahmin doğruluğuna sahip olduğunu görebiliriz.
Ancak, pozitif örnek sayısı negatif örnek sayısından büyük ölçüde farklı olduğunda, SVDD modeli görünüşe göre WLS-SVM modeline kıyasla daha yüksek öğrenme ve tahmin doğruluğunu koruyor. Bu nedenle SVDD modeli, dengesiz yapay veri setiyle sınıflandırma problemlerinin üstesinden gelmede daha etkilidir.
Yapay Zeka veri seti
Hazır veri setleri
Kaggle Veri Seti
Veri seti örnekleri
Excel hazır veri seti indir
İstatistik veri seti
COVID-19 veri Setleri
Makine öğrenmesi veri seti oluşturma
Kıyaslama Veri Kümesi
Bu alt bölümde, deney örnekleri UCI üniversitesi bilgisayar enstitüsünün açılış veri tabanından seçilir. Veritabanında Avustralya, Almanya ve Japonya ile ilgili bankaların üç set bireysel kredi notu bulunmaktadır.
Avustralya ile ilgili veri tabanı kullanılarak yapılan deneysel sonuçlar aşağıda listelenmiştir. Veritabanında toplam 690 örnek bulunmaktadır. Pozitif örnek sayısı (iyi kredi) 307’dir ve diğerleri negatif örnektir (kötü kredi). Örnek oluşturmak için on dört değerlendirme indeksi ve bir kredi değeri vardır.
Veritabanı öncelikle ön işleme tabi tutulur. Veritabanındaki tüm kayıtlar sayısal olarak imha edilmiştir. Buna göre endeks ve kredi değeri sayısal değerlerle ifade edilir. Her örneği gösteren giriş vektörünün, her örneğin kredi indeksinden on dört boyutlu bir vektör olduğunu görebiliriz.
İki vektörün iç çarpımı, her iki vektörün her bir bileşenine göredir. Ancak orijinal veritabanındaki her indeksin değer aralıklarında muhteşem bir ayrım vardır. Girdi vektörünün her bir bileşeninin (her bir kredi endeksi) etkisini dengelemek için, endeksin tüm değerleri kullanılarak normalleştirilir.
Ağırlıklı LS-SVM modelini ve farklı sayıda pozitif ve negatif örneklem içeren SVDD modelini kullanan Avustralya veri setini kullanan bankaların bireysel kredi puanlamasının bir grup öğrenme ve öngörme sonuçlarını göstermektedir.
Çekirdek işlevi ve parametreleri, yapay veri kümesindeki deneylerle aynıdır. Tablo 2’de, n+ ve n−, pozitif ve negatif örneklerin sayısını belirtir. Öğrenme sürecinde, Avustralya ile ilgili veri tabanından rastgele n+ pozitif ve n- negatif öğrenme örneği seçilir.
Karşılaştırma deneylerinin her grubunda her iki modelde de aynı öğrenme örnekleri kullanılmıştır. Tahmin işleminde, veri setinin kalan kısımları tahmin edilecek numuneler gibidir. Deney ortamları, yapay veri kümesindekilerle aynıdır.
Tablo 2’den, pozitif örnek sayısı negatif örnek sayısına eşit olduğunda, SVDD modelinin ve WLS-SVM modelinin benzer öğrenme doğruluğuna sahip olduğunu görebiliriz. Pozitif örneklerin sayısı negatif olanların sayısından farklı olduğunda SVDD modeli, yapay veri kümesindeki deneysel sonuçlara büyük ölçüde benzer olduğunda, WLS-SVM modellerine kıyasla daha yüksek öğrenme ve tahmin doğruluğuna sahiptir.
Avustralya’nın bireysel kredi puanlama veri setini kullanarak öğrenme ve tahmin etme doğruluklarının, iki sarmalın yapay veri setininkiler kadar iyi olmadığını görüyoruz. Bunun bir nedeni, bireysel kredi puanlama veri setinin kendisinin kesin olarak ayrılamaz olmasıdır.
Bu makalede, dengesiz veri setine sahip SVDD sınıflandırma modeline dayalı yeni müşteri kredi puanlama tahmini yöntemi önerilmiştir. Öncelikle ana tahmin yöntemleri gözden geçirildi. Daha sonra dengesiz veri seti için SVDD sınıflandırma modeli analiz edildi.
Ve modelin parametrelerini çözmek için çarpımsal güncelleme ilkesi tartışılmıştır. Ardından, SVDD modeline dayalı olarak bankaların müşteri kredi skorlaması için yeni bir öğrenme ve tahmin yöntemi önerilmiştir. Son olarak, önerilen yöntem ve WLS-SVM tabanlı yöntem kullanılarak sentezlenen iki sarmal veri seti ve bankaların bireysel kredilerinin kıyaslama veri seti üzerinde deneyler yapılmıştır.
Deneysel sonuçlar, önerilen yöntemin, bankaların müşteri kredi notlarının tahmin edilmesi gibi dengesiz veri setli sınıflandırma problemlerinde WLS-SVM tabanlı yöntemden daha etkili olduğunu göstermiştir. Aynı deney koşulları altında SVDD modelinin öğrenme ve tahmin doğrulukları LS-SVM modelinden daha yüksektir.
Eşler Arası hizmet ağı, internet teknolojisinde önemli bir rol oynamaktadır. Yönlendirme mekanizması, P2P hizmet ağı için temel teknolojidir. Bu yazıda, yapılandırılmış P2P hizmet ağı için K-BRiR adlı verimli ve kendi kendini organize eden bir yönlendirme mekanizması sunulmaktadır. K-BRiR, halka topolojisine dayanan temel bir yönlendirme protokolü BRiR içerir. Tanımlar ve algoritmalar tartışılmıştır. Deneysel sonuçlarımız, K-BRiR’nin P2P hizmet ağında kararlı ve verimli olduğunu doğrulamaktadır.
COVID-19 veri Setleri Excel hazır veri seti indir Hazır veri setleri İstatistik veri seti Kaggle Veri Seti Makine öğrenmesi veri seti oluşturma Veri seti örnekleri Yapay Zeka veri seti