Akademik Tezlerde Güç Analizi ve Etki Büyüklüğü

Akademik bir tezin ikna gücü, yalnızca istatistiksel anlamlılık (p-değeri) ile değil, etki büyüklüğü ve istatistiksel güç ile kurulan kanıt mimarisi üzerinden değerlendirilir. Etki büyüklüğü, bulgunun pratik önemini sayısallaştırır; güç analizi ise “bu etkiyi güvenilir biçimde yakalayabilecek örneklem kapasitesine sahip miyiz?” sorusuna yanıt verir. Güç yetersizse gerçek etkiler kaçırılır (Tip II hata), aşırı güçlüyse önemsiz etkiler bile “anlamlı” görünerek yanlış yorumlanır. Tezlerde en sık görülen sorun; çalışmayı tamamladıktan sonra hesaplanan “post hoc” güç değerlerinin yanlış yorumlanması, a priori planlamanın ihmal edilmesi ve etki büyüklüğü metinlerinde yalnız p-değerinin raporlanmasıdır.
1) Güç Analizinin Amacı: “Anlamlı mı?” değil, “Anlamlı ve anlamlı ölçüde mi?”
İstatistiksel güç (1−β), gerçek bir etkiyi yakalama olasılığıdır. Etki büyüklüğü ise “bulduğum farkın/ilişkinin nicel önemi nedir?” sorusunu yanıtlar. Tezlerde hedef; önemli görülen bir minimum etki eşiğini (MDE — Minimal Detectable Effect) belirleyip bu eşiği yeterli güçle (genellikle %80–%90) tespit edebilecek örneklem ve tasarımı kurmaktır.
Kısa reçete: Tez önerinizde MDE → Güç → Örneklem zincirini yazın; yalnız p-değeri yazmayın.
2) Etki Büyüklüğü Sözlüğü: Hangi veriye hangi metrik?
-
Sürekli değişken, iki grup: Cohen’s d (eş varyans), Hedges g (küçük örneklem düzeltmesi).
-
Eşleştirilmiş ölçümler: dz (farkların sd’si ile), drm (bağımlı tasarım için).
-
ANOVA/GLM: η², partial η², Cohen’s f (f² = η²/(1−η²)).
-
Regresyon: R², Cohen’s f² = R²/(1−R²); kısmi r.
-
Kategorik sonuçlar: Risk Oranı (RR), Odds Oranı (OR), Mutlak Risk Farkı (RD).
-
Sağkalım: Hazard Oranı (HR).
-
Korelasyon: r (Fisher-Z dönüşümü ile güç planı).
Not: Metrik seçimi rapor dilini belirler; etkiyi mutlak (RD), oransal (RR/OR) ve pratik (NNT=1/RD) eksenlerinde birlikte sunmak ikna gücünü arttırır.
3) A Priori vs Post Hoc Güç: Hangisi tezde geçerlidir?
-
A priori güç: Araştırmadan önce; MDE, α (genelde 0,05), hedef güç (≥0,80), varyans veya temel oran varsayımlarıyla örneklem planlanır.
-
Post hoc güç: Çalışma sonrası; eldeki p-değerine bakarak “gücün düşük olduğu” yorumu yapılır—çoğu zaman yanlıştır. Post hoc güç, p-değeri ile matematiksel olarak eşdeğerdir; bilgi eklemez.
Tez standardı: A priori plan zorunlu; isterseniz duyarlılık analizi (eldeki örneklemle tespit edilebilir MDE) ekleyin.
4) MDE (Minimal Detectable Effect): “Kaç puan fark yakalamalıyım?”
MDE, araştırmanın pratik anlamlılık eşiğidir.
-
Eğitimde: Not/puan farkı ≥ 0,3 sd (küçük-orta).
-
Sağlıkta: Mutlak risk farkı ≥ %5 veya HR ≤ 0,80.
-
Davranış bilimlerinde: d ≥ 0,30–0,50 aralığı.
Rapor cümlesi: “Çalışma, d=0,40 ve üzeri farkları %80 güçle tespit etmeyi hedefleyecek şekilde planlanmıştır.”
5) Temel İki Grup Karşılaştırmaları: t-testleri ve örneklem
-
Bağımsız t-test: Gerekli girdiler: α, hedef güç, beklenen d, grup oranı (1:1 önerilir ama her zaman mümkün değil). Eşit olmayan gruplar güç düşürür; en az 1:2 içinde kalın.
-
Eşleştirilmiş t-test: Aynı toplam N ile daha yüksek güç; korelasyon (ρ) arttıkça güç artar.
Örnek olay: d=0,5, α=0,05, güç=0,80 için bağımsız gruplarda toplam N≈128; eşleştirilmişte N daha düşer (ρ=0,5 varsayımıyla ≈54 çift).
6) ANOVA ve Çoklu Gruplar: f, partial η² ve post-hoc tuzaktan kaçınma
-
Tek yönlü ANOVA: Etki büyüklüğü f ile planlanır; gruplar arası varyansın toplam varyansa oranı belirleyicidir.
-
Unbalanced tasarımlar: En küçük gruba bakarak plan yapın; oransızlık güç kaybettirir.
-
Post-hoc çokluğu: Birincil hipotez/karşılaştırmalar önceden yazılmalı; aksi halde FWER/FDR düzeltmeleri gerekebilir → gücü düşürür.
Kural: “Az ama asıl hipotez” yaklaşımı.
7) Regresyon ve Çoklu Yordama: f², ek değişken katkısı ve kollineerlik
-
Toplam model için: f² = R²/(1−R²).
-
Kısmi katkı için: ΔR² (yeni değişkenlerin eklediği varyans) → f² = ΔR²/(1−R²_adj).
-
Kollineerlik: VIF yüksekse etkili f² küçülür; güç düşer.
Rapor kalıbı: “Birincil prediktör için kısmi f²=0,04 hedeflendi; toplam N=… kısıtlarıyla güç≈%82.”
8) Kategorik Sonuçlar: İki oran, ki-kare/lojistik ve nadir olaylar
-
İki oran farkı (RD/RR/OR): Beklenen kontrol olasılığı p₀, müdahale olasılığı p₁. Nadir olaylarda (p<%5) OR ≈ RR değil; tasarımda risk farkını da belirleyin.
-
Lojistik regresyon: Sınıf dengesizliği güç düşürür; olay başına gözlem (EPV) heuristiği (geleneksel 10, modern literatürde 5–20).
Örnek: p₀=%10, RR=0,7 (p₁=%7) için %80 güç; yaklaşık her kolda N≈1.300.
9) Sağkalım (Survival) Çalışmaları: Olay sayısı gücü belirler
-
Cox analizi: Gerekli güç çoğunlukla olay sayısına bağlıdır; toplam N değil, gerçekleşen olay.
-
Sansür oranı yüksekse güç düşer; takip süresini artırmak, olay akışını iyileştirir.
-
Etki: HR hedefi (örn. HR=0,75) ve beklenen olay oranı ile örneklem belirlenir.
Rapor: “HR=0,75’lik etkide %80 güç için 180 olaya ihtiyaç vardır; planlanan N=… ve 18 ay takip ile ≈190 olay beklenmektedir.”
10) Eşleştirilmiş/ Tekrarlı Ölçüm Tasarımları: Sphericity ve korelasyon etkisi
-
Tekrarlı ölçüm ANOVA / karma modeller: Ölçümler arası korelasyon güç sağlar; ancak sphericity ihlali düzeltmeleri (GG/HF) efektif df’yi düşürür → güç kaybı.
-
Karma modeller (Mixed): Eksik verilere MAR altında daha dayanıklıdır; planı Mixed varsayımlarıyla yapmak çoğu kez daha gerçekçidir.
Öneri: Bir prova veri veya literatürden rho (ölçümler arası korelasyon) ve ICC tahmini toplayın.
11) Küme-Rasgele (Cluster Randomized) Tasarımlar: Tasarım etkisi (DEFF) ve ICC
Aynı okul/klinik içindeki bireyler bağımsız değildir; etkin örneklem azalır.
-
Tasarım etkisi: DEFF = 1 + (m−1)×ICC (m: küme büyüklüğü).
-
Örneklem düzeltmesi: Gerekli birey sayısını DEFF ile çarpın; veya küme sayısını artırmayı hedefleyin (küme sayısı gücü daha çok etkiler).
Örnek: ICC=0,05, m=25 → DEFF=2,2 → bağımsız tasarıma göre ≈%120 ek birey gerekir.
12) Eksik Veri, Kayıp Oranı ve Düşüşe (Attrition) Karşı Yedekleme
-
Planlama sırasında beklenen eksik/kaybı (%10–30) öngörüp brüt örneklemi büyütün.
-
MCAR/MAR varsayımı altında MI (multiple imputation) kullanmayı planlıyorsanız bunu protokole yazın.
Formül sezgisi: Net N = Planlanan N / (1 − beklenen kayıp oranı).
13) Çoklu Karşılaştırma, Aile Düzeyi Hata (FWER) ve Güç
-
Birden çok birincil hipotez gücü böler: Bonferroni/Holm → α_eff küçülür → daha büyük N gerekir.
-
FDR (BH) daha esnek ama yine güç maliyeti var.
Strateji: Birincil analiz setini sınırlayın, ikincil/keşif analizleri açıkça etiketleyin.
14) Eşdeğerlik ve Altlık (Equivalence & Non-Inferiority) Gücü
-
Eşdeğerlik: İki yönlü eşdeğerlik marjı (±Δ) belirlenir (klinik/alan uzmanlığı ile); TOST prosedürü kullanılır.
-
Altlık (non-inferiority): Tek yönlü marj (−Δ) ile “en kötü şu kadar az değil” denir.
-
Sonuç: Bu tasarımlar çoğu zaman daha fazla örneklem ister; Δ ne kadar dar ise N o kadar büyür.
Rapor: “Non-inferiority marjı Δ=−5 puan; %80 güç için N=… kişi gerekmektedir.”
15) Bayesyen Perspektif: “Güç” yerine Assurance
Bayesyen tasarımda klasik güç yerine assurance (ön dağılım altında başarı olasılığı) raporlanabilir.
-
Avantaj: Parametre belirsizliğini önceden içerir.
-
Uygulama: Önlerinizi zayıf-bilgi verici tutun; prior predictive check ile makuliyet sınayın.
Rapor cümlesi: “Assurance (ön belirsizlik altında hedef etkinin doğrulanma olasılığı) ≈%78’dir.”
16) Pilot Çalışmalar: Varyans ve Uygulanabilirlik İçin
-
Amaç: Nihai çalışmanın varyans, ICC, rho gibi kritik parametreleri için ön tahmin; süre/lojistik provası.
-
Yanlış kanı: Pilot ile “etkiyi anlamlı bulmak” hedef değildir; etkiden ziyade parametre belirsizliğini küçültmek esastır.
Kural: Pilot N, ana çalışmanın örneklem hesabını güvenilir kılacak kadar olmalıdır.
17) Kaynak Kısıtlarında Stratejiler: Tasarım verimliliği
-
Eşleştirme/bloklama: Varyansı düşürür; güç artar.
-
Kovaryat ayarı (ANCOVA): Yüksek korelasyonlu bir ön-test puanı eklemek d’yi büyütür, gerekli N’yi azaltır.
-
Uyarlanır (adaptive) tasarım: Ara analizle örneklem artırma; etik ve istatistiksel kontrol gerektirir.
-
Ölçüm kalitesi: Güvenirliği yüksek ölçümler varyansı azaltır → güç artar.
18) Duyarlılık Analizi: Varsayımlar değişirse güç ne olur?
Güç hesapları varsayımlara duyarlıdır (sd, ICC, baz oran).
-
Senaryolar: “Kötümser–Orta–İyimser” varyans; kayıp oranı ±%10; ICC ±0,02.
-
Raporlama: “Kötümser senaryoda güç %74’e düşmektedir; eşik d=0,45’e revize edilirse %80 korunur.”
19) Aykırılar, Çarpıklık ve Saçılma: Robust plan
-
Aykırılar sd’yi şişirir → güç düşer. Önleyici: pilot, güçlü özet (medyan/IQR), dönüşüm (log/Box–Cox) veya robust testler (Welch, quantile).
-
Saçılma eşitsizliği: Welch düzeltmesi için güç planı konservatif yapılmalı; gruplar arası sd farkları örnekleme dağılımını etkiler.
20) Yazılım Ekosistemi: G*Power, R, Python, SPSS, SAS
-
G*Power: Hızlı a priori güç; t/ANOVA/kor/ki-kare/regresyon.
-
R:
pwr
,powerAnalysis
,WebPower
,Superpower
(RM ANOVA),longpower
(karma),simr
(GLMM simülasyon tabanlı). -
Python:
statsmodels.stats.power
(t-test, ANOVA, prop), özelleştirme için simülasyon. -
SPSS/SAS/Stata: Özel modüller; özellikle karma yapılar için simülasyon önerilir.
İpucu: Karma/GLMM/sağkalım/küme tasarımlarda simülasyon tabanlı güç, kapalı formüllerden daha gerçekçidir.
21) Etik Boyut: Az değil, yeter örneklem
-
Az örneklem etik değildir: katılımcı emeği/riski boşa gider, yanlış “yok etki” yorumu.
-
Aşırı örneklem de etik değildir: gereksiz kaynak/katılımcı tüketimi, anlamsız küçük etkilerin “abartılması”.
-
Ön kayıt: Güç, MDE, birincil analiz ve durdurma kuralları önceden yazılmalı.
22) Raporlama: Şeffaf güç ve etki büyüklüğü dili
-
Kalıp: “A priori güç analizi α=0,05, güç=%80, d=0,40 varsayımıyla her grup için N=64 öngörmüştür.”
-
Etki + GA: “Hedges g=0,38; %95 GA [0,15; 0,60]. Pratik önem: ≈0,38 sd’lik artış.”
-
Kategorikte: “RR=0,76 [0,63; 0,92]; RD=−%4,8 [−%8,3; −%1,1]; NNT≈21.”
-
Sağkalım: “HR=0,74 [0,60; 0,91]; 12. ay kümülatif fark −%6,2.”
23) Örnek Olay A — Eğitim: Program Etkisi (Bağımsız t)
Amaç: Programın sınav puanına etkisi.
Plan: MDE d=0,40; α=0,05; güç=%80 → her grup N=100 (kayıp %10 → brüt N=222).
Sonuç: g=0,36 [0,12; 0,60]; güç duyarlılığı (mevcut N=200) için MDE≈0,39.
Yorum: Etki küçük–orta; pratik önem için maliyet–fayda analizi.
24) Örnek Olay B — Sağlık: Rehospitalizasyon (Lojistik)
Amaç: Müdahale yeniden yatış riskini düşürüyor mu?
Plan: p₀=%18, hedef RR=0,80 → p₁=%14,4; güç=%80 için toplam N≈2.300; EPV≥10 koşulu gözetildi.
Sonuç: OR=0,78 [0,66; 0,92]; HL p>0,05; kalibrasyon iyi.
Yorum: Mutlak fark −%3,6; NNT≈28; politika bağlamında pratik anlam var.
25) Örnek Olay C — Küme-Rasgele Eğitim Çalışması
Amaç: Okul temelli müdahale.
Parametre: ICC=0,04; m=30; DEFF=1+(29×0,04)=2,16.
Plan: Bağımsız tasarım N=240 gerekiyorsa, küme tasarımında ≈519 kişi; küme sayısını artırmak (okul sayısı) gücü daha etkin yükseltti.
Yorum: 16 okul×m=35 yerine 24 okul×m=25 daha verimli.
26) Tezde “Güç” İçin Kontrol Listesi
-
Birincil hipotez(ler) ve MDE yazıldı mı?
-
α, hedef güç ve yön (tek/çift kuyruk) açık mı?
-
Etki büyüklüğü metriği bağlama uygun mu (d, g, f, RR/OR/RD, HR, r)?
-
Varyans/ICC/ρ için kaynak (pilot/literatür) gösterildi mi?
-
Kayıp/attrition ve eksik veriye karşı brüt örneklem artırıldı mı?
-
Küme/tekrarlı ölçüm tasarımlarında DEFF veya karma model planı yazıldı mı?
-
Çoklu karşılaştırma/alt grup/adalet analizlerinin α maliyeti hesaba katıldı mı?
-
Eşdeğerlik/altlık varsa marj(lar) ve gerekçesi belirtildi mi?
-
Duyarlılık senaryoları (kötümser–iyimser) raporda mı?
-
Etik gerekçe: “Yeter ama aşırı değil” örneklem rasyonalizasyonu var mı?
-
Rapor metninde etki + %95 GA ve MDE birlikte sunuldu mu?
Sonuç
Tezlerde güç analizi ve etki büyüklüğü bir lüks değil, bilimsel zorunluluktur. A priori güç; araştırma sorusunu, pratik olarak anlamlı MDE eşiğini ve veri/toplama gerçekliğini sayısal bir plana dönüştürür. Seçtiğiniz etki büyüklüğü metriği, bulgunun pratik önemini okura doğrudan anlatır: Hedges g ile puan farkının standartlaştırılmış büyüklüğü, RR/OR/RD ve NNT ile risklerin yönetimsel/klinik anlamı, HR ile zamana bağlı riskin göreli azalması, f² ile modeldeki değişkenlerin gerçekten ne kadar açıklama yaptığı… Küme-rasgele ve tekrarlı ölçümlerde bağımlılığın güce etkisini (ICC, ρ, sphericity) görmezden gelmek; sonuçların yanıltıcı yorumlarla savunulmasına yol açar. Yine, post hoc güçün p-değerine gömülü olduğunu, bilgi eklemediğini ve raporda yerine duyarlılık analizi konmasının daha doğru olduğunu unutmayın.
Uygulama reçetesi:
-
MDE’yi bağlamla belirleyin; alan uzmanı ve literatürle kalibre edin.
-
A priori güç ile N planlayın; kayıp/eksik için brüt N’yi artırın.
-
Etki büyüklüğünü (d/g, η²/f, RR/OR/RD/NNT, HR, r, f²) her sonuçla %95 GA eşliğinde raporlayın.
-
Küme/tekrarlı tasarımlarda DEFF/ICC/ρ ve karma model varsayımlarını yazın.
-
Çoklu karşılaştırma ve eşdeğerlik/altlık marjlarının maliyetini güç planına dahil edin.
-
Duyarlılık ve simülasyon ile belirsizliği dürüstçe gösterin.
-
Etik olarak “yeter ama aşırı değil” örneklem ilkesine sadık kalın; ön kayıt ve şeffaf raporlama ile güven inşa edin.
Bu disiplinle yazılmış bir tez, yalnızca “istatistiksel olarak anlamlı” değil; pratik olarak anlamlı ve güvenilir bir kanıt seti oluşturur. Sonuçlarınız hakem ve danışmanları ikna ederken, gelecek çalışmalar için ölçülü, tekrarlanabilir bir referans çerçevesi bırakır.
Akademi Delisi, eğitim ve akademik destek alanında kapsamlı hizmetler sunan öncü bir platformdur. Öğrencilerin akademik başarılarına yön verirken, onları bilgiyle buluşturmayı ve potansiyellerini en üst düzeye çıkarmayı amaç edinmiş bir ekibiz. Sitemiz bünyesinde ödevlerden projelere, tezlerden makalelere kadar geniş bir yelpazede destek sağlıyoruz. Alanında uzman yazarlarımız, öğrencilere özgün içerikler sunarken, aynı zamanda onlara araştırma, analiz ve yazım konularında rehberlik ederek kendilerini geliştirmelerine yardımcı oluyor.
Akademik hayatın zorluklarıyla başa çıkmak artık daha kolay. Akademi Delisi olarak, öğrencilere sadece ödevlerinde değil, aynı zamanda araştırma projelerinde, tez çalışmalarında ve diğer akademik gereksinimlerinde de destek sağlıyoruz. Sunduğumuz kaliteli hizmetler sayesinde öğrenciler zamanlarını daha verimli bir şekilde kullanabilirler. Uzman ekibimiz, her bir öğrencinin ihtiyaçlarına özel çözümler üreterek, onların akademik hedeflerine ulaşmalarına katkı sağlar.
Gelişmiş kaynaklara erişimden akademik yazım kurallarına, araştırma yöntemlerinden kaynakça oluşturmaya kadar her aşamada öğrencilere destek sunan Akademi Delisi, eğitimde yeni bir perspektif sunuyor. Amacımız, öğrencilere sadece geçici çözümler değil, aynı zamanda uzun vadeli öğrenme ve başarıya giden yolda rehberlik etmektir.
a priori power açık bilim adaptive tasarım ANCOVA cluster randomized trial cohen’s d Cohen’s f Cox analizi Duyarlılık Analizi EPV eşdeğerlik testi etik örneklem etki büyüklüğü etki ve güven aralığı FDR Benjamini–Hochberg FWER Bonferroni G*Power güç analizi hazard ratio Hedges’ g ICC tasarım etkisi iki oran farkı kayıp veri kollineerlik korelasyon gücü lojistik regresyonda güç MDE minimal detectable effect multiple imputation NNT non-inferiority odds ratio ön kayıt örneklem büyüklüğü partial eta squared pilot çalışma Planlama post hoc power pratik önem R pwr rapor cümlesi repeated measures power risk difference risk ratio sağkalım gücü simülasyon tabanlı güç sınıf dengesizliği sphericity SPSS power statsmodels power tez önerisi varyans tahmini