11.06.2025
0
Beğenme
9
Görüntülenme
Veri bilimi, çoğu zaman grafikler, istatistikler ve modellerin dünyası gibi görünür. Ama perdenin arkasında başka bir şey vardır: anlam arayışı. Elimizdeki veri kümesi, yalnızca sütun ve satırlardan ibaret değildir; içinde insanların kararlarını, sistemlerin etkisini, zamanın akışını, bazen de hataları barındırır. O hâlde şöyle soralım: Veriyle mi konuşuyorsun, yoksa sadece onu sorguluyor musun?
EDA genellikle “veriyi ilk tanıma süreci” olarak tanımlanır. Ama aslında bu tanım, EDA'nın ruhunu yansıtmaz. Çünkü EDA, veriye karşı geliştirilen bir merak biçimidir.
- Bir istatistiksel özet sana "ortalama gelir"i söyler ama bazı bölgelerde gelir neden sıfır görünür?
- Boxplot bir uç değeri gösterir, ama o gerçekten "normal dışı" mı, yoksa sistemin görünmeyen bir kuralının yansıması mı?
EDA yalnızca teknik bir ön analiz değil; verinin arkasındaki dünyayı anlamaya çalışan bir zihinsel yürüyüştür.
Şehir bazlı hastane doluluk verilerini düşün. Bir ayda ani bir artış gözlemlenmiş:
- Mevsim geçişi mi?
- Yeni bir salgın mı?
- Toplumsal bir kriz mi?
Sayısal artışı görürsün ama nedenini araştırmak seni bir analistten çok bir hikâye dedektifine dönüştürür. Veri der ki:
“Anlam benim içimde değil; benimle kurduğun ilişkide gizli.”
Yanlış varsayımlar, yanlış sonuçlar getirir.
Bir değer olağan dışı görünebilir ama o veri aslında dışlanan bir grubun sesidir.
“Burada bir şey var” diyebilmek sezginin işidir; kodun değil.
Bir histogram sana şekli verir, ama eksikliği fark eden sensin.
EDA, “Bu sonuç bana garip geldi” diyen iç sesi ciddiye almaktır.
Sezgi bir aksilik değildir, keşfin ta kendisidir.
Modelden önce gelen şey meraktır.
Veriye yaklaşım şudur:
- Monitöre eğil.
- Sütunlar arasında gezin.
- Grafiklere bak.
- Ve sonra fısılda: “Burada bir şey var, ve ben onu bulacağım.”
EDA bir prosedür değil; bir duruştur.
Veriye sezgiyle yaklaşmak, yalnızca ne olduğunu değil neden olduğunu da anlamaya çalışmaktır.
Kullanıcı yorumlarını görüntüleyebilmek için kayıt olmalısınız!