İşletmelerin büyümesi için kaynaklar

30 Kasım 2025

Outliers: Veri Biliminin Başarı Hikayeleriyle Buluştuğu Yer

Veri bilimi paradigmayı tersine çevirdi: aykırı değerler artık 'ortadan kaldırılması gereken hatalar' değil, anlaşılması gereken değerli bilgilerdir. Tek bir aykırı değer doğrusal bir regresyon modelini tamamen bozabilir - eğimi 2'den 10'a değiştirebilir - ancak bunu ortadan kaldırmak veri kümesindeki en önemli sinyali kaybetmek anlamına gelebilir. Makine öğrenimi sofistike araçlar sunar: İzolasyon Ormanı rastgele karar ağaçları oluşturarak aykırı değerleri izole eder, Yerel Aykırı Değer Faktörü yerel yoğunluğu analiz eder, Otomatik kodlayıcılar normal verileri yeniden yapılandırır ve yeniden üretemediklerini rapor eder. Küresel aykırı değerler (tropik bölgelerde -10°C sıcaklık), bağlamsal aykırı değerler (yoksul bir mahallede 1.000 € harcama), kolektif aykırı değerler (saldırıya işaret eden senkronize ani trafik ağı) vardır. Gladwell ile paralel: '10.000 saat kuralı' tartışmalı - Paul McCartney'in 'birçok grup Hamburg'da 10.000 saat çalışıp başarılı olamadı, teori yanılmaz değil' sözü. Asya'nın matematiksel başarısı genetik değil kültüreldir: Çin'in sayısal sistemi daha sezgiseldir, pirinç ekimi Batı tarımının toprak genişlemesine karşı sürekli gelişme gerektirir. Gerçek uygulamalar: Birleşik Krallık bankaları gerçek zamanlı anormallik tespiti yoluyla %18 potansiyel kayıplarını geri kazanıyor, üretim insan denetiminin gözden kaçıracağı mikroskobik kusurları tespit ediyor, sağlık hizmetleri klinik deney verilerini %85+ anormallik tespiti hassasiyetiyle doğruluyor. Son ders: Veri bilimi aykırı değerleri ortadan kaldırmaktan onları anlamaya doğru ilerledikçe, alışılmadık kariyerleri düzeltilmesi gereken anormallikler olarak değil, üzerinde çalışılması gereken değerli yörüngeler olarak görmeliyiz.