Veri Bilimi Yaşam Döngüsü

Görüntü, veri bilimi yaşam döngüsünün beş aşamasını temsil eder: Capture , (veri toplama, veri girişi, sinyal alımı, veri çıkarma); Maintain (veri depolama, veri temizleme, veri hazırlama, veri işleme, veri mimarisi); Process (veri madenciliği, kümeleme / sınıflandırma, veri modelleme, veri özetleme); Analyze (keşif / doğrulayıcı, öngörücü analiz, regresyon, metin madenciliği, nitel analiz); Communicate (veri raporlama, veri görselleştirme, iş zekası, karar verme).
“Veri bilimcisi” terimi, 2008'e kadar şirketler büyük miktarda veri düzenleme ve analiz etme becerisine sahip veri profesyonellerine duyulan ihtiyacı fark ettiklerinde ortaya çıktı. 1 2009 McKinsey & Company makalesinde, Google'ın baş iktisatçısı ve UC Berkeley bilgi bilimleri, işletme ve ekonomi profesörü olan Hal Varian, teknolojinin etkisine ve farklı endüstrilerin yeniden yapılandırılmasına uyum sağlamanın önemini tahmin etti.
Veri bilimcinin bilmesi gerekenler
Bu terimler ve teknolojiler veri bilimcileri tarafından yaygın olarak kullanılmaktadır:
Veri görselleştirme : verilerin kolayca analiz edilebilmesi için resimsel veya grafik formatında sunulması.
Makine öğrenimi : matematiksel algoritmalara ve otomasyona dayalı yapay zekanın bir dalı.
Derin öğrenme : Karmaşık soyutlamaları modellemek için verileri kullanan bir makine öğrenme araştırması alanı.
Örüntü tanıma : verilerdeki örüntüleri tanıyan teknoloji (genellikle makine öğrenimi ile birbirinin yerine kullanılır).
Veri hazırlama : Ham verileri daha kolay tüketilebilmesi için başka bir formata dönüştürme işlemi.
Metin analizi : önemli iş bilgilerini edinmek için yapılandırılmamış verileri inceleme süreci.