Büyük veri ya da İngilizce karşılığı olan "big data" geleneksel veri tabanı sistemleriyle depolanması, yönetilmesi ve analizi mümkün olmayan verilerdir.
Büyük veri, analiz edilmesi ve verimliliği arttırması için toplanan, anlamlı ve işlenebilir veriler bütünüdür.
Büyük veriye ilişkin bilgiler özetle şunlar;
Dünyada üretilen tüm verinin yüzde 90'ı son beş yılda oluştu.
Her gün 2,5 milyar GB veri üretiliyor.
Forbes'e göre 2023 yılında Büyük Veri Analitiği (Big Data Analytics) pazarı 103 milyar dolar büyüklüğüne ulaşacak.
İnternet ve sosyal medya kullanımının baş döndüren bir hızla yaygınlaşmasıyla, dünyanın her yerinden milyonlarca insan bireysel, toplumsal, kültürel ve çevresel ipuçları taşıyan verileri kapsayan paylaşımlar yapıyor.
Facebook, Instagram, Linkedin vs. sosyal medya platformları, kullanıcılarının ürettiği tüm veriyi işliyor. Fotoğraf ve video paylaşımları, sayfa beğenileri, reklamları izleme süreleri ve daha pek çok şey.
Kısaca internet üzerinden kullanıcıların arama alışkanlıkları, konumu, dili vs. tüm bilgiler kayıt altına alınarak işleniyor. İşte tüm bu bilgiler büyük veriyi oluşturuyor
Yapılan araştırmalarda “Dünya üzerindeki veri akışının %90’ının son iki yılda gerçekleşmiş olması, dünyada bir dakikada 204 milyon e-posta gönderilmesi, Facebook’a bir dakikada 200 milyon fotoğraf yüklenmesi ve YouTube’a dakikada 100 saatlik veri yüklenmesi verinin hacmini anlamamıza yardımcı olacak bilgilerdir.
Veriler ne kadar hızlı işlenirse o kadar hızlı bilgi üretilir, anlamlandırılır ve faydalı hâle dönüşür..
Çeşitlilik verinin heterojen yapısını ifade eder.
Elde edilen veriler tabletlerden, akıllı telefonlardan veya sosyal ağlardan farklı formatlarda, dillerde ve kodlarda oluşturulmaktadır.
Bu yapılandırılmamış verilerin işlenmesi büyük veri analizleri kullanılmadan
olanaksızdır. Verilerin değeri ise kurumların hızlı ve doğru karar vermesine katkı sağlaması olarak ifade edilebilir. Büyük veri tanımı verinin kullanıldığı alana göre farklı şekillerde yapılabilmektedir
En tipik tanımı verinin terabit veya petabitin yüzlerce katı olmasıdır.
Bir başka tanımı ise organizasyonların farklı dijital veri setlerini bütünleştirerek istatistik ve veri madenciliği teknikleriyle gizli kalmış bilgileri ve sürpriz korelasyonları ortaya çıkarmaktır.
Çoğunluğu yapılandırılmamış olan ve üstel bir şekilde büyüyen, geleneksel veri tabanlarının işleme kapasitesini aşan veri olarak da tanımlanır” bilgileri görülmekte…
Büyük verinin önemi
Büyük veri tamamen gerçek verilerin analizine dayandığı için maliyetleri düşürme, doğru kanallara reklam harcaması yapma, iş gücünden tasarruf sağlama ve beklentilere uygun ürün geliştirme gibi birçok farklı alanda doğru kararlar alınmasına olanak tanımaktadır.
Büyük verinin kullanım alanları
Son yıllarda büyük verinin önemi devletler tarafından da anlaşılmış ve çeşitli alanlarda kullanılmaya başlanmıştır.
Büyük veri, özellikle firmaların müşteri davranışlarını inceleyerek doğru kararlar almalarına ve stratejiler geliştirmelerine önemli katkılar sağlar.
Eldeki veriler en sade ve işlenebilir hale getirildikten sonra, karşılaştırma yöntemi kullanılarak bu verilerin birbirleriyle olan ilişkileri incelenir ve aralarındaki bağlantılar ortaya çıkartılır.
Bu sayede, alınacak olan kararların sonuçlarını önceden kestirmek mümkün olur.
Verilerde yer alan çeşitli noktaların yerleri değiştirilerek oluşturulan simülasyonlarla, farklı kararlara verilecek tepkiler görülebilir.
Büyük veri analizi sayesinde kurumlar, gerçek müşteri davranışlarına dayalı verileri doğru bir şekilde değerlendirip, yüksek faydaya sahip bir araca dönüştürebilirler.
Büyük veri, başta bankacılık ve perakende sektörü gibi müşteri davranışlarının çok fazla önem taşıdığı ve takip edilmesinin gerektiği sektörler olmak üzere her alanda kullanılabilmektedir.
Sağlık alanında; hastalıkların erken teşhis edilmesi ya da ilaç geliştirilmesi gibi konularda kullanılan büyük veri, suçları önlemek amacıyla ya da eğitim sisteminde geliştirmeler yapmak amacıyla da kullanılabilmektedir.
Büyük veriyi en etkili kullanan Google, Amazon, Apple, Microsoft ve Facebook dünyanın en değerli beş şirketi arasında yer almaktadır.
Büyük veriyi 5 ana bileşen oluşturmaktadır
- Çeşitlilik (Variety): Üretilen verilerin büyük bir kısmı, birbirinden farklı formata sahiptir. Telefonlardan, tabletlerden, bilgisayarlardan; farklı işletim sistemlerinden ya da dillerden gelen veriler birbirinden farklı formatların ortaya çıkmasına neden olmaktadır.
- Hız (Velocity): Gün geçtikçe artan teknolojik imkanlar, elde edilen veri miktarının, yapılacak işlem sayısının ve çeşitliliğinin de aynı şekilde artmasına neden olmaktadır.
- Hacim (Volume): Geçtiğimiz 10 yılda veri miktarı 40 kattan fazla bir artış göstermiş fakat veri depolama için yapılan harcamalar ise 1,5 kat artmıştır.
Bu durum, elde edilen verinin doğru ve verimli şekilde depolanması için çok iyi bir kurgulama gerektiğini ortaya koymaktadır.
- Doğrulama (Verification): Verilerle ilgili son yıllarda öne çıkan bir diğer konu, veri güvenliği ve doğruluğu olmuştur.
Elde edilen verilerin kimler tarafından ve hangi şartlarda görüntüleneceği, bu verilerin hangilerinin gizli kalması gerektiği konuları, üzerinde dikkatle çalışılması gereken konulardır.
- Değer (Value): Büyük veri ile ilgili en önemli bileşen, değerdir.
Elde edilen ve işlenen veriler, kuruma değer kattığı sürece anlamlıdır.
Bu nedenle, büyük verinin analizinin ve simülasyonlarının doğru şekilde kurgulanması ve büyük veriyi kullanan kuruma fayda sağlaması öncelikli olarak ele alınmalıdır.
Büyük verinin riskleri
Kişilere ait verilerin depolanması sebebiyle kişisel gizlilik ihlali artmaktadır.
Kişilerin istediği ve istemediği tüm verilerin akıllı telefonlarda depolanması etik kavramına aykırı bir durum oluşturmaktadır.
Saklanan verilerin kötü amaçlı kişi ve kurumların eline geçmesi insanların en gizli bilgilerini sızdırmakta ve terörizme dahi çıkar sağlayabilmektedir.
İlgi duyanlara yararlı olacağına inandığım açık kaynaklardan edindiğim bilgiler özetle bunlar.
Değerli okurlar yeni yılınızı kutlar, sağlıklı başarılı ve bol kazançlı bir yıl dilerim…