İlerleyen teknoloji ve gelişen internet Big Data yani Büyük Veri diye yeni bir kavramı da bizlerle buluşturdu. Data yani veri kelimesi dijital ortamlarda her üretilip hem de işlenebilen enformasyon parçacığı olarak ifade edilmekte. Bu dataların yapılandırılan versiyonlarına banka ödemesi ya da sınav sonucu gibi şeyler gösterilebilir. İnternet sitelerindeki tıklamalar ya da sosyal ortamlarda gezinmeler ise yapılandırılmamış verilere verilen bir isimdir.
Bununla birlikte hızlı internet gelişimi ve internet ortamındaki bilgi kirliliği gibi durumlar ile birlikte bu sonsuz bilgi havuzu içerisinde işe yarar ve kullanışlı dataların bulunmasına için Big Data kavramı ortaya çıktı. IoT yani Nesnelerin İnterneti kavramının ortaya çıkması büyük bir data patlamasına sebep oldu. Nesnelerin İnterneti nesnelerin kablo ya da kablosuz olarak birbiri ile iletişim kurmasına sebep olduğu için bu nesneler hem veri sağlayıcı hem de veri üreticisi olmaktadır.
Bu verilerin toplanması kadar aynı zamanda analizi yapılması da gerekmektedir. Bu durumda ortaya Amerika’da What is Big Data ülkemizde ise Big Data nedir sorusunun sorulmasına sebep olmuştur. Bizde Aba Innolab ekibi olarak sizlere bu konular hakkında en merak edilen soruları cevapladık.
Büyük Veri Kavramının Tarihi
Big Data kavramı yeni sayılabilecek bir kavramdır.. John Mashey tarafından ortaya çıkartılan bir kavramdır. 1998 yılında Mashey bir sunum sırasında bu kavramı dile getirmiştir. Big Data and the Next Wave of InfraStress sunumunda ilk olarak duyurulan kavram daha sonra ise 2000 yılında Francies Diebold tarafından başka bir sunumda dile getirilmiştir. Türkiye’de Big Data kullanımı ve yaygınlaşması da bu yıllardan sonra ortaya çıkmıştır.
Büyük Veri ve Madencilik Teknikleri: Big Data’nın Oluşması
Bu data teknolojisi sayesinde sosyal medyada arşivlenen ve paylaşılan tüm resim ya da videolar anlamlı bir şekilde dönüşmektedir. 5 önemli kavram bu dataların oluşmasında etkilidir. Veri miktarını gösteren volume, hızını ifade eden velocity, veri çeşitliliği için variety, verilerin güvenliği için verification ve veri değerini göstermeye yarayan value bu dataların oluşmasına olanak sağlar.
Veri Madenciliği (Data Mining)
Data Mining verilerin analizlerinde kullanılan bir bilgi keşif işlemidir. Hem yararlı olabilecek hem de aralarında ilişki olabilecek verilerin kullanılmasını sağlayan bir işlemdir. Data Mining işleminin amacı daha önce bilgisine ulaşmamış ama yararlı olabilecek dataların tespiti olarak açıklanabilir. Bu işlem sırasında kümelenme, özetlenme, saptama ve değişkenlerin analizi gibi teknikler uygulanmaktadır. Yapay zeka teknolojisi de bu anlamda Data Mining işleminde kullanılmaktadır. Data Mining merkezlerinin insan merkezli olduğu da bilinmesi gereken bir noktadır.
Metin Madenciliği (Text Mining)
Büyük Veri tanımı ile ortaya Metin Madenciliği tanımı da çıkmıştır. Bu madencilik ise internet ortamında bulunan metin halindeki verilerin analiz edilmesine verilen isimdir. Bu işlem istatiksel bir tekniktir. Ayrıca içeriklerin ana bölgelerine bulmak ve gizli enformasyonu yakalamak için kullanılmaktadır. Bu çalışmalar genellikle yapay zeka ile bağlantılı ve birlikte yapılmaktadır.
Büyük Veri projeleri gibi konular ile ilgili bilgi almak ve bu kavramların gelecekte nasıl şekilleneceği hakkında bilgi almak için Doç. Dr. Gamze Sart resmi Youtube kanalını ziyaret edebilirsiniz. Ayrıca Aba Innolab resmi internet sitesi içerisinde de bu ve benzer konular ile alakalı yazılara ulaşabilirsiniz.