Karanlık Bir Gelecek: Büyük Veri - İzlem Gözükeleş

Sosyal medya tartışmalarında, sosyal medyadaki etkileşim sonucunda oluşan büyük veri çoğunlukla ihmal ediliyor. Kişisel verilere zaman zaman mahremiyet bağlamında değinildiği oluyor. Ama nedense daha ileri gidilmiyor. Büyük veri, mahremiyetin çok daha ötesinde kritik bir konu. Ali’nin ya da Ayşe’nin  kişisel verisinden ve mahremiyetinden bahsedebiliriz. Fakat Ali, Ayşe, Can gibi binlerce kullanıcının kişisel verisi bir araya geldiğinde mahremiyeti aşan bir durum ortaya çıkar. Bugün Arap Baharı’nın ve Gezi Direnişi’nin etkisiyle sosyal medyanın devrimci yönleri üzerine kitaplar, makaleler yazılıyor. Korkarım ki değil devrim, tam tersine çok tehlikeli bir sürecin içindeyiz. Daha önce büyük veriyi, 115.  (PRISM, büyük veri ve direniş) ve 121. (Veri, bilgi, eylem) sayılarda tartışmıştım. Bu yazıda da MIT Technology Review‘in Haziran-Mayıs sayısında yayımlanan ve büyük veri dünyasındaki önemli gelişmeleri değerlendiren üç makaleyi yer vereceğim: Yüzleri Neredeyse Sizin Kadar İyi Eşleştirebilen Yazılım (Software That Matches Faces Almost as Well as You Do ), Hatalı Analiz (Mistaken Analysis) ve Sosyal Mühendisliğin Sınırları (The Limits of Social Engineering) İnternette anonimlik ve bunun iletişimde sağladığı avantajlar büyük veriyle beraber sona erdi. Peeter Steiner’in 5 Temmuz 1993’te The New Yorker‘da yayımlanan karikatüründe, bilgisayarın önündeki sandalyede oturan bir köpek, yerdeki köpeğe dönüp “internette kimse sizin köpek olduğunuzu” anlamaz diyordu: ınternet-zone Bu söz ve karikatür yıllarca internetteki anonimliğin simgesi oldu. Bugün ise Google ve Facebook gibi şirketlerin yanı sıra internet altyapısını kontrol eden şirketler ve hükümetler de kişileri en yakınlarından bile daha iyi tanıyabilme potansiyeline sahipler. Şirketler, kişiye özel reklamlar göstermek için internet kullanıcılarının webdeki her tıklamasını  kaydederek devasa veri dağları oluşturmakta ve hükümetler, suç ve terörizmle mücadele bahanesiyle veri toplamak için gözetim sistemlerine büyük yatırımlar yapmaktadır. Needham (2013) bilgisayar endüstrisini modaya benzetmektedir. Bir süre beklediğinizde eski kıyafetleriniz tekrar moda olmaktadır. Bilgisayar endüstrisinde de eski bir teknolojinin farklı bir bağlamda yeniden gündeme gelmesi sıkça rastlanılan bir durumdur. Bugün büyük veri kapsamında gündeme gelen  paralel işleme, dağıtık dosya sistemleri, kümeleme (clustering) teknolojileri zaten yıllardır kullanılmaktadır. Bunun yanında, internetin yaygınlaşmasından ve internetteki veri miktarının fazlalığından yola çıkarak her şeyi büyük veri olarak adlandırma yönünde bir eğilim de vardır (Croll, 2012b). Dolayısıyla önce değişenin ne olduğuna bakmak ve büyük verinin kapsamını netleştirmek gerekiyor. Büyük veri, bilişim teknolojilerindeki ilerlemeler sonucunda veri saklama kapasitesinin ve işlem hızının artmasıyla ortaya çıkan 3V (volume, velocity, variety) ile tanımlanmaktadır:

  • aşırı büyük veri hacmi (Volume)
  • yüksek veri hızı (Velocity)
  • çok geniş veri çeşitliliği (Variety)

Croll (2012a) geçmişteki teknolojilerin,  bu V’lerden aynı anda sadece ikisini sağlayabildiğine dikkat çeker. Üç V arasında sürekli bir gerilim vardır. Büyük veri öncesi teknolojilerde yüksek veri hacmi ve yüksek veri hızı ancak veri çeşitliliğinden feragat edildiğinde elde edilebilmektedir. Ya da yüksek veri hacminin ve çeşitliliğinin olduğu yerde veri hızı düşmektedir. Büyük veri ise 3V’yi aynı anda sağlayabilmektedir. Şimdi 3V’ye daha yakından bakalım.

Hacim

1990lardan itibaren depolama kapasitesinin artması, internet ve sosyal medya uygulamalarının yaygınlaşması, e-devlet ve e-ticaret uygulamalarıyla iş süreçlerinin sayısallaşması  ve verinin potansiyelinin farkına varılması sonucu veri hacminde önemli artışlar olmuştur:

  • 650 milyondan fazla web sitesi vardır[i].
  • 1,28 milyardan  fazla Facebook kullanıcısı var ve bu kullanıcıların 800 milyondan fazlası Facebook’a her gün giriş yapmaktadır[ii]. 2012 yılı sonunda yayımlanan bir habere göre (Facebook kullanıcı sayısı 1 milyarken[iii]) Facebook’taki veri miktarı her gün 0,5 petabyte artmaktaydı[iv].
  • Twitter’ın 255 milyondan fazla kullanıcısı var ve günde ortalama 500 milyon tweet atılmaktadır[v].
  • Kredi kartı işlemleri, telefon kayıtları, web’deki trafik bilgileri, CCTV kayıtları olağanüstü hacimlerdedir.
  • Birçok şirket müşteri işlemlerini takip etmek için geniş veri ambarları vardır. Küçük bir veri ambarı bile yüz milyondan fazla müşteri işlemi içerir.

Artan yalnızca internet kullanıcıları ve sayısallaşan ekonomik ve toplumsal ilişkiler değildir. Kullanımı her geçen gün artan akıllı cihazlar da (kimi zaman kullanıcı farkında bile olmadan) veri miktarını artırmaktadır. IDC’nin (International Data Corporation) 2014 yılının Nisan ayında yayımlanan raporuna göre 2013’te 4.4 trilyon gigabyte olan dünyadaki toplam veri boyutu 2020’de 44 trilyon gigabyte olacaktır[vi].

Hız

Veri iki yönlü akmaktadır. Bir yandan verinin oluşum  hızı sürekli artarken diğer yandan  iş modellerini büyük veri üzerine kuran şirketler veriyi hızla analiz edip geri bildirimde bulunmaktadır. Örneğin, bir akıllı telefon kullanıcısının konum bilgileri hızla tespit edilip (kişi bulunduğu konumdan uzaklaşmadan) kullanıcıya ait diğer bilgilerle birleştirilerek analiz edilmekte, analiz sonucunda kişiye özel (daha önceki harcamaları dikkate alınarak), yakınındaki bir mağazaya ait reklamlar gönderilmektedir.

Çeşitlilik

Dünyadaki verinin  %70’i internet kullanıcılarının e-posta, Facebook, Twitter, LinkedIn, Flickr, YouTube vb kullanımı sonucunda oluşmaktadır (Craig ve Ludloff, 2011). Hükümetlerin ve şirketlerin topladığı verilerin büyük bir kısmını kullanıcılar, şirketler tarafından sunulan hizmetleri ücretsiz kullanmak için gönüllü olarak (ama verinin sınırlı kullanımı düşünülerek) verir. Bir kısmı ise kişilerin haberi olmadan gizlice toplanır.

Croll (2012a) büyük veri öncesinde de veri toplandığını ama bunun bilinen bilinmeyenleri bulmak amacıyla yapıldığını söylemektedir. Daha önceden, veriyi saklamak için ilişkisel veritabanları kullanılırken bu veritabanlarını tasarlayan uzmanlar hangi verinin toplanacağına daha tasarım aşamasında karar verirlerdi. Örneğin bir ilişkisel veritabanında müşteri bilgilerini tutmak için bir tablo tasarlanıyorsa tablonun hangi alanlardan (ad, soyad, cinsiyet, yaş, adres, meslek vb) oluşacağı belirlendikten sonra müşterilerin bu verileri toplanıp saklanırdı. Böylece müşteri hakkındaki bilinmeyenlerin ne olacağı önceden bilindiğinden kişinin medeni durumu ya da saç rengi verisi önceden belirlenmiş bu alanlar arasında  yer almadığından göz ardı edilirdi. Büyük verinin odağında ise bilinmeyen bilinmeyenler vardır. Veri toplayanlar bunu bir amaç doğrultusunda yapsalar da bu durum toplanan veriyi sınırlandırmaz; hangi verilerin toplanacağına dair kesin sınırları yoktur. Kişinin saç rengi,  tuttuğu takım, hobileri vb veriler o an için ihtiyaç olmasa da saklanır. Sorular ve araştırma konuları sonradan gelebilir. Daha da önemlisi veriler sürekli hareket halinde olabilir. Bir şirket, elindeki verileri hükümetlere  ya da başka şirketlere satılabilir. Çünkü iki ya da daha fazla veri kümesi birleştirildiğinde ilk başta tahmin edilmesi güç bilgiler ve araştırma soruları ortaya çıkabilmektedir.

Büyük veriyi 3V ile tanımladıktan sonra asıl sorumuza geçebiliriz: Büyük veri insanlık için ne vaat etmektedir? Bu sorunun yanıtını yazının başında belirtilen üç makalede aramaya çalışacağım.

YÜZLERİ NEREDEYSE SİZİN KADAR İYİ EŞLEŞTİREBİLEN YAZILIM

Simonite (2014) yazısında Facebook’un DeepFace yazılımını tanıtıyor. DeepFace yazılımı bir kişiye ait iki farklı fotoğrafı %97.25 başarı oranıyla eşleştirebiliyor. Aynı eşleştirmeyi bir insan yaptığında ise başarı oranı sadece ufak bir farkla %97.53 oluyor. Facebook bu çalışmasında yapay zekanın alanlarından biri olan derin öğrenmeyi (deep learning) kullanıyor. Simonite (2014), DeepFace’in şu anki çalışma konusunun iki fotoğrafın karşılaştırılıp her iki fotoğrafın da aynı kişiye ait olup olmadığının tespiti olmasına karşın bu çalışmanın altında yatan tekniklerin yüz tanıma çalışmalarında da kullanılabileceğini belirtiyor.

DeepFace’in yüz karşılaştırması iki adımdan oluşuyor. Birinci adımda, karşılaştırılan fotoğraflardaki yüzler, yüzün açısı öne bakacak şekilde düzeltiliyor. İkinci adımda ise fotoğrafta düzeltilen yüzün sayısal tanımı üzerinde derin öğrenme süreci başlıyor. Bu süreçte, yeterli benzerliklere erişildiğinde iki yüzün aynı olduğuna karar veriliyor.

DeepFace şu an sadece bir araştırma projesi. Fakat projenin Facebook tarafından yürütülüyor olması rastlantı değil. Washington Üniversitesi’nde yüz doğrulama ve tanıma üzerine çalışan Neeraj Kumar’ın belirttiği gibi Facebook’un bu çalışması, geniş sinir ağları yeterli veriyle beslendiğinde bilgisayarların örüntü algılama ve buna göre kararlar verebilme becerisinde de önemli gelişmeler elde edilebildiğini gösteriyor.

Belki paranoyakça gelecek ama Facebook’un insan yüzü tanıma konusundaki çalışmalarını düşününce selfie çılgınlığının öyle masumane ve kendiliğinden olduğunu düşünmüyorum.

Sonuç 1: Büyük veri, bilgisayarları daha akıllı yapıyor ve bu akıllı bilgisayarlara sahip olanlar en başta bu veriye sahip olan Google, Facebook, Microsoft, Apple vb şirketler. PRISM skandalında görüldüğü en akıllı bilgisayar da (tüm bu şirketlerin verisine erişim hakkı olduğu için)  NSA’da (National Security Agency – ABD Ulusal Güvenlik Ajansı)!

HATALI ANALİZ

Büyük verinin potansiyelini ve insanlık için de kullanılabileceğini ispat etmek için  anlatılan başlıca öykülerden biri Google’ın grip salgınının yayılmasını tespitidir. Ben de 115. sayıdaki  PRISM, büyük veri ve direniş başlıklı yazıda aynı gerekçeyle bu örneği vermiştim:

2009 yılında, kuş ve domuz gribi virüslerinin bileşiminden oluşan yeni bir grip virüsü keşfedildi. Virüs 1918 yılında İspanya’da yarım milyar kişiyi etkileyen ve milyonlarca insanın ölümüne neden olan grip virüsüne benzetildi. Tek umut, gribin yayılmasını önlemekti. Bunun için de gribin nereden yayılmaya başladığının bulunması gerekiyordu. ABDli bir kuruluş olan CDC (Centers for Disease Control and Prevention – Salgınları Kontrol ve Önleme Merkezleri) doktorlardan grip vakalarını kendilerine bildirmelerini istedi. Fakat bu pek kolay bir iş değildi, virüs kendini hemen göstermiyordu ve grip olağan bir hastalık olduğundan ilk etapta kimse doktora gitmiyordu. Üstelik CDC verileri ancak haftada bir kere bir tabloda bir araya getiriyordu. Google mühendislerinin daha salgın başlamadan birkaç hafta önce salgınların yayılma sürecinin aranan kelimelerden yola çıkarak izlenebileceğini iddia eden bir yazısı Nature dergisinde yayınlanmıştı. Üzerinde günde üç milyardan fazla arama yapılan Google, kurduğu matematiksel modellerle çok kısa bir sürede virüsün yayılma seyrini tespit etti.

David Lazer (2014),  Hatalı Analiz başlıklı yazısında Google’ın bu analizinin geçerliliğini yavaş yavaş kaybettiğini belirtiyor. Bunun nedenini de Google’ın grip konusunda yapılan aramalarla gribin yayılımı arasında sabit bir ilişki olduğunu varsayması olarak görüyor. Lazer, arama teknolojisinin değişmesi ve insanların bunu zamanla farklı şekillerde kullanmaya başlamasıyla varsayılan ilişkide de değişiklikler olduğunu savunuyor. Lazer, bu durumu Chicago Tribune‘nün 1948 yılındaki başarısız seçim anketine benzetiyor.  Chicago Tribune, anketlere göre Dewey’in Truman’a karşı zaferini ilan etmiş ama sonuç beklenildiği gibi gerçekleşmemişti. Günümüzde başkanlık seçimlerinin 50 eyalette de çok ufak sapmalarla tespit edilebildiğini yazan Lazer, büyük veri araştırmalarının da zaman içinde olgunlaşacağını vurguluyor.

Ancak Lazer’e göre bu araştırma daha açık olsaydı ve diğer araştırmacılara Google’ın sahip olduğu verileri kullanma olanağı verilseydi, ham veriden daha başarılı sonuçlar elde edilebilirdi. Büyük veriye sahip olan Google, araştırmaların yönünü ve sınırlarını da belirliyor. Lazer, büyük verinin abartıldığını düşünse de Google’ın grip eğilimlerinin tespiti üzerine olan vaatlerini temel olarak doğru buluyor ve bunların bireysel hareketlere, davranışlara ve iletişime uygulanabileceğini ve doğru olarak kullanıldığında dünya için yararlı olacak bir toplum biliminin de başlangıç noktası olacağını savunuyor.

Sonuç 2: Büyük verinin ve kamuoyu ile sonuçlarını paylaştıkları algoritmaların mülkiyeti  şirketlerin elinde. Onların izni olmadan şirket için çalışmayan araştırmacıların büyük veri üzerinde çalışma yapması olanaklı değil. Tasarımında, büyük veri sahibi şirket dışındaki öznelerin ilgi ve çıkarlarını içermeyen bir teknolojinin insanlık yararına gelişebileceğini ummak biraz fazla iyimserliktir.

SOSYAL  MÜHENDİSLİĞİN SINIRLARI

Üçüncü yazıda ise Nicholas Carr, Sosyal Mühendisliğin Sınırları başlıklı yazısında Alex Pentland’ın Sosyal Fizik: Düşünceler Nasıl Yayılır başlıklı çalışmasını tartışıyor.

Reklam şirketleri büyük veri analizleriyle kişiye özel reklamlar reklamlar gösteriyorlar. Şirketler büyük veri sayesinde müşteri ilişkilerini daha sağlam temeller üzerine kurabiliyor, tedarik zincirini daha doğru bir şekilde yönetebiliyor. Bankalar, kredi verirken ya da dolandırıcılık şüphesi olan bankacılık işlemlerini tespit ederken büyük veriden faydalanıyor. Şirketler sattıkları ürünlerden gelen verilerle daha kullanıcı dostu ve sağlam ürünler geliştirmeye çalışıyor.

Peki büyük verinin insanlığa ne faydası olacak?

Sağlık alanındaki büyük veri çalışmaları büyük verinin yararları konusunda ikna edici görünüyor. İlaç prospektüslerindeki yüzdelik dilimleri hatırlayalım.  “Bu ilacı kullananların %0.1’inde bulantı görülmüştür.” Günümüzde ne doktor ne de eczacı %0.1 içinde yer alıp almadığımızı bilemiyor. Çünkü (ne yazık ki!) teşhisler ve uygulanan tedaviler doktorun bilgisi ve tecrübesiyle sınırlı. Doktorlar bir tedaviyi uygularken, tedavinin %80 olumlu sonuç vereceğini söylerken acaba bir olasılıktan mı bahseder,  yoksa bu tedavi yöntemi hastaların %80’inde %100 sonuç verirken, %20’sinde etkili olamamıştır mı demek isterler? Büyük veri, hem genetik bilimini geliştirecek hem de onunla beraber bir çok hastalığın tedavisinde ve daha hastalık oluşmadan önlenmesinde eşsiz bir potansiyele sahip (O’Reilly ve diğerleri, 2012). Belki büyük veri sayesinde, kahvenin yararlı mı yoksa zararlı mı olduğu sorusuna da nihayet yanıt bulabileceğiz (Pentland, 2014).

Croll (2012a) sağlık uygulamalarının yanında büyük verinin hükümetlere, bütçeyi belirleme ve kaynakların etkin bir şekilde kullanma olanağı sağlayacağını, hükümet-vatandaş ilişkisini demokratikleştireceğini belirtiyor. Ama söz konusu hükümetler olunca akıllara daha çok George Orwell’in 1984‘ü geliyor. Günümüz koşullarında büyük verinin aşağıdaki gibi kullanılması daha muhtemel (Davis, 2012):

  • Sağlık sigortası şirketleri, Webdeki arama kayıtlarınıza (örneğin göğüs ağrısını araştırdınız.) göre işlem yapabilir. Uygun tedavi ya da önleyici tıp için toplanan veriler sigorta şirketlerinin elinde farklı bir anlam kazanabilir.
  • Kasko şirketleri, kaskonuzu aracınızın GPS verilerine göre yapabilir.
  • Genetik bilgileriniz, iş başvurularınızı etkileyebilir.
  • Sosyal ağ kullanımız ve web’deki gezintilerinizle suça eğilimliler kategorisine girip gözetim altına alınabilirsiniz.

Çok yakın zamanda, yolda yürürken kameralar tarafından çekilen bir görüntünüz ile adli sicil kaydınızdan, web’deki gezintilerinize, sosyal ağlardaki ilişkilerinize  ve olası sağlık sorunlarınıza kadar birçok veriye çok hızlı bir şekilde erişilebilecek.

MIT’nin  İnsan Dinamiği Laboratuvarı’nın (Human Dynamics Laboratory) yöneticisi  Alex Pentland gibi sosyal mühendislik çabası içinde olan bilim insanlarının çalışmaları ise daha büyük bir tehlikenin ve karanlık bir geleceğin habercisi. Pentland (2014), sosyal fizik adını verdiği çalışmasında enformasyonun ve düşüncenin (idea) akışı ile insanların davranışı arasındaki matematiksel bağlantıları araştırıyor. Pentland, geleneksel fiziğin enerji ve hareket ilişkisini sosyal fizikte düşünce ve davranış ilişkisine benzetiyor. 1800’li yıllardan sosyal bilimleri doğa bilimleri gibi ele alma yönünde girişimlerin olduğunu ancak günümüzde büyük veri ile birlikte insan hareketinde ve iletişiminde istatistiksel düzenlilikler gözlemlendiğini belirtiyor. Pentland’a göre bu düzenlilikleri tamamen anladığımızda toplumsal etkileşimlerin temel mekanizmasını da çözmüş olacağız.

Ayrıca Pentland, sosyal fiziğin daha iyi şirketler, şehirler ve kurumlar sağlayabileceğini; şimdiye kadar piyasa, politik sınıflar, toplumsal hareketler gibi kavramların dünya hakkındaki düşüncemizi şekillendirdiğini, kullanışlı olmalarına rağmen gerçekliği basite indirgediğini iddia ediyor. Büyük veri, Pentland ve ekibine canlı bir laboratuvar sunuyor, günlük hayatın hikayesini anlatan veriden insanların diyabete yakalanıp yakalanmayacaklarını, aldıkları krediyi ödeyip ödeyemeyeceklerini tahmin edebiliyorlar. Kazalar, ayaklanmalar ve ekonomik krizler gibi bugüne kadar tanrısal olarak görülen olguların bu şekilde açıklanabileceğini savunuyorlar. Ekonomik krizlerde, Arap Baharı’nda ya da hastalıklarda, birbiriyle sürekli ilişki halinde olan bireylere ait örüntüler olduğuna dikkat çekiyorlar.

Pentland’ın topluma dair bu tasavvurları daha küçük ölçekte gerçekleştirdiği deneysel çalışmalara dayanıyor. Örneğin, bir iş yerinde yaptıkları çalışmada, çalışanların boynuna onları izleyebilecekleri kimlik kartları takıp birbiriyle olan iletişimini izlediklerinden söz ediyor. Bu izlemede, çalışanların hareketleri, ses tonları ve vücut hareketleri takip ediliyor. Böylece şirket içindeki iletişim trafiğinin yanında kişilerin dışa dönüklüğü ve duyarlılığı gibi özellikleri de izlenebiliyor. Pentland bu araştırmalar sonucunda kahve molasının süresini yeniden düzenleyerek verimliliği artırabildiklerini belirtiyor. Pentland, bu çalışmanın algılayıcılarla (sensor) donatılmış akıllı telefonlarla  daha geniş kesimler üzerinde de uygulanabileceğini de  ekliyor. Pentland bununla da yetinmeyip, devamını da açık seçik ifade ediyor: Büyük veri, insanlarının davranışlarını değiştirmeye, onları daha farklı davranmaya yönlendirmek için kullanılabilir.

Pentland kitabında, tüm bunların insanlık için oluşturduğu tehdidin de farkında olan biri olarak bu büyük veri araştırmalarının insanların mahremiyetine zarar vermeden de yapılabileceğini iddia eder. Böylelikle Pentland, büyük veri reklamcılarının birçoğunun yaptığı   gibi büyük verinin hem şirketler için karlı hem de toplum için faydalı sonuçları olabileceğini ve teknolojinin tarafsız olduğunu; buna karşın  büyük verinin kullanımının tarafsız olmayıp toplum için iyi yönde de kötü yönde de kullanılabileceğini söyler.

Ancak büyük veri, daha oluşum süreci bile topluma karşıdır. Örneğin, “20 Nisan 2011’de iki güvenlik uzmanı iPhone’un kişinin konumunu düzenli olarak gizli bir dosyaya kaydettiğini” (Davis, 2012) duyurana kadar kimsenin bundan haberi yoktur; Pentland’ın bahsettiği algılayıcılar, akıllı telefonlara ya da başka akıllı cihazlara eklendiğinde belki kullanıcıların bundan ya da işlevinden haberi bile olmayacak. Gezilen web siteleri, mesajlaşmalar, e-posta içerikleri, internet üzerinden yapılan telefon görüşmeleri devletlerin ve internet servis sağlayıcıların kontrolünde taşınmaktadır. Verilerin bu taşınma sürecinde, derin paket incelemeye maruz kalabildiğini (Fuchs, 2012), PRISM skandalında gözler önüne serildiği gibi ABD hükümetinin bir çok şirketin (Google, Yahoo, Microsoft, Apple) verisine erişebildiğini de biliyoruz.

Çoğu zaman,  verinin ne için kullanılacağına dair insanlara bilgi vermeden toplanan, satılan, başka veri kümeleri ile entegre edilen büyük verinin toplumun yararına kullanılabileceğini ummak biraz fazla iyimserlik oluyor. Ayrıca Carr, Pentland’ın iddia ettiğinin aksine kullanıcıların kendileri hakkında toplanan veriye doğrudan erişim hakkına sahip olamayacağını; çünkü şirketlerin büyük veriden, yani sermayelerinden, taviz vermeye yanaşmayacaklarını düşünüyor.

Toplumun matematiksel denklemlerle ifade edilip edilemeyeceği farklı bir tartışma konusu. Bunda, en azından kısmen, başarılı sonuçlar elde edilebileceğini düşünüyorum. Fakat Carr’ın Pentland’a yönelttiği ikinci eleştiriyi dikkate almak gerekiyor: Olası bir başarı, toplumsal sorunları aşmak, sorunların kökenine inmek yerine statükoyu daha da güçlendirecektir.

Sonuç 3: Kuşkusuz büyük veriyle insan daha iyi tanınacak. Fen bilimlerindeki kesinliğe sosyal bilimlerde de yaklaşılabilecek. Ama kamuoyunun neyi bilip neyi bilemeyeceğine kadar verenler ve buna göre onu yönlendirenler büyük veriye sahip olanlar olacak. Dolayısıyla, büyük veriyi tanımlarken 3V’nin yanına gizlenen ya da görmezden gelinen mülkiyet ilişkilerini de eklemek gerekiyor.

Bugün ağlarda akan veriyi durdurmak ya da yavaşlatmak mümkün değil. Büyük veri, nükleer silahlardan daha tehlikeli bir potansiyele sahip. Ama yine de insanlar yüksek sesle “BÜYÜK VERİNİN SAHİBİ KİM?” sorusunu sormaya başladıklarında karanlığın dağılmaya başlayacağını düşünüyorum. Umarım çok geç kalmayız.

Kaynaklar

Carr, N. (2014), The Limits Of Social Engineering, MIT Technology Review.Vol 117 No 3

Craig, T. ve Ludloff, M. E. (2011). Privacy and big data. O’Reilly Media, Inc.

Croll, A. (2012a). Big Data Is Our Generation’s Civil Rights Issue, and We Don’t Know It. Big data now p. 55-60, O’Reilly Media, Inc..

Croll, A. (2012b). Three Kinds of Big Data. Big data now, p. 60-64, O’Reilly Media, Inc..

Fuchs, C.( 2012). Implications of Deep Packet Inspection (DPI) Internet Surveillance for Society , http://www.projectpact.eu/documents1/%231_Privacy_and_Security_Research_Paper_Series.pdf

Lazer, D. (2014). Mistaken Analysis. MIT Technology Review.Vol 117 No 3

Needham, J. (2013). Disruptive Possibilities: How Big Data Changes Everything. O’Reilly Media, Inc.