ABD seçimleri tartışmalı kampanya sürecinin ardından Donald Trump'ın sürpriz başkanlığıyla sonuçlandı. Peki son dakikaya kadar Clinton'u favori gösteren anketler ve veriler nasıl bozguna uğradı?
[mks_dropcap style="letter" size="52" bg_color="#ffffff" txt_color="#000000"]T[/mks_dropcap]rump'ın zaferi neredeyse tüm medya anketlerini, analizlerini yanlış çıkardı. ABD'li seçmenlerin oyları bu konuda verilerin ve analizlerin aslında hala ne kadar yanıltıcı olabileceğini gözler önüne serdi. Çoğu insan Clinton'ın zaferine kesin gözle bakarken, bu öngörüyü destekleyen seçim tahminleri 8 Kasım gecesini tam bir bozgunla kapattı. New York Times'ta bugün yayınlanan makalede FiveThirtyEight, New York Times Upshot gibi veri analizlerine dayalı yayın yapan medya kuruluşları, kampanya boyunca Clinton'ın kazanma şansını yüzde 70-99 arasında sunduğu belirtildi. Fakat sonuçların gelmesiyle verilerin de yanıltıcı olabileceği gün yüzüne çıktı. Silikon Vadisi'nden endüstri sektörüne kadar uzanan iş alanlarının yeni gözdesi veri ve veri madenciliği. Birçok sektör tarafından oldukça sık kullanılan bu yöntem, tasarruf ve kâr ettirici olduğu için günümüzde çok popüler. Hatta Microsoft'un 400 milyon insanın kişisel ve iş bağlantısı verilerini satın almak için LinkedIn'e 26 milyar dolar para verdiği bilinen bir gerçek. [caption id="attachment_7964" align="alignleft" width="513"]Bombalardan kaçan çıplak kız Vietnam savaşı yıkımının simge fotoğrafları arasında gösteriliyor. Bombalardan kaçan çıplak kız Vietnam savaşı yıkımının simge fotoğrafları arasında gösteriliyor.[/caption] 'ALT METİN' PROBLEMİ Fakat bu kadar değerli olan veri bilimi bir takım çelişkileri ve karışıklıkları da beraberinde getiriyor. Her ne kadar kimsenin göremediğini daha önceden görebilme becerisi olsa da veriler, alt metinleri anlayamaması, içeriği ve nüansları kaçırabilmesi sebebiyle bazen kullanışsız bir araç haline de gelebiliyor. Tüm sektörlerden şirketlerin bu 'gizli silah'ı insan davranışlarını perde arkasından takip edebilmek için kullandığı aşikar fakat Salı günü açıklanan seçim sonuçlarında olduğu gibi biz 'müşteriler' bu yöntemin nasıl işlediğine/aksadığına sadece seçim sonuçlarında olduğu gibi nadir olaylarda tanık olabiliyoruz. Veri analizi algoritmalarının ne şekilde hatalara sebep olabildiğinin en güzel örneklerinden biri ise yakın zamanda Facebook'ta yaşandı. Norveç'li bir yazar dünyanın en önemli ve Vietnam savaşının simge fotoğraflarından biri olan, bombalardan kaçan 9 yaşındaki çıplak kız fotoğrafını Facebook'ta paylaştı. Bunun üzerine yazılımın algoritması, bu fotoğrafın sosyal medya sitesinin 'pornografi' politikasına göre yasak olduğuna hükmetti ve fotoğrafı yayından kaldırdı.  Bu örnekle algoritmaların 'alt metin okumaları' ve 'direk yaklaşımları' sebebiyle sadece veriyle açıklanamayacak faktörleri doğru analiz edemediği bir kez daha ortaya çıkmış oldu. ANKETLER 'FİKRİNİ SANDIKTA DEĞİŞTİRENLERİ' OKUYAMADI Salı günü gerçekleşen seçimlerde verilerin 'etinden sütünden' faydalanılarak kullanılması ve aşırı bir şekilde pazarlanması belki de bu yöntemle bir yol haritası çizmenin yanlış sonuçlar doğurabileceğini bizlere göstermiş oldu. NYTimes'ta yer alan makalede açıklama yapan Princeton Üniversitesi Nörobilim profesörü Sam Wang, ABD seçimlerini "Anketler daha önce hiçbir seçimde görülmeyen boyutta yanıldı" diye betimleyerek anket verilerinin 'fikrini sandıkta değiştiren' cumhuriyetçi seçmenleri okumada sınıfta kaldığına işaret etti. Bu yüzden seçimlerin kaderinin sadece verilerle ve rakamlarla pazarlanması belki de sonuçları etkilemiş oldu. Günümüz iş dünyasında ve mega dijital şirketlerinde yapay zeka ve algoritmalar araba, veriler ise arabaya güç veren yakıt konumunda. Facebook, Google ve Amazon gibi dev şirketler internette attığınız her adımla ilgili veri topluyor ve bunları halı dokur gibi işleyip size kişiselleşmiş reklam ve hizmet olarak geri sunuyor. İnternet dünyasının bel kemiğine dönüşen veri uygulamalarının ve tahmin algoritmalarının limitlerinin kavranılamadan kullanılmasının sonuçları, bir nevi tüm dünyanın 'şoke' olduğu Trump'ın başkan seçilmesi ile gözler önüne serildi. [caption id="attachment_7967" align="alignnone" width="1024"]ABC kanalının seçim sayfası. ABC kanalının seçim sayfası.[/caption] Teknolojinin nimetlerini kullanmak her alanda büyük fayda sağlasa da verileri sadece bir araç olarak kullanmaktansa onlarda cevap ve olasılık aramak büyük yanılgılara yol açabiliyor. Bu tehlike ve yanılgı, seçimlerde ipi göğüsleyeceğine 'yüzde 70' oranında kesin gözüyle bakılan Clinton'ın 'yüzde 30'luk kaybetme ihtimalini göz ardı etmekte yatıyor. Tabi burada tek suç seçmende değil. En önemli faktörlerden biri de bu tahminlerin ve oranların halka nasıl sunulduğu... ABD seçimleri için kullanılan tahmin modelleri genel olarak onlarca yılın verilerine dayanıyor. FiveThirtyEight'in modelinde 1972'den beri gerçekleşen genel seçim verileri kullanılırken Clinton'ın şansı yüzde 85'teyken, model 2000'den itibaren oranları toplaması yönünde güncellenince, Clinton'ın şansı yüzde 95'e kadar yükselmişti. Bu da aslında verilerin bu tip önemli konularda ne şekilde/oranda kullanıldığının önemine büyük bir vurgu yapıyor. Büyük yüzdelerle gözü boyanan seçmenin 'perde arkasını' görememesi, belki de ABD seçimlerinin veriler, algoritmalar ve tahminlerle kaderini değiştiren önemli faktörlerden biri olarak tarihe geçti.
Bu haberde New York Times'ta bugün yayınlanan The Data Said Clinton Would Win. Why You Shouldn’t Have Believed It. analizinden örnekler ve bilgiler kullanılmıştır.
Dokuz8HABER / Anıl Karaca