Ev Veritabanları Seçimleri tahmin etmek için algoritmalar kullanma: çizim çizgisi ile sohbet

Seçimleri tahmin etmek için algoritmalar kullanma: çizim çizgisi ile sohbet

Anonim

Drew, 30 ve 31 Ocak tarihlerinde Las Vegas'taki Büyük Veri İnovasyon Zirvesi'nde tanıtılacak: http://analytics.theiegroup.com/bigdata-lasvegas, Obama for America, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs ve daha fazlası.


Kayıt Linki: http://bit.ly/Zs3wms


Bu röportaj George Hill tarafından yapıldı ve Big Data Innovation Dergisi'nde yayınlandı.


Tahminlerinize ne tür bir tepki oldu?


Tepkinin çoğu, kamuoyu yoklamalarını araştıranlar ile popüler uzmanların ve yorumcuların “bağırsak hissi” tahminleri arasındaki doğruluk farkına odaklandı. Seçim Günü'nde benim gibi veri analistleri Nate Silver (New York Times FiveThirtyEight blog), Simon Jackman (Stanford Üniversitesi ve Huffington Post) ve Sam Wang (Princeton Seçim Konsorsiyumu) ​​Obama'nın seçilme şansını% 90'ın üzerine çıkardı ve doğru bir şekilde öngördüler 332 seçim oyu Obama için en olası sonuç. Bu arada Karl Rove, George Will ve Steve Forbes gibi uzmanlar Romney'in kazanacağını ve bazı durumlarda kolayca kazanacağını söyledi. Bu, gelecek seçimlere geçeceğini umduğum bir "quans zaferi" nden bahsetti.


Tahminlerinizde kullanılan algoritmayı nasıl değerlendiriyorsunuz?


Tahmin modelim, Haziran ayında başlayarak kampanyanın her gününde devlet oylarının sonuçlarını ve nihai seçim oyunu tahmin etti. Bu tahminlerin değerlendirilmesinin olabildiğince adil ve objektif olmasını istedim - eğer yanlışlarsa bana kıpır kıpır boşluk bırakmamamı istedim. Bu nedenle, seçimden yaklaşık bir ay önce, web siteme, sonuçlar bilindikten sonra kullanacağım bir dizi sekiz değerlendirme kriteri yayınladım. Sonuç olarak, model mükemmel çalıştı. Yaz boyunca Obama'nın 2008 eyaletinin tümünün Indiana ve North Carolina'dan çıkarılacağını tahmin etti ve Eylül ayında Obama'nın desteğini artırdıktan sonra bile ilk başkanlık tartışmasından sonra daraldı.


Bu kampanya boyunca hem bağımsız analistler hem de kampanya ekipleri tarafından kullanılan veri miktarı çok büyüktü, bunun 2016'da veri kullanımı için ne gibi etkileri var?


2012 kampanyası, birden fazla ve çeşitli nicel bilgi kaynağının yönetilebildiğini, güvenilebildiğini ve çeşitli amaçlara başarıyla uygulanabileceğini kanıtladı. Biz dışarıdakiler seçim sonuçlarını önceden tahmin edebildik. Kampanyalar içinde, seçmen hedeflemesi, fikir takibi, bağış toplama ve seçmen katılımı konusunda büyük adımlar atıldı. Artık bu yöntemlerin işe yarayabileceğini bildiğimize göre, geri dönüş yok. Muhabirlerin ve kampanya yorumcularının 2016 yılında anket toplanmasını çok daha ciddiye almasını bekliyorum. Obama ve Demokratlar şu anda kampanya teknolojisinde bir avantaja sahip gibi görünseler de, Cumhuriyetçiler çabucak yetişmediklerinde şaşırırdım.


Bu veri odaklı kampanyanın başarısının, kampanya yöneticilerinin artık bir analist olduğu kadar bir analist olması gerektiği anlamına geldiğini düşünüyor musunuz?


Kampanya yöneticilerinin kendilerinin analist olması gerekmeyebilir, ancak veri ve teknolojinin avantajlarından nasıl yararlanılacağı konusunda daha fazla takdir sahibi olmalıdırlar. Kampanyalar her zaman strateji oluşturmak ve seçmen duygularını ölçmek için anket araştırması kullanmıştır. Ancak şimdi bir dizi başka güçlü araç var: sosyal ağ web siteleri, seçmen veritabanları, mobil akıllı telefonlar ve e-posta pazarlaması. Ve bu, yoklama metodolojileri ve istatistiksel görüş modellemedeki son gelişmelere ek olarak. Amerikan kampanya politikalarında şu anda çok fazla yenilik var.


Seçim sonuçlarını 6 ay önceden tahmin etmeyi başardınız, sizce analiz tekniklerinizi kullanarak bir sonucu doğru şekilde tahmin etmek için gerçekçi maksimum zaman aralığı nedir?


Yaklaşık dört ya da beş ay, bilimin şu an gitmemize izin verdiği ölçüde geri döndü; ve bu biraz zorlar. Bundan önce, anketler nihai sonuç hakkında yeterince bilgilendirici değil: çok fazla insan ya kararsız ya da kampanyaya dikkat etmeye başlamıyor. Seçim sonuçlarıyla ilişkili olduğu gösterilen tarihsel ekonomik ve politik faktörler, yaklaşık 4-5 aylık aralığın ötesine geçtiğimizde tahmin güçlerini de kaybetmeye başlar. Neyse ki, bu hala kampanyalara strateji çizmek ve kaynaklarını nasıl tahsis edecekleri konusunda karar vermek için bolca zaman veriyor.

Seçimleri tahmin etmek için algoritmalar kullanma: çizim çizgisi ile sohbet