Ev Veritabanları Öneri gücü: bir veri kataloğunun analistleri nasıl güçlendirdiği

Öneri gücü: bir veri kataloğunun analistleri nasıl güçlendirdiği

Anonim

Techopedia Staff tarafından, Haziran 22, 2016

Paket Servisi: Host Rebecca Jozwiak, Dez Blanchfield, Robin Bloor ve David Crawford ile veri kataloglarının avantajlarını tartışıyor.

Videoyu izlemek için bu etkinliğe kaydolmalısınız. Videoyu görmek için kaydolun.

Rebecca Jozwiak: Bayanlar ve baylar, merhaba ve 2016 Hot Technologies'e hoş geldiniz. Bugün, “Öneri Gücü: Bir Veri Kataloğu Analistleri Nasıl Güçlendiriyor?” Sahibiyim. Ben ev sahibiniz Rebecca Jozwiak, her zamanki ev sahibi Eric için dolduruyor Bugün Kavanagh, dünyayı dolaşırken, bize katıldığınız için teşekkür ederiz. Bu yıl sıcak, sadece nerede olduğum Texas sıcak değil, ama her yerde sıcak. Her türlü yeni teknolojinin patlaması var. IoT, veri akışı, bulutun benimsenmesi, Hadoop olgunlaşmaya ve benimsenmeye devam ediyor. Otomasyon, makine öğrenmemiz var ve tüm bunlar elbette verilerle vurgulanıyor. Ve işletmeler gün geçtikçe daha fazla veriye dönüşüyor. Ve elbette, bunun amacı bilgi ve keşiflere yol açmak ve daha iyi kararlar vermek. Ancak verilerden en fazla değeri elde etmek için, elde edilmesi kolay olmalı. Kilitli tuttuğunuzda veya gömüldüğünüzde veya kuruluştaki birkaç kişinin beyninde tutarsanız, bir bütün olarak işletme için pek iyi olmayacaktır.

Ve ben veri kataloglama ve kütüphanelerin seyrini düşünmek üzereydim, uzun zaman önce bir şey bulmanız gerekiyorsa, bir konuyu araştırmanız veya bazı bilgilere bakmanız gerekiyorsa, gittiğiniz yer burasıydı. ve elbette kart kataloğuna ya da orada çalışan crabby lady'ye gittiniz. Ama etrafta dolaşmak da eğlenceliydi, eğer sadece bakmak istediyseniz ve sadece düzgün bir şey keşfedebileceğinizden emin değilseniz, bilmediğiniz bazı ilginç gerçekleri öğrenebilirsiniz, ama gerçekten bir şey bulmanız gerekiyorsa ve aradığınızı biliyordunuz, kart kataloğuna ihtiyacınız vardı ve elbette kurumsal eşdeğeri, kullanıcılarımızın zenginleştirmesi, keşfetmesi, paylaşması, tüketmesi ve gerçekten yardımcı olması için tüm verilere ışık tutmaya yardımcı olabilecek bir veri kataloğu. insanlar verilere daha hızlı ve daha kolay ulaşır.

Bugün kendi veri bilimcimiz Dez Blanchfield var ve kendi baş analistimiz Doktor Robin Bloor var, Alation'dan David Crawford var, şirketin veri kataloglama hikayesinden bahsedecek, ama önce Dez ile yola çıkacağız. Dez, topu sana veriyorum ve yer senin.

Dez Blanchfield: Teşekkürler, bugün beni aradığınız için teşekkürler. Bu, son derece ilgilendiğim bir konudur, çünkü günlük işimde karşılaştığım hemen hemen her organizasyon, gösteri öncesi şakada çok kısaca bahsettiğimiz aynı konuyu buluyorum ve bu Birkaç yıldan fazla bir süredir faaliyette olan çoğu kuruluşun, kuruluşun etrafına gömülü çok sayıda veri, farklı biçimler var ve aslında Lotus Notes'a geri dönen veri kümeleri olan müşterilerim var, bazılarında hala çalışan veritabanları sözde vekilleri gibi, ve hepsi, gerçekte verilerinin nerede olduğunu ve ona nasıl erişileceğini, kime erişim sağlayacağını, onlara ne zaman erişim sağlanacağını ve nasıl katalog ve herkesin yapabileceği bir yere nasıl ulaşılacağı: A) neyin orada ve neyin içinde olduğunun farkında olması ve B), ona nasıl erişileceği ve kullanılacağı. Ve elbette en büyük zorluklardan biri onu bulmak, diğer büyük zorluk orada ne olduğunu ve nasıl erişileceğini bilmek.

Düzinelerce veri tabanım olduğunu iyi biliyor olabilirim, ama aslında orada ne olduğunu ya da orada ne olduğunu nasıl bulacağımı bilmiyorum ve sürekli olarak gösteri öncesi verilerde keşfettiğimiz gibi, ofiste dolaşmak ve sorular sormak ve küp duvarlar arasında bağırmak ve denemek ve anlamaya çalışmak, genellikle benim deneyim, hatta ön büro, resepsiyon dolaşan bulabilirsiniz ve kimse kim bilir biliyor konuşmaya gideceksin. Çoğu zaman, her zaman BT halkı değildir çünkü veri kümesinin farkında değildir, çünkü biri yeni oluşturmuştur ve bu kadar basit bir şey olabilir - çoğu zaman BT ortamında duran bir tür proje buluruz ve proje yöneticisi her şeyin bir elektronik tablosunu kullandı ve varlıklar, bağlam ve isimler hakkında çok miktarda değerli bilgi aldı ve bu projeyi bilmiyorsanız ve o kişiyi tanımıyorsanız, bu bilgileri bulamazsınız. Sadece mevcut değil ve o orijinal dosyayı tutmanız gerekiyor.

Verilerle ilgili olarak yasaklanan bir cümle var ve buna kesinlikle katılmıyorum, ama bence bu sevimli küçük bir atım yolu ve bu belirli bir miktar insanın yeni petrol olduğunu düşünüyor ve ben eminim ki bunu daha sonra da bazı açılardan ele alacağız. Ama kesinlikle bu dönüşümün bir parçası olarak fark ettiğim şey, verilerine değer vermeyi öğrenen işletmelerin organizasyonlarının rakiplerine göre önemli bir avantaj sağlaması.

Yaklaşık beş veya altı yıl önce IBM tarafından ilginç bir makale vardı ve Avustralya'da yaklaşık 4.000 şirketi incelediler ve tüm bilgileri, tüm performans verilerini, tüm finans verilerini aldılar ve bir kaynama kabına koydular. Avustralya Ekonomi Okulu'na gönderdiler ve aslında burada ortak bir eğilim başlattılar ve teknolojiden yararlanan şirketler, rakiplerinin neredeyse hiç yakalayamadığı kadar rakiplerine göre bu kadar rekabetçi bir avantaj elde ettiler ve bence bu, insanların dijital dönüşüm dediğini gördüğümüz verilerde, verilerin nasıl bulunacağını net bir şekilde anlayan kuruluşların, bu verileri kullanılabilir hale getirmesi ve bazı çok kolay sarf malzemelerinde kullanılabilir hale getirdiği durumlarda kuruluşun modaya, kuruluşun neden ona ihtiyaç duyabileceğini her zaman bilmeden ve rakiplere göre önemli avantajlar elde etmeden.

Bu slaytta görebileceğiniz birkaç örnek var. Benim sıradaki görüşüm, hemen hemen her endüstri sektöründeki büyük çaplı bozulmanın, veriye dayalı olması ve eğer mevcut eğilimler devam edecek bir şeyse, benim görüşüme göre çünkü uzun zamandır devam eden markalar bunun ne anlama geldiğini öğrendiklerinde ve oyuna girdiklerinde oyuna toptan satışta girecekler. Veri dağları olan büyük perakendeciler, veriler üzerinde bazı tarihsel analizler uygulamaya başladığında, var olduklarını bile biliyorlarsa, bazı çevrimiçi oyuncular biraz uyandırma çağrısı alacaktır.

Ancak bu markaların çoğuyla, dünyanın en büyük taksi şirketi olan Uber'e sahibiz. Taksileri yok, bu yüzden onları büyüleyen nedir, verileri nedir? En büyük konaklama sağlayıcısı olan Airbnb, dünyanın en büyük telefon şirketi WeChat'e sahibiz, ancak gerçek bir altyapısı ve el cihazı, telefon hattı yok. Alibaba, dünyanın en büyük perakendecisi, ancak envantere sahip değiller. Facebook, kelimenin en büyük medya şirketi. Son sayımda şu an 1.4 milyar aktif veri kullanıcısı olduğunu düşünüyorum, bu da akıl almaz bir rakam. Yakın bir yerde değil - bence biri gezegenin dörtte birinin aslında her gün orada olduğunu iddia etti ve yine de aslında içeriği oluşturmayan bir içerik sağlayıcısı, sundukları tüm veriler onlar tarafından oluşturulmuyor, yaratılıyor ve bu modeli hepimiz biliyoruz.

SocietyOne, duymuş olabileceğiniz veya duymayabileceğiniz bir yerel marka, sanırım birkaç ülkede eşler arası krediler veren bir banka, yani başka bir deyişle parası yok. Tüm yaptığı işlemleri yönetiyor ve veriler onun altında duruyor. Netflix, hepimiz buna çok çok aşinayız. Burada ilginç bir tek astar var. Netflix yasal olarak Avustralya'da kullanılabildiğinde, resmi olarak duyurulduğunda, buna ulaşmak için bir VPN kullanmak zorunda kalmadınız, dünyanın dört bir yanındaki birçok insan - yerel bölgenize ulaşamıyorsanız - Netfix Avustralya'da başlatıldığında, internet bağlantılarımızdaki uluslararası bant genişliğini yüzde 40 artırdı, bu nedenle Avustralya'daki internet kullanımını neredeyse bir gecede, verilerle oynamaktan başka bir şey yapmayan tek bir uygulama, bulutta barındırılan bir uygulama ile neredeyse iki katına çıkardı. Bu sadece akıllara durgunluk veren bir istatistik.

Ve elbette, hepimiz Apple ve Google'ı tanıyoruz, ancak bunlar gezegendeki en büyük yazılım işletmeleri, ancak aslında uygulamaları yazmıyorlar. Tüm bu organizasyonlarla tutarlı olan şey nedir? Veriler ve oraya ulaşmadılar çünkü verilerinin nerede olduğunu bilmiyorlardı ve bunları nasıl kataloglayabileceklerini bilmiyorlardı.

Şu anda bulduğumuz şey, veri olarak adlandırılan yepyeni bir varlık sınıfının olması ve şirketlerin buna uyanması. Ancak her zaman tüm bu verileri haritalamak, tüm bu verileri kataloglamak ve kullanılabilir hale getirmek için gerekli araçlara ve teknik bilgiye ve bu nedenle sahip olmuyorlar, ancak neredeyse hiç fiziksel varlığı olmayan şirketlerin yüksek piyasa değeri kazandıklarını tespit ettik. bu yeni veri varlığı sınıfı aracılığıyla zaman kaydedin. Söylediğim gibi, bazı eski oyuncular şimdi buna uyanıyor ve kesinlikle ortaya koyuyor.

Ben küçük bir yolculuğa halk almanın büyük bir hayranıyım, bu yüzden on sekiz yüz, on sekiz yüz geç, ve ABD pazarında buna aşina olacaksınız, bir sayım çalıştırmak için ortaya çıktı her yıl yaklaşık on yılda bir çalıştırdıklarını düşünüyorum, ancak her yıl bir nüfus sayımı yapacaksanız, veri analizini yapmak sekiz veya dokuz yıla kadar sürebilir. Veri kümesinin kağıttaki yerlerde kutularda kaldığı ortaya çıktı ve neredeyse hiç kimse bunu bulamadı. Bu raporları pompalamaya devam ettiler, ancak gerçek verilere ulaşmak çok zordu, 1940'larda İkinci Dünya Savaşı ile ilgili başka bir dünya anı ile benzer bir durumumuz var ve bu şey Bletchley Park Bombe BOMBE yazdı ve küçük veri kümelerinden geçip içindeki sinyalleri bulan ve Enigma'da kodları kırmaya yardımcı olmak için kullanılan devasa bir sayı-çatırgan analitik araçtır.

Bu şey, aslında, kataloglamak için çok fazla bir şey değil, verileri etiketlemek ve haritalamak ve kalıpları alıp veri kümelerinin içinde bulmayı mümkün kılmak için tasarlanmış bir cihazdı, bu durumda kodları kırın, anahtarları ve ifadeleri bulun ve bulun veri kümelerinde düzenli olarak kullanırız ve bu nedenle verilerdeki şeyleri bulma ve verileri kataloglamaya yönlendirme yolculuğuna çıktık.

Ve sonra bunlar ortaya çıktı, bu devasa düşük maliyetli makine rafları, hazır makineler. Çok ilginç şeyler yaptık ve onlarla yaptığımız şeylerden biri, gezegeni endekslemeye başlayabilecek çok düşük maliyetli kümeler ve çok ünlü olarak gelen ve giden bu büyük markaları inşa ettik, ancak muhtemelen Google'ın en yaygın evi Hepimizin duyduğu bir marka - bu gerçek bir fiil haline geldi ve markanız bir fiil olduğunda başarılı olduğunuzu biliyorsunuz. Ancak Google'ın, muhtemelen iş dünyasında, farkında olmadan bize öğrettiği şey, tüm gezegeni belirli bir seviyeye endeksleyebilmeleri ve dünyadaki verileri kataloglayabilmeleri ve çok kolay bir şekilde kullanılabilir hale getirebilmeleri, küçük bir tek satırlık formülde uygun form, üzerinde neredeyse hiçbir şey olmayan bir web sayfası ve sorgunuzu yazdığınızda, gezegeni zaten taradıklarından, dizine ekledikten ve kolayca kullanılabilir hale getirdiklerinden bulur ve bulur.

Fark ettiğimiz şey şu: “İyi durun, bunu kuruluşlarda yapmıyoruz - neden böyle? Neden tüm gezegeni haritalayıp indeksleyebilecek, tarayacak ve dizine ekleyebilecek ve kullanılabilir hale getirebilecek bir kuruluşumuz var, onu arayabiliriz ve sonra gidip bulmak için üzerine tıklayabiliriz, nasıl olur Bunu dahili olarak yapmadınız mı? ”Demek şimdi intranetler için bir şeyler yapan ve bir şeyler bulmak için dünya çapında bu küçük makine raflarının birçoğu var, ama hala sadece geleneksel ağın ötesine geçme fikriyle uğraşıyorlar. sayfası veya bir dosya sunucusu.

Şimdi bu yeni nesil veri kataloğuna birçok yolla girmek yerine, post-it notları ve su soğutucu konuşmaları yoluyla veri erişimini keşfetmek artık veri keşfi ve kataloglaması için uygun bir yöntem değil ve aslında bunu hiç düşünmüyorum gerçekten öyleydi. Artık bu meydan okumayı sadece notlar geçen, notlar yayınlayan ve onun hakkında sohbet eden insanlara yönlendiremeyiz. Veri kataloglamaya yeni nesil yaklaşımın gelip gittiği alanın çok ötesindeyiz. Kollarımızı onun etrafında tutmalıyız. Bu kolay bir sorun olsaydı, daha önce birçok yönden çözmüş olurduk, ancak bence bu kolay bir sorun değil, sadece verileri endekslemek ve çağırmak, verilerin içinde ne olduğunu ve keşfettiklerimizin etrafında meta veriler oluşturmak ve daha sonra, özellikle self servis ve analitik olmak üzere, kolay ve sarf edilebilir bir biçimde sunmak. Bu hala çözülmesi gereken bir problem, ancak beş yıl içinde bulmacanın birçok kısmı iyi ve gerçekten çözüldü ve mevcut.

Bildiğimiz gibi, insan kataloglama verileri başarısızlık için bir reçetedir çünkü insan hatası veri işlemede ele aldığımız en büyük kabuslardan biridir ve bence düzenli olarak kağıt formlarını dolduran insanlar muhtemelen en büyük kabustur. tarihler ve alanlar gibi basit şeylere bile yanlış biçimde yerleştiren insanlar için sürekli olarak yaptıkları şeyleri düzeltmek zorunda kalmak için büyük veri ve analitikle ilgileniyoruz.

Ama dediğim gibi, internet arama motorlarının her gün dünya endeksini gördük, bu yüzden şimdi keşif sürecinde iş veri setlerinde yapılabileceği fikrini yapıyoruz ve araçlar ve sistemler artık bugün öğrenmeye hazır olduğunuz için hazır. Yani hile, benim görüşüme göre, doğru araçları, iş için en iyi araçları seçmektir. Ve daha da önemlisi, bu yola başlamanıza yardımcı olacak doğru parçayı bulmak. Ve bugün bunu duyacağımıza inanıyorum, ama bunu yapmadan önce üniversitem Robin Bloor'a geçip konuyu ele alacağını duyacağım. Robin, sana geçebilir miyim?

Robin Bloor: Evet, kesinlikle yapabilirsiniz. Bakalım bu işe yarayıp yaramadığını, oh evet işe yarıyor. Tamam, Dez'den gerçekten farklı bir yönden geliyorum, ama aynı yerde olacağım. Bu verilere bağlanmakla ilgili, bu yüzden verilere bağlanma gerçekliğini gerçekten nokta noktadan geçireceğimi düşündüm.

Verilerin hiç olmadığı kadar parçalanmış bir gerçek var. Veri hacmi olağanüstü büyüyor, ancak gerçekte, farklı veri kaynakları da inanılmaz bir oranda büyüyor ve bu nedenle veriler sürekli olarak parçalanıyor. Ancak özellikle analitik uygulamalar nedeniyle - ancak bunlar sadece uygulamalar değil - tüm bu verilere bağlanmak için gerçekten iyi bir nedenimiz var, bu yüzden zor bir yerde sıkıştık, parçalanmış veri dünyasında sıkışıp kaldık, ve verilerde Dez'in yeni petrol dediği gibi bir fırsat var.

Veriler hakkında, dosya sistemlerinde veya veritabanlarında dönen diskte yaşıyordu. Şimdi çok daha çeşitli bir ortamda yaşıyor, dosya sistemlerinde yaşıyor ama günümüzde Hadoop örneklerinde, hatta Spark örneklerinde de yaşıyor. Birden çok veritabanı türünde yaşar. Çok uzun zaman önce, bir tür ilişkisel veritabanını standartlaştırdık, son beş yılda pencereden çıktığını biliyorsunuz, çünkü belge veritabanlarına ihtiyaç var ve grafik veritabanlarına ihtiyaç var, yani oyunun değişti. Bu yüzden dönen diskte yaşadı, ama şimdi SSD'de yaşıyor. En son SSD miktarı - kesinlikle en son SSD birimi Samsung'dan geliyor - yirmi gigabayt, bu çok büyük. Şimdi bellekte yaşıyor, verilerin asıl kopyasının diskten ziyade bellekte olabilmesi anlamında, böyle sistemler kurmaya alışkın değildik; şimdi yapıyoruz. Ve bulutta yaşıyor. Yani bu şeylerin herhangi birinde yaşayabilir, bulutta, bir bulutta nerede olduğunu bilmeyeceksiniz, sadece adresiniz olacak.

Hadoop şimdiye kadar genişlemek için genişletilebilir bir veri deposu olarak başarısız oldu. Genişletilebilir bir ölçeklendirilebilir veri deposu haline geleceğini umuyorduk ve bu her şey için sadece bir dosya sistemi olacaktı ve bu - gökkuşakları gökyüzünde görünecekti ve temelde tek boynuzlu atlar dans edecekti ve bunların hiçbiri olmadı. Bu, veri aktarımı sorunuyla sonuçlandığımız anlamına gelir ve bazen veri aktarımı için bir gereklilik yoktur, ancak aynı zamanda bir zorluktur. Veriler bugünlerde gerçekten yerçekimine sahip, çok terabaytlık bir veriye girdikten sonra, onu alıp attığınızda, ağınızda gecikmelerin ortaya çıkmasına veya çeşitli yerlerde görünmesine neden oluyor. Verileri taşımak istiyorsanız, zamanlama bir faktördür. Neredeyse her zaman, günümüzde, bir yerden, bir yerden bir yere ne kadar veri elde etmek için ne kadar zamanınız olduğu konusunda bazı sınırlamalar vardır. Eskiden toplu pencereler olarak düşündüğümüz şey vardı, makine boştayken ve ne kadar veriye sahip olursanız olun, onu fırlatabilirdiniz ve hepsi işe yarardı. Evet, çok daha gerçek zamanlı bir dünyada yaşıyoruz. Bu nedenle zamanlama bir faktördür. Verileri hareket ettirmek istediğiniz anda, bu nedenle verilerin yerçekimi varsa, muhtemelen taşıyamazsınız.

Veri yönetimi, tüm bu verileri gerçekten yönetmeniz gerektiği anlamında bir faktördür, ücretsiz olarak almazsınız ve gerçekte veriyi yapması gereken işi yapmak için almak için çoğaltma gerekli olabilir, çünkü koyduğunuz her yerde olmayabilir. Verilerin normal işlenmesi için yeterli kaynağa sahip olmayabilir. Böylece veriler çoğaltılır ve veriler hayal edebileceğinizden daha fazla çoğaltılır. Sanırım birisi bana uzun zaman önce ortalama veri parçasının en az iki buçuk kez çoğaltıldığını söyledi. ESB'ler veya Kafka veri akışı için bir seçenek sunar, ancak günümüzde mimari talep etmektedir. Günümüzde, verileri bir şekilde atmanın ne anlama geldiğini gerçekten şu ya da bu şekilde düşünmeniz gerekiyor. Bu nedenle, verilere olduğu yerde erişmek genellikle tercih edilir, tabii ki, gerçekten veri için gittiğinizde ihtiyacınız olan performansı elde edebilirsiniz ve bu bağlama bağlıdır. Zaten zor bir durum. Veri sorguları açısından, SQL açısından düşünebiliyorduk, şimdi gerçekten farklı sorgu türleri, SQL evet, ama bitişik, aynı zamanda grafik sorguları da ortaya çıktık, Spark sadece bir örnektir grafik yapmak, çünkü metin araması yapmamız gerekiyor, çünkü her zamankinden daha fazla, desenleri gerçekten karmaşık aramalar ve gerçek desen eşleşmesi olan regex aramalar da, tüm bunlar aslında köpürüyor. Ve hepsi faydalıdır çünkü aradığınızı alırlar veya aradığınızı alabilirler.

Sorgular artık günler birden çok veriye yayıldığından, her zaman bunu yapmadı ve bunu yaparsanız performans genellikle dehşet verici. Bu nedenle, koşullara bağlıdır, ancak insanlar birden fazla veri kaynağından veri sorgulayabilmeyi bekler, bu nedenle bir veya daha fazla veri federasyonu gittikçe daha güncel hale gelir. Performansa bağlı olarak bunu yapmanın farklı bir yolu olan veri sanallaştırma da çok yaygındır. Veri sorguları aslında tüm sürecin değil, sürecin bir parçasıdır. Sadece analitik performansına bakıyorsanız, gerçek analitiklerin veri toplamadan çok daha uzun sürebileceğini belirtmek gerekir, çünkü bu koşullara bağlıdır, ancak herhangi bir şey yapmak istiyorsanız veri sorguları mutlak bir gerekliliktir birden fazla veri kaynağında analitik olabilir ve gerçekten, gerçekten de yeteneklere sahip olmanız gerekir.

Kataloglar hakkında. Bir sebepten dolayı kataloglar var, en azından diyoruz ki, bilirsiniz, dizinlerimiz var ve veritabanlarında şemalarımız var ve her kataloğumuz var ve nereye giderseniz gidin bir yer bulacaksınız ve sonra aslında bir tür katalog olduğunu ve birleşik genel kataloğun bu kadar iyi bir fikir olduğunu göreceksiniz. Ancak çok az şirketin böyle bir şeyi var. Hatırlıyorum, iki bin yıl - iki bin panik - komünistlerin kaç tane yürütülebilir dosya olduğunu bile tespit edemediklerini hatırlıyorum, kaç farklı veri deposuna sahip olduklarını umursamıyorum ve muhtemelen şu an, bilirsiniz, çoğu şirket küresel anlamda, hangi verilere sahip olduklarını aktif olarak bilmez. Ancak, aslında küresel bir kataloğa sahip olmak veya en azından veri kaynaklarının büyümesi ve uygulamaların sürekli büyümesi nedeniyle neler olduğuna dair küresel bir tabloya sahip olmak giderek daha fazla gerekli hale geliyor ve özellikle analitik için gerekli, çünkü bir şekilde siz de ve burada köken ve verilerle ilgili sorunlar gibi başka sorunlar da var ve güvenlik için, veri yönetiminin birçok yönü var, eğer hangi verilere sahip olduğunuzu gerçekten bilmiyorsanız, fikir sadece saçma olduğunu yöneteceksiniz. Böylece, tüm veriler bir şekilde kataloglanır, sadece bir gerçektir. Soru, kataloğun tutarlı olup olmadığı ve aslında onunla ne yapabileceğinizdir. Bu yüzden Rebecca'ya geri döneceğim.

Rebecca Jozwiak: Tamam, teşekkürler Robin. Bir sonraki adımda Alation'dan David Crawford'u aldık, David Ben devam edip topu sana vereceğim ve sen de onu alabilirsin.

David Crawford: Çok teşekkür ederim. Beni bu şovda gösterdiğiniz için gerçekten minnettarım. Sanırım bunu başlatacağım, bu yüzden buradaki rolüm, bu teorinin bir kısmını almak ve gerçekte nasıl uygulandığını ve gerçek müşterilere yönlendirebildiğimiz sonuçları görmek ve böylece görebilirsiniz. bir kaç slaytta, analitik olası gelişmelerde hangi sonuçları görebileceğimizi konuşmak istiyorum. Tartışmayı motive etmek için, oraya nasıl ulaştıklarından bahsedeceğiz. Bu yüzden gerçekten çok akıllı insanlarla, bu müşterilerle yakından çalıştığım için şanslıyım ve sadece gerçekten ölçebilen ve bir veri kataloğunun analistlerini nasıl etkilediğinden bahsetmek istiyorum. iş akışı. Ve kısaca ön tarafta kalmak için, bence değişim gördüğümüz şeylerden biri, veri katalogları önceki aracılıklı çözümlerle ve ilişkilerin bir araya getirdiğimiz çözümler hakkında gerçekten düşündüğü yollardan biri ile analistlerden başlamaktır. ve geriye doğru çalışın. Diyelim ki bunu analistlerin verimliliğini sağlama konusunda yapalım. Sadece uyumun aksine veya sadece bir envantere sahip olmanın aksine, analistleri daha üretken hale getiren bir araç yapıyoruz.

Bu yüzden, finansal hizmetler şirketi Square'deki bir veri bilimcisi ile konuştuğumda, Nick'in bize nasıl olduğunu anlatan bir adam var, bir raporu başlatmak için doğru veri kümesini bulmak için birkaç saat alıyordu, şimdi yapabilir pazar payında aramayı kullanarak saniyeler içinde yapın, Square kullanan analistlerini çeken, affedersiniz, Alation'ı kullanarak, ne olduğunu, ne faydalarını gördüklerini öğrenmek için CTO'larıyla konuştuk ve 50 yüzde yüz verimlilik artışı ve dünyanın en büyük perakendecilerinden biri olan eBay'in, düzenli olarak SQL analizi yapan binden fazla insanı olduğu ve buradaki Deb Says ile çok yakın çalışıyorum. yöneticileri Alation'ı benimsediğinde, bir katalog benimsediğinde, veritabanına yeni sorgular yazma hızının iki katı olduğunu gördüler.

Yani bunlar gerçek sonuçlardır, bunlar aslında kataloğu kuruluşlarına uygularlar ve sizi kurmak için gerekenlere götürmek istiyorum. Bir katalogun bir şirkette nasıl kurulduğu ve belki de en önemli şey, bunun çoğunun otomatik olarak gerçekleşmesidir, bu nedenle Dez sistemler hakkında konuştu, sistemler hakkında bilgi aldı ve modern veri kataloğunun yaptığı da tam olarak bu. Böylece Alation'ı veri merkezlerine yükler ve veri ortamlarındaki çeşitli meta veri kaynaklarına bağlarlar. Biraz veritabanlarına ve BI araçlarına odaklanacağım - her ikisinden de temelde ne olduğu hakkında teknik meta veriler çıkaracağız. Doğru, hangi tablolar? Hangi raporlar? Rapor tanımları nelerdir? Böylece bu teknik meta verileri çıkarırlar ve bu sistemlerin içindeki her nesne için otomatik olarak bir katalog sayfası oluşturulurlar ve daha sonra bu teknik meta verilerin üzerine çıkarılır ve katmanlanırlar, kullanım verilerinin üzerine katmanlarlar. Bu öncelikle veritabanından sorgu günlüklerini okuyarak yapılır ve bu gerçekten ilginç bir bilgi kaynağıdır. Dolayısıyla, bir analist bir sorgu yazdığında, bir raporlama aracı, evde yetiştirilip büyütülmediği veya raftan çıkarılmadığı zaman, bir uygulama üzerinde işlem yapmak için veri eklemek üzere bir sorgu çalıştırdığında, bir raporlama aracının güncelleme için bir sorgu çalıştırıp çalıştırmadığı bir veri kümesi - bunların tümü veritabanı sorgu günlüklerinde yakalanır. Kataloğunuz olsun ya da olmasın, veritabanıyla birlikte sorgu günlüğünde yakalanırlar. Bir veri kataloğunun yapabilecekleri ve özellikle Alation kataloğunun yapabilecekleri bu günlükleri okumak, içlerindeki sorguları sormak ve bu günlüklere dayalı gerçekten ilginç bir kullanım grafiği oluşturmak ve gelecekteki kullanıcıları bilgilendirmek için bunu devreye sokuyoruz verilerin eski kullanıcılarının nasıl kullandığına ilişkin verilerin

Bu nedenle, tüm bu bilgileri bir katalogda bir araya getiriyoruz ve sadece bunu gerçeğe dönüştürmek için, bunlar zaten müşterilere dağıtılan entegrasyonlardır, bu nedenle Oracle, Teradata, Redshift, Vertica ve bir dizi diğer ilişkisel veritabanları. Hadoop dünyasında, Hadoop üzerinde bir dizi SQL, bir tür ilişkisel, Hadoop dosya sistemi, Impala, Tez, Presto ve Hive üzerinde meta mağazalar var, ayrıca Altiscale gibi bulut Hadoop özel sağlayıcılarıyla başarı gördük ve aynı zamanda Tableau sunucularına, MicroStrategy sunucularına bağlanabilir ve oradaki gösterge tablolarını indeksleyebilir ve Plotly gibi veri bilimi grafik araçlarıyla entegrasyon yapabilir.

Bu nedenle, tüm bu sistemlere bağlanıyoruz, bu sistemleri müşterilere bağladık, teknik meta verileri çektik, kullanım verilerini aldık ve veri kataloğunu otomatik olarak hazırladık, ancak bu şekilde bilgiyi merkezileştirir, ancak işleri bir veri kataloğunda merkezileştirmek, tek başına eBay, Square ve pazar payı ile bahsettiğimiz gerçekten harika verimlilik artışları sağlamaz. Bunu yapabilmek için analistlere bilgi aktarma konusundaki düşüncelerimizi değiştirmemiz gerekiyor. Buna hazırlanmak istedikleri sorulardan biri, “Katalog aslında bir analistin iş akışını nasıl etkiliyor?” İdi.

Bütün gün bunu düşünmek için harcadığımız şeydir ve düşünmedeki bu değişiklikten bahsetmek için, bir itme modelinin bir itme modelinden bahsetmek için, bir Kindle'da okumadan önce ve sonra dünyanın nasıl olduğuna hızlı bir benzetme yapmak istedim. Bu sadece bazılarınızın sahip olabileceği bir deneyim, fiziksel bir kitap okurken, bir kelimeyle karşılaşırsınız, kelimenin tanımını çok iyi bildiğinizden emin değilsiniz, belki de bağlamdan tahmin edebilirsiniz. Kanepeden kalkacak, kitap rafınıza yürüyecek, sözlüğünüzü bulacak, tozunu alacak ve kelimelerin alfabetik listesinde doğru yere dönecek, emin olmak için evet, bu tanımı doğru buldunuz ve biliyorsunuz nüansları. Yani gerçekten olmaz. Yani bir Kindle uygulaması satın alırsınız ve orada kitap okumaya başlarsınız ve tamamen emin olmadığınız bir kelimeyi görürsünüz ve kelimeye dokunursunuz. Aniden, aynı ekranda, kelimenin tüm nüansları, farklı örnek kullanımları ile birlikte sözlük tanımıdır ve biraz kaydırırsınız ve bu konuda bir Wikipedia makalesi alırsınız, tekrar kaydırırsınız, diğer dillere veya diğer dillere çevirebilecek bir çeviri aracı alırsınız ve aniden dil hakkındaki bilginiz çok daha zengindir ve gitmeniz gerektiğine kıyasla şaşırtıcı bir sayıda olur ve bu kaynağı kendiniz için çekin.

Ve tartışacağım şey, bir analistin iş akışının ve bir analistin veri dokümantasyonuyla nasıl başa çıkacağının aslında bir okuyucunun sözlükle nasıl etkileşime gireceğine, fiziksel bir Kindle, ve bu yüzden, bu verimlilik artışını gerçekten görme şeklimiz, kataloğu dökmüyor, ancak analistin iş akışına bağlamak ve benden burada bir demo yapmamı istediler ve ben istiyorum bu sunumun odağını yapmak için. Ama sadece demo için bağlam oluşturmak istiyorum. Veri bilgisini ihtiyaç duyduklarında kullanıcılara aktarmayı düşündüğümüzde, bunu yapmak için doğru yeri, zamanlarını harcadıkları yeri ve analizi yaptıkları yeri bir SQL sorgu aracı olduğunu düşünüyoruz. SQL sorgularını yazıp çalıştırdığınız bir yer. Ve böylece bir tane oluşturduk ve onu inşa ettik ve bu konuda diğer sorgu araçlarından gerçekten farklı olan şey, veri kataloğu ile derin entegrasyonu.

Bu yüzden sorgu aracımıza Alation Compose denir. Web tabanlı bir sorgu aracıdır ve bir saniye içinde size göstereceğim. Önceki slaytta gördüğünüz tüm veritabanı logolarında çalışan web tabanlı bir sorgu aracı. Özellikle demoyu deneyeceğim, katalog bilgilerinin kullanıcılara gelme şeklidir. Ve bunu bu üç farklı yolla yapar. Bunu müdahaleler yoluyla yapar ve burada veri düzenleyicisi, veri yöneticisi veya bir şekilde bir yönetici veya bir yönetici olan biri, “Bir not veya uyarı ile bir tür müdahale yapmak istiyorum. ve kullanıcılara doğru zamanda teslim edildiğinden emin olun. ”Bu bir müdahale ve bunu göstereceğiz.

Akıllı öneriler, aracın, yazarken sorgunun nesnelerini ve parçalarını önermek için tüm katalog bilgisini kullandığı bir yöntemdir. Orada bilmek en önemli şey gerçekten bunu yapmak, kullanıma dayalı şeyler önermek ve ayrıca daha önce yazılmış sorgu bölümlerini bile bulmak için sorgu günlüğü yararlanmaktır. Ve bunu göstereceğiz.

Ve sonra önizleme. Önizlemeler, bir nesne adını yazarken size kataloğun bildiği her şeyi veya en azından kataloğun o nesne hakkında bildikleri en alakalı şeyleri gösteririz. Bu yüzden, daha önce kullanmış olan veri örnekleri, o nesnenin mantıksal adı ve açıklaması, siz sormaya gerek kalmadan yazarken size gelir.

Daha fazla konuşmadan, demoya gideceğim ve sadece görünmesini bekleyeceğim. Burada size göstereceğim şey sorgu aracı. Özel bir SQL yazma arayüzü. Belli bir anlamda katalogdan ayrı bir arayüz. Dez ve Robin katalogdan bahsettiler ve ben doğrudan katalog arayüzünün üzerinden doğrudan iş akışına hizmet etmek için nasıl getirildiğine bakıyorum.

Burada sadece SQL yazabileceğim bir yer gösteriyorum ve en altta referansta bulunduğumuz nesneler hakkında bir takım bilgilerimiz olduğunu göreceksiniz. Bu yüzden sadece bir sorgu yazmaya başlayacağım ve bu müdahalelerden birine geldiğimde duracağım. Bu yüzden “select” yazacağım ve yılı istiyorum. İsmi istiyorum. Ve bazı maaş verilerine bakacağım. Yani bu bir eğitim veri seti. Yükseköğretim kurumları hakkında bilgi sahibi ve bu tablolardan birinde olan ortalama fakülte maaşına bakıyorum.

Bu yüzden aslında “maaş” kelimesini yazdım. Bu tam olarak sütun adına değil. Öneriler yapmak için hem mantıksal meta verileri hem de fiziksel meta verileri kullanırız. Burada belirtmek istediğim, burada görünen bu sarı kutu. Bu sütunda bir uyarı olduğunu söylüyor. Bunu aramaya gitmedim, bu verilerin düzgün şekilde nasıl kullanılacağı konusunda bir ders almadım. Bana geldi ve bu verilerle ilgili bir gizlilik anlaşması hakkında bir uyarı oluyor. Bazı açıklama kuralları var. Bu verileri sorgulayacaksam, bu tablodan veri alacağım, nasıl ifşa ettiğim konusunda dikkatli olmalıyım. Yani burada bir yönetişim politikanız var. Verilere baktığımda bunu bildiğimde bu politikaya uymayı çok daha kolaylaştıran bazı uyumluluk zorlukları var.

Bu yüzden bana geliyor, sonra da derse bakacağım. Ve burada önizlemelerin devreye girdiğini görüyoruz. Bu öğrenim sütununda, görüyorum - kurum tablosunda bir öğrenim sütunu var ve bunun bir profilini görüyorum. Alation gidiyor ve tablolardan örnek veri alıyor ve bu durumda, bana oldukça ilginç bir şey gösteriyor. Bana değerlerin dağılımını gösteriyor ve bana sıfır değerinin numunede 45 kat ve diğer değerlerden daha fazla olduğunu gösterdi. Bazı veriler eksik olabileceğine dair bir fikrim var.

Gelişmiş bir analistim, bu zaten iş akışımın bir parçası olabilir. Özellikle de titiz biriysem, önceden vaktinde bir sürü profil sorgusu yaparım. Ne zaman yeni bir veri parçasına yaklaşsam, veri kapsamımızın ne olduğunu hep düşünüyorum. Ancak veri analizinde yeniysem, bu veri kümesinde yeniysem, bir sütun varsa, her zaman doldurulduğunu varsayabilirim. Ya da, doldurulmadığı takdirde sıfır olmadığını, boş olduğunu veya bunun gibi bir şey olduğunu varsayabilirim. Ancak bu durumda, çok fazla sıfırımız var ve eğer bir ortalama yapsaydım, muhtemelen yanlış olurlar, eğer bu sıfırların veri eksik yerine aslında sıfır olduğunu varsayarsam.

Ancak Alation, bu önizlemeyi iş akışınıza getirerek, sizden bu bilgilere bir göz atmanızı ister ve hatta yeni başlayan analistlere bile burada bu veriler hakkında fark edilecek bir şey olduğunu görme şansı verir. Yani bu önizlemeye sahibiz.

Yapacağım bir sonraki şey, bu bilgileri almak için hangi tabloları bulmaya çalışacağım. Burada akıllı önerileri görüyoruz. Her zaman gidiyor, ama özellikle burada, ben bile bir şey yazmadım ama bana bu sorgu için hangi tabloları kullanmak isteyebilirsiniz önerecektir. Ve bunun hakkında bilinmesi gereken en önemli şey, kullanım istatistiklerinden yararlanmasıdır. Yani, örneğin, eBay gibi, tek bir veritabanında yüz binlerce masanın bulunduğu, buğdayı samandan vurabilecek bir araca sahip olan ve bu kullanım istatistiklerini kullanan bir ortamda, bunları yapmak için gerçekten önemlidir. bir şey değerinde öneriler.

Yani bu tabloyu önerecek. Önizlemeye baktığımda, aslında sorgumda bahsettiğim üç sütunu vurguladık. Bu yüzden üç tane olduğunu biliyorum, ama adı yok. İsmi almam gerek, bu yüzden bir katılma yapacağım. Katıldığımda, şimdi tekrar bulmama yardımcı olacak bu önizlemeler var, ismin bulunduğu tablo nerede. Görüyorum ki bu güzel biçimlendirilmiş, uygun şekilde büyük harfle yazılmış bir isme sahip. Her kurum için bir isme sahip bir satır var gibi görünüyor, bu yüzden bunu alacağım ve şimdi bir katılma koşuluna ihtiyacım var.

Ve böylece, Alation'ın yaptığı şey, sorgu günlüklerine tekrar bakmak, bu iki tablonun daha önce katıldığını görmek ve onlara katılmanın farklı yollarını önermek. Bir kez daha, bazı müdahaleler var. Bunlardan birine bakarsam, bunun sadece toplu analiz için kullanılması gerektiğini gösteren bir uyarı var. Kurum aracılığıyla kurum tarafından bir şeyler yapmaya çalışıyorsanız, muhtemelen yanlış bir şey üretecektir. Buna karşın, üniversite düzeyinde veri istiyorsanız, OPE Kimliği ile bu iki tabloya katılmanın doğru yolu olarak kabul edilir. Yani bunu yapıyorum ve kısa bir sorgu, ama gerçekten ne veri hakkında herhangi bir fikir olmadan sorgumu yazdım. Asla bu veri setinin ER diyagramına bakmadım, ancak ilgili veriler bana geldiğinden zaten bu veriler hakkında çok şey biliyorum.

Bunlar, bir kataloğun, entegre bir sorgu aracıyla, sorguları yazarken iş akışını doğrudan etkilemesinin üç yolu. Ama bir katalog ile entegre bir sorgu aracı sahip olmanın diğer faydalarından biri, sorgumu bitirdiğimde ve kaydettiğimde, “Kurum Öğrenim ve Fakülte Maaşı” gibi bir başlık koyabiliyorum ve sonra burada bir düğme var sadece kataloğa yayınlamama izin veriyor. Bunu geri beslemek benim için çok kolay. Yayınlamasam bile, sorgu günlüğünün bir parçası olarak yakalanıyor, ancak yayınladığımda, aslında tüm veri bilgilerinin yaşandığı merkezi yerin bir parçası oluyor.

Bu yüzden Alation'daki tüm sorguları ara'yı tıklarsam, alınacağım - ve burada katalog arayüzünden biraz daha fazlasını göreceksiniz - Bana sorguları bulmanın bir yolunu gösteren özel bir sorgu aramasına yönlendirildim tüm organizasyon. Ve yeni yayınlanan sorgumun en üstte olduğunu görüyorsunuz. Ve bazılarını burada fark edebiliriz, sorguları yakalarken yazarları da yakalarız ve bir yazar olarak benimle şu an hakkında bir şeyler bildiğim bu veri nesneleri arasında bir ilişki kurarız. Ve bu sorgu ve bu veri nesneleri üzerinde uzman olarak kuruluyorum. Bu, insanların veri hakkında bilgi edinmesi gerektiğinde gerçekten yararlıdır, o zaman gitmek için doğru kişiyi bulabilirler. Ve eğer veri konusunda gerçekten yeniysem, gelişmiş bir analist olsam da - gelişmiş bir analist olarak, buna bakabilir ve yeni bir veri setinde başlatılmamı sağlayacak birkaç örnek görebilirim. SQL ile süper anlayışlı olmayabilecek biri olarak, yararlanabileceğim raporlar olan önceden hazırlanmış sorgular bulabilirim.

İşte Phil Mazanett tarafından medyan SAT puanları hakkında. Buna tıklayın ve sorgunun kendisi için bir katalog sayfası aldım. Bu sorguyu referans alan bir makaleden bahsediyor, bu yüzden nasıl kullanılacağını öğrenmek istersem okumam gereken bazı belgeler var. Ve Oluştur düğmesini tıklatarak sorgu aracında açabilirim ve burada düzenlemeden bile kendim çalıştırabilirim. Ve aslında, bir sorgu yazarken, böyle bir şablon değişkenine düşebileceğiniz ve sorgu tabanlı bir yürütme formu oluşturmak için basit bir yol oluşturan hafif raporlama yeteneklerimizden biraz birkaç parametre.

Demo için sahip olduğum şey bu. Slaytlara geri döneceğim. Özetlemek gerekirse, bir yöneticinin, bir veri düzenleyicisinin, sorgu aracında gösterilen nesnelere uyarı koyarak nasıl müdahale edebileceğini, Alation'ın akıllı öneriler yapmak için veri nesnelerinin kullanımı hakkındaki bilgisini nasıl kullandığını, nasıl getirdiğini gösterdik belirli nesnelere dokunurken analistlerin iş akışlarını iyileştirmek için profil oluşturma ve diğer ipuçlarında ve yeni sorgular yazıldığında bu tür yayınların kataloğa nasıl geri beslendiği.

Açıkçası şirket adına bir sözcüyüm. Veri katalogları hakkında güzel şeyler söyleyeceğim. Doğrudan müşterilerimizden birinden duymak istiyorsanız, Safeway'deki Kristie Allen bir analist ekibi çalıştırıyor ve bir pazarlama deneyi sunmak için saati gerçekten yenmesi gereken bir zaman ve tümünün ekibi işbirliği yapmak ve bu projede gerçekten hızlı bir şekilde geri dönmek için Alation'ı kullandı. Bu hikayeyi kontrol etmek için bu bit.ly bağlantısını takip edebilirsiniz veya Alation'ın kuruluşunuza bir veri kataloğunu nasıl getirebileceği hakkında biraz bilgi almak istiyorsanız, kişiselleştirilmiş bir demo oluşturmaktan mutluluk duyarız. Çok teşekkürler.

Rebecca Jozwiak: Çok teşekkürler David. Eminim ki Dez ve Robin'in kitle soru-cevaplarına dönmeden önce birkaç sorusu var. Dez, önce gitmek ister misin?

Dez Blanchfield: Kesinlikle. Yayınlanmış sorgular kavramını ve bunu yazarın kaynağına bağlamayı seviyorum. Bu uygulama içi uygulama mağazası fikrinin uzun zamandır şampiyonuyum ve bunun üzerine inşa etmek için gerçekten harika bir temel olduğunu düşünüyorum.

Bunu yaparken gördüğünüz bazı organizasyonlar ve sadece verileri keşfetmek için araç ve platformunuzu kullanmakla kalmayıp tüm bu yolculukta sahip olabilecek başarı öykülerinden bazılarını anlamaya başladım. daha sonra iç kültürel ve davranışsal özelliklerini değiştirirler. Şimdi sadece indirebileceğiniz bu tür bir şirket içi uygulama mağazasına sahip olmak, sadece bulabildikleri kavram değil, aslında bu bilginin koruyucularla küçük topluluklar geliştirmeye başlayabilirler.

David Crawford: Evet, sanırım şaşırdık. Hem Adtech'te bir ürün yöneticisi olarak geçmişimden hem de konuştuğumuz tüm müşterilerden sorgu paylaşmanın değerine inanıyoruz, ancak yine de müşterilerin ilk şeylerden ne kadar sık ​​olduğuna şaşırdım Alation'dan aldıkları değer olarak konuşun.

Invoice2go adlı müşterilerimizden birinde sorgu aracının bazı kullanıcı testlerini yapıyordum ve nispeten yeni bir ürün yöneticisine sahiptiler ve dediler - aslında bana, kullanıcı testi sırasında sorulmamış, Alation tarafından kolay hale getirilmesi dışında SQL yazmak. ”Ve elbette, PM olarak, “ Ne demek istiyorsun, bunu nasıl yaptık? ”dedim ve“ Eh, gerçekten sadece çünkü giriş yapabiliyorum ve bu mevcut sorguların tümünü görebiliyorum. ”SQL ile boş bir sayfala başlamak inanılmaz derecede zor bir şeydir, ancak ortaya çıkan sonucu görebileceğiniz ve söyleyebileceğiniz mevcut bir sorguyu değiştirmek, “Ah, sadece bu ekstra sütuna ihtiyacım var” ya da “Belirli bir tarih aralığına filtrelemem gerekiyor, ” bu çok daha kolay bir şey.

Ürün yöneticileri, belki de satış operasyonlarında çalışanlar, toplamaya başlayan ve her zaman SQL öğrenmek ve bu kataloğu kullanarak almaya başlayanlar gibi bu yardımcı rolleri gördük. Ayrıca birçok şirketin bir çeşit açık kaynak yapmaya çalıştığını gördük. Bu tür şeyleri dahili olarak oluşturmaya çalıştım, burada sorguları izlediler ve kullanılabilir hale getirdiler ve bunları kullanışlı hale getirmek için gerçekten zor tasarım zorlukları var. Facebook, HiPal adını verdikleri, Hive üzerinde yazılan tüm sorguları yakalayan bir iç araca sahipti, ancak öğrendiğiniz şey, kullanıcıları doğru şekilde dürtmezseniz, sadece bir seçme ifadelerinin çok uzun bir listesi. Ve bir sorgunun benim için yararlı olup olmadığını veya iyi olup olmadığını anlamaya çalışan bir kullanıcı olarak, sadece seçili ifadelerin uzun bir listesine baktığımda, orada bir şeyden daha değerli bir şey elde etmem çok daha uzun sürecek en baştan başlamak. Doğru şeyleri öne çıkaran ve yararlı bir şekilde sunan bir sorgu kataloğunun nasıl hazırlanacağını dikkatlice düşündük.

Dez Blanchfield: Sanırım hepimiz bu yolculuğa çok genç yaşlardan yetişkinliğe, birçok yönden geçiyoruz. Bir grup teknoloji. Şahsen ben, kodu kesmeyi öğrenmek gibi aynı gerçek şeyden geçtim. Dergi ve daha sonra kitaplardan geçirdim ve belli bir seviyeye kadar çalışacağım, sonra gitmem ve üzerinde biraz daha eğitim ve öğretim almam gerekiyordu.

Ama farkında olmadan, kendime ders verip dergi okurken, kitap okurken ve diğer insanların programlarını keserken ve üzerinde derslere giderken bile, sadece diğerleriyle konuştuğum gibi dersleri de öğrenmeye başladığım zaman bile buldum. deneyimleri olan insanlar. Ve bence, bunu veri analitiklerine getirdiğinize göre, temelde aynı paralel, insanların her zaman oldukça akıllı olduğunu görüyoruz.

Anlamaya gerçekten hevesli olduğum diğer bir şey, çok yüksek bir düzeyde, birçok kuruluşun “O noktaya gelmesi ne kadar sürüyor?” Diye soracağıdır. platformunuz kuruldu ve araç türlerini keşfetmeye mi başladılar? İnsanlar ne kadar çabuk görüyorlar ki, bu şeyin artık ROI konusunda endişe bile etmediklerini fark ettikleri için gerçekten acil bir “a-ha” anına dönüşüyorlar çünkü şimdi iş yapma biçimlerini değiştiriyorlar ? Kayıp bir sanat keşfettiler ve onunla gerçekten çok eğlenceli bir şeyler yapabileceklerini umuyorlar.

David Crawford: Evet, ona biraz dokunabilirim. Yüklediğimizde, güzel şeylerden birinin, insanların doğrudan veri sistemlerine bağlı bir katalog hakkında sevdikleri şeylerden birinin, onu doldurmanız gereken yere boş başlamamanız olduğunu düşünüyorum. sayfa sayfa. Bu, boş bir araçla başlayacağınız ve belgelemek istediğiniz her şey için bir sayfa oluşturmaya başlayacağınız önceki veri çözümleri için de geçerlidir.

Meta verileri çıkararak çok fazla şeyi otomatik olarak belgelediğimiz için, esasen yazılımın kurulmasından sonraki birkaç gün içinde, araçta en az yüzde 80'i olan veri ortamınızın resmine sahip olabilirsiniz. Ve sonra insanlar araçla sorgu yazmaya başlar başlamaz otomatik olarak kataloğa geri kaydedilirler ve böylece görünmeye başlarlar.

Bunu belirtmek için aşırı hevesli olmak istemiyorum. Bence iki hafta bir aya kadar oldukça iyi bir muhafazakar tahmin. İki haftadan bir aya kadar, gerçekten geri dönmenin ve değer kazanıyormuş gibi hissetmenin muhafazakar tahmini, bazı bilgileri paylaşmaya ve oraya gidip verileriniz hakkında bir şeyler öğrenmeye başlamış gibi.

Dez Blanchfield: Gerçekten düşündüğünüzde oldukça şaşırtıcı. Etkili bir şekilde dizine eklediğiniz ve katalogladığınız bazı büyük veri platformlarının uygulanması ve uygulanması ve düzgün bir şekilde ayağa kalkması bazen yıllarca sürebilir.

Robin Bloor'a teslim olmadan önce sana gelen son soru konektörler. Bana hemen atlayan şeylerden biri, tüm bu meydan okumayı çözdüğünüzdür. Yani gerçekten hızlı bir şekilde birkaç soru var. Birincisi, konektörler ne kadar hızlı uygulanır? Açıkçası, Oracles ve Teradatas ve benzeri ve DB2'ler gibi en büyük platformla başlıyorsunuz. Ancak yeni konektörlerin ne kadar düzenli olduğunu görüyorsunuz ve ne kadar zaman alıyorlar? Onlar için standart bir çerçeveniz olduğunu düşünüyorum. Ve ne kadar derine iniyorsun? Örneğin, dünyanın Oracles ve IBM'leri ve hatta Tereadata ve daha sonra geç açık kaynaklı platformların daha popüler olanları. Doğrudan sizinle mi çalışıyorlar? Kendiniz keşfediyor musunuz? Bu platformlarda içeriden bilgi sahibi olmak zorunda mısınız?

Bir konektör geliştirmek nasıl bir şey gibi görünüyor ve bu konektörlerin muhtemelen yapabileceğiniz her şeyi keşfetmesini sağlamak için bu ortaklıklara ne kadar derinden dahil oluyorsunuz?

David Crawford: Evet, elbette, bu harika bir soru. Çoğunlukla konektörleri geliştirebileceğimizi düşünüyorum. Biz kesinlikle genç bir başlangıç ​​ve hiçbir müşteri vardı yaptı. Bağlantıları kesinlikle dahili erişime ihtiyaç duymadan geliştirebiliriz. Kamuya açık olmayan ve çoğu zaman içeriden herhangi bir bilgiye ihtiyaç duymadan veri sistemlerine asla özel erişim sağlayamıyoruz. Veri sistemlerinin kendileri tarafından sunulan meta veri hizmetlerinden yararlanıyoruz. Genellikle bunlar oldukça karmaşık ve çalışmak zor olabilir. Özellikle SQL Server'ı sorgu günlüğünü yönetme biçimini biliyorum, birkaç farklı yapılandırma var ve gerçekten çalışmanız gereken bir şey var. Düzgün bir şekilde kurmak için nüansları, düğmeleri ve kadranları anlamalısınız ve bu daha önce birkaç kez yaptığımızdan beri müşterilerle üzerinde çalıştığımız bir şey.

Ancak, belirli bir dereceye kadar, kullanılabilir olan genel API'ler veya kaldıraç ettiğimiz herkese açık arabirimlerdir. Bu şirketlerden birkaçı ile ortaklığımız var, bu çoğunlukla sertifikasyon için bir zemin oluşturuyor, böylece çalıştığımızı söylerken rahat hissediyorlar ve ayrıca bize test için kaynaklar sağlayabilirler, bazen erken erişimden emin olmak için çıkan bir platforma erişebilirler. yeni sürümler üzerinde çalışıyoruz.

Yeni bir bağlantıyı tersine çevirmek için, yine muhafazakar olmaya çalışarak, altı haftadan iki aya kadar söyleyebilirim. Ne kadar benzer olduğuna bağlı. Postgre'nin bazıları Redshift'e çok benziyor. Redshift ve Vertica ayrıntılarının çoğunu paylaşır. Böylece bunlardan faydalanabiliriz. Ama evet, altı haftadan iki aya kadar adil olur.

API'larımız da var, bu yüzden - Alation'ı bir meta veri platformu olarak da düşünüyoruz, bu yüzden bize ulaşmak ve otomatik olarak kapmak için bir şey yoksa, bağlayıcıyı kendiniz yazmanın ve sistemimize itmenin yolları vardır. her şey hala tek bir arama motorunda merkezileşir.

Dez Blanchfield: Harika. Bunu takdir ediyorum. Bu yüzden Robin'e teslim edeceğiz, çünkü eminim ki bir sürü sorusu da var. Robin?

Rebecca Jozwiak: Robin sessiz olabilir.

Dez Blanchfield: Kendinizi sessize aldınız.

Robin Bloor: Evet, doğru. Üzgünüm, kendimi susturdum. Bunu uyguladığınızda süreç nedir? Merak ediyorum, çünkü birçok yerde çok fazla veri olabilir. Peki bu nasıl çalışıyor?

David Crawford: Evet, tabi. İçeri giriyoruz, ilk olarak sunucumuzun sağlanmasını sağlamak, ağ bağlantılarının kullanılabilir olmasını sağlamak, bağlantı noktalarının açık olması ve sistemlere gerçekten erişebilmemiz için bir BT süreci. Çoğu zaman hangi sistemlerle başlamak istediklerini bilirler. Bir veri sisteminin içini bilmek, ki bu da bazen onlara yardımcı olacağız. Bir sistemde kimlerin neyi ve kaç kullanıcının kullandığını anlamak için sorgu günlüklerine ilk bakışta bakmalarına yardımcı olacağız. Bu yüzden nerede olduğunu bulmaya yardımcı olacağız - sık sık, veritabanlarına giriş yapan yüzlerce veya binlerce insan varsa, nerede oturum açtıklarını bilmiyorlar, bu yüzden sorgu, bir ay içinde gerçekten giriş yaptığınız ve burada sorgu yürüten kaç benzersiz kullanıcı hesabınız olduğunu günlüğe kaydeder.

Bu yüzden bundan yararlanabiliriz, ancak çoğu zaman sadece en önemlilerinde. Onları hazırlıyoruz ve sonra "Öncelik verelim" demenin bir süreci var. Paralel olarak yapılabilecek bir dizi etkinlik var. Sorgu aracını kullanmak için eğitime odaklanacağım. İnsanlar sorgu aracını kullanmaya başladığında, her şeyden önce, birçok insan, tüm farklı sistemleri için tek bir arayüz olduğu gerçeğini sever. Ayrıca web tabanlı olduğu gerçeğini de seviyorlar, istemiyorlarsa herhangi bir kurulum içermiyorlar. Güvenlik açısından bakıldığında, bir tür IT BT ağı ile üretim veri kaynaklarının yaşadığı veri merkezi arasında, bir ağ açısından, bir tür tek bir giriş noktasına sahip olmayı severler. Böylece, Alation'ı bir sorgu aracı olarak kuracak ve Compose'u tüm bu sistemler için bir erişim noktası olarak kullanmaya başlayacaklar.

Bu gerçekleştiğinde, eğitime odaklandığımız şey, web tabanlı veya sunucu tabanlı bir sorgu aracı ile masaüstünüzde sahip olduğunuz araç arasındaki bazı farkların ve bazı kullanım nüanslarının ne olduğunu anlamaktır. söyledi. Aynı zamanda yapmaya çalışacağımız şey, yine sorgu günlüğü bilgisinden faydalanarak en değerli verileri tanımlamak ve “Hey, içeri girip insanların bunları anlamasına yardımcı olmak isteyebilirsiniz. Bu tablolarda temsili sorgular yayınlamaya başlayalım. ”Bazen insanları çabucak konuşturmanın en etkili yolu budur. Kendi sorgu geçmişinize bakalım, ilk sorgu olarak görünmeleri için bunları yayınlayalım. Kullanıcılar bir tablo sayfasına baktıklarında, o tabloya dokunan tüm sorguları görebilir ve oradan başlayabilirler. Ve sonra, bu nesneleri bulmaları ve aramaları daha kolay olacak şekilde başlıkları ve açıklamaları eklemeye başlayalım, böylece nasıl kullanılacağına dair bazı nüansları biliyorsunuz.

Köken oluşturabilmemiz için sorgu günlüğüne kapsamlı bir şekilde baktığımızdan emin oluruz. Yaptığımız şeylerden biri, verilerin bir tablodan diğerine taşındığı zaman sorgu günlüğüne bakmak ve bu, bir veri tablosu hakkında en sık sorulan sorulardan birini belirlememizi sağlayan, bu nereden geldi? Nasıl güvenirim? Ve böylece gösterebileceğimiz sadece hangi tablolardan geldiğini değil, aynı zamanda yol boyunca nasıl dönüştürüldüğünü de gösteriyor. Yine, bu bir tür sorgu günlüğü tarafından desteklenmektedir.

Bu nedenle, bu şeylerin ayarlandığından ve sisteme köken aldığımızdan emin oluyoruz ve tablo sayfalarında kurulabileceğimiz en yüksek değerli ve en yüksek kaldıraçlı meta veri parçalarını hedefliyoruz, böylece aradığınızda yararlı bir şey bulursunuz.

Robin Bloor: Tamam. Diğer soru - seyirciden çok fazla soru var, bu yüzden burada çok fazla zaman almak istemiyorum - akla gelen diğer soru, sadece acı noktaları. Birçok yazılım satın alındı ​​çünkü insanlar şu ya da bu şekilde bir şeyle zorlanıyorlar. Peki insanları Alation'a götüren ortak acı noktası nedir?

David Crawford: Evet. Sanırım birkaç tane var, ama bence oldukça sık duyduğumuz kişilerden biri analist oluyor. “Yakın vadede bu verilerden yeni anlayışlar üretmek zorunda kalacak 10, 20, 30 kişiyi işe almam gerekecek, nasıl hızlanacaklar?” Yani analist işe alım bizim kesinlikle bir şey ele almak. Üst düzey analistleri tüm zamanlarını verilerle ilgili diğer insanlardan gelen soruları cevaplamak için harcamaktan kurtarıyor. Bu da çok sık. Ve her ikisi de aslında eğitim sorunudur.

Ve sonra, Alation'ı benimseyen insanların gördüğümüz başka bir yer olduğunu söyleyebilirim, birinin çalışmak için yepyeni bir veri ortamı oluşturmak istedikleri zamandır. İnsanların yararlanabilmesi için bunu dahili olarak tanıtmak ve pazarlamak isterler. Daha sonra Alation'ı bu yeni analitik ortamın ön ucu yapmak çok cazip. Dokümantasyon var, sistemlere tek bir giriş noktası var - sistemlere tek bir erişim noktası var ve bu yüzden insanların bize geleceği başka bir yer.

Robin Bloor: Tamam, seni Rebecca'ya ileteceğim çünkü seyirci sana ulaşmaya çalışıyor.

Rebecca Jozwiak: Evet, burada çok iyi seyirci sorularımız var. Ve David, bu özellikle sana poz verdi. Görünüşe göre insanlarla sorguları kötüye kullanma konusunda biraz deneyime sahip olan birinden ve kullanıcılara ne kadar güç verirsek, bilgi işlem kaynaklarının sorumlu kullanımını yönetmenin daha zor olduğunu söylüyor. Yanlış yönlendirilmiş ancak yaygın sorgu ifadelerinin yayılmasına karşı savunabilir misiniz?

David Crawford: Evet, bu soruyu görüyorum. Harika bir soru - oldukça sık aldığımız bir soru. Acıyı kendimi, kullanıcıları eğitmeniz gereken önceki şirketlerde gördüm. Örneğin, “Bu bir günlük tablosu, yıllarca geriye giden günlükleri var. Bu tabloya bir sorgu yazacaksanız, gerçekten tarihe göre sınırlamanız gerekir. ”Yani, örneğin, veritabanına erişime izin verilmeden önce önceki bir şirkette yaşadığım bir eğitim.

Bunu ele almaya çalıştığımız birkaç yol var. Sorgu günlüğü verilerinin bunu ele almak için gerçekten benzersiz olduğunu düşünüyorum. Veritabanının sorgu planlayıcısıyla dahili olarak yaptıklarına karşı başka bir fikir verir. Ve yaptığımız şey, bu müdahalelerden biri - gösterdiğim manuel müdahalelerimiz var ve bu faydalı, değil mi? Örneğin, belirli bir birleşimde, "Bunu reddedelim" diyebilirsiniz. Akıllı önerilerde göründüğünde büyük bir kırmızı bayrak olacaktır. Yani bu insanlara ulaşmanın bir yolu.

Yaptığımız başka bir şey de, yürütme zamanı müdahalelerinde otomatikleştirilmesi. Görmek için çalıştırmadan önce aslında sorgunun ayrıştırma ağacını kullanır, belirli bir filtre veya orada yaptığımız birkaç şey daha içerir. Ama en değerli ve açıklanması en kolay olanı, bir filtre içeriyor mu? Bu nedenle, yeni vermiş olduğum örnekte olduğu gibi, bu günlük tablosu, sorgulayacaksanız, bir tarih aralığına sahip olmanız gerekiyorsa, tablo sayfasında o tarih aralığı filtresinin uygulanmasını zorunlu kıldığını belirtebilirsiniz. Birisi bu filtreyi içermeyen bir sorgu çalıştırmayı denerse, büyük bir uyarı ile onları durduracak ve “Muhtemelen sorgunuza böyle görünen bir SQL eklemelisiniz” diyecektir. isterler. Aslında onları kullanmasını tamamen yasaklamayacağız - bu da bir sorgu, günün sonunda sorgular çalıştırması gerekiyor. Ancak önlerine oldukça büyük bir engel koyduk ve onlara bir öneri, performanslarını iyileştirmek için sorguyu değiştirmek için somut uygulanabilir bir öneri veriyoruz.

Bunu aslında bazı durumlarda yine sorgu günlüğünü gözlemleyerek otomatik olarak yapıyoruz. Bu tablodaki sorguların gerçekten büyük bir yüzdesinin belirli bir filtreden veya belirli bir birleştirme yan tümcesinden yararlandığını görürsek, aslında bunu açacağız. Bunu bir müdahaleye teşvik edeceğiz. Aslında iç veri setinde başıma geldi. Müşteri verilerimiz var ve kullanıcı kimliklerimiz var, ancak kullanıcı kimliği ayarlandı, çünkü bir çeşit - her müşterinin kullanıcı kimlikleri var. Benzersiz değil, bu yüzden benzersiz bir birleştirme anahtarı almak için bir istemci kimliğiyle eşleştirmeniz gerekir. Bir sorgu yazıyordum ve bir şeyi analiz etmeye çalıştım ve ortaya çıktı ve “Hey, herkes bu tablolara hem istemci kimliği hem de kullanıcı kimliği ile katılıyor gibi görünüyor. Bunu yapmak istemediğinizden emin misiniz? ”Ve aslında bazı yanlış analizler yapmamı engelledi. Bu nedenle hem analizin doğruluğu hem de performans için çalışır. Yani bu sorunu böyle ele alıyoruz.

Rebecca Jozwiak: Bana etkili gibi geliyor. İnsanların kaynakları sarsmasını kesinlikle engellemeyeceğinizi söylediniz, ancak onlara yaptıklarının en iyisi olmayabileceğini öğretin, değil mi?

David Crawford: Kullanıcıların her zaman kötü niyetli olmadığını varsayıyoruz - onlara en iyi niyetleri veriyoruz - ve bu şekilde oldukça açık olmaya çalışıyoruz.

Rebecca Jozwiak: Tamam. Başka bir soru daha var: “Çözümünüz gibi bir katalog yöneticisi ile bir MDM aracı arasındaki fark nedir? Veya sorgu tablolarının seçimini genişleterek aslında farklı bir prensibe dayanıyor, oysa MDM bunu otomatik olarak yapacaktı, ancak aynı temel meta veri toplama prensibi ile. "

David Crawford: Evet, bence geleneksel MDM çözümlerine baktığımda birincil fark felsefi bir çözüm. Her şey kullanıcının kim olduğu ile ilgili. Sunumumun başında söylediğim gibi, Alation, bence, kurulduğumuzda, analistlerin daha fazla içgörü üretmelerini, daha hızlı üretmelerini, içgörülerde daha doğru olmalarını sağlamak amacıyla kuruldu. üretmek. Bunun geleneksel bir MDM çözümünün hedefi olduğunu düşünmüyorum. Bu çözümler, SCC'ye veya başka bir denetim amacı için dahili olarak hangi verilerin elde edildiğine dair raporlar üretmesi gereken kişilere yönelik olma eğilimindedir. Bazen analistleri etkinleştirebilir, ancak daha sıklıkla, bir uygulayıcıyı işlerinde etkinleştirecekse, DBA gibi bir veri mimarını etkinleştirmesi daha olasıdır.

Bir analistin bakış açısından işleri düşündüğünüzde, o zaman bir MDM aracının asla yapmayacağı bir sorgu aracı oluşturmaya başlarsınız. İşte o zaman performansın yanı sıra doğruluk hakkında düşünmeye ve verilerin iş gereksinimimle ilgili ne olduğunu anlamaya başlarsınız. Tüm bunlar aracı tasarlarken aklımızda bir çeşit pop. Arama algoritmalarımıza girer, katalog sayfalarının düzenine ve kuruluşun her yerinden bilgiye katkıda bulunma yeteneğine gider. Biz sorgu aracı inşa ve biz doğrudan içine katalog inşa gerçeği gider, bu yüzden gerçekten ondan geliyor düşünüyorum. Aklınızda ilk olarak hangi kullanıcı var?

Rebecca Jozwiak: Tamam, güzel. Bu gerçekten açıklamaya yardımcı oldu. ayrılmak zorunda kaldığı için arşivleri tutmak için can atıyordu, ama gerçekten sorusunun cevaplanmasını istiyordu. Başlangıçta birden çok dil olduğu belirtildi, ancak SQL Compose bileşeninde kullanılan tek dil mi?

David Crawford: Evet, bu doğru. Ve fark ettiğim şeylerden biri, farklı türdeki veritabanlarının, belge veritabanlarının, grafik veritabanlarının, anahtar değerli mağazaların patlamasına tanık olduğum için, uygulama geliştirmeleri için gerçekten güçlü olmaları. İlişkisel veritabanlarının yapabileceğinden daha iyi yollarla orada özel ihtiyaçları gerçekten iyi karşılayabilirler.

Ancak veri analizine geri götürdüğünüzde, geri getirdiğinizde - bu bilgileri ad hoc raporlama veya ad hoc verileri kazacak insanlara vermek istediğinizde, her zaman ilişkisel bir şekilde geri döndüklerini en azından insanlar için arayüz. Bunun bir kısmı, SQL'in veri analizinin lingua franca olması, yani insanlar için entegre araçların anlamıdır. Bence bu, Hadoop'taki SQL'in bu kadar popüler olmasının sebebi ve bunu çözme konusunda çok fazla girişim var, çünkü günün sonunda insanların bildiği şey bu. Muhtemelen SQL yazmayı bilen milyonlarca insan var ve ben bir Mongo toplama boru hattı çerçeve sorgusunun nasıl yazılacağını bilen milyonlarca kişiyi değil. Ve gerçekten çok çeşitli platformlarda entegrasyon için kullanılan standart bir dildir. Yani tüm söylenenler, bunun dışında çok nadiren dışarı çıkmamız isteniyor çünkü bu çoğu analistin kullandığı arayüz ve özellikle Compose'da SQL yazmaya odaklandığımız bir yer.

Veri biliminin en çok dışarıya çıktıkları yer olduğunu söyleyebilirim, bu yüzden Pig veya SAS'ı kullanma konusunda ara sıra sorular alıyoruz. Bunlar, Compose'de kesinlikle ele almadığımız ve katalogda yakalamak istediğimiz şeyler. Ayrıca R ve Python'u da görüyorum. R ve Python betiklerinin içindeki Alation'da yazılan sorguları kullanabileceğiniz arayüzler oluşturmamızın birkaç yolu var, bu nedenle, genellikle bir veri bilimcisi olduğunuzda ve bir betik dilinde çalışıyorsanız, kaynak veriler ilişkisel bir veritabanındadır. Bir SQL sorgusu ile başlıyorsunuz ve daha sonra işliyor ve R ve Python içinde grafikler oluşturuyorsunuz. Sorguları veya sorgu sonuçlarını Alation'den alan komut dosyalarına aktarabileceğiniz paketler oluşturduk, böylece burada karışık bir iş akışı elde edebilirsiniz.

Rebecca Jozwiak: Tamam, harika. Biliyorum saatin biraz ötesine geçiyoruz, sadece bir iki soru daha soracağım. Bağlanabileceğiniz tüm farklı sistemler hakkında konuştuğunuzu biliyorum, ancak harici olarak barındırılan veriler ve dahili olarak barındırılan verilerle birlikte, bu tek görünümünüzde tek bir platformda aranabilir mi?

David Crawford: Tabii. Bunu yapmanın birkaç yolu var. Demek istediğim, dışarıdan barındırılan, hayal edebiliyorum, bunun ne anlama gelebileceğini tam olarak düşünmeye çalışıyorum. Bu, birinin sizin için AWS'de barındırdığı bir veritabanı anlamına gelebilir. Data.gov'dan herkese açık bir veri kaynağı anlamına gelebilir. Başka bir uygulama gibi, bir veritabanı hesabıyla oturum açarak doğrudan veritabanlarına bağlanıyoruz ve meta verileri bu şekilde çıkarıyoruz. Dolayısıyla, bir hesabımız varsa ve açık bir ağ bağlantı noktası varsa, bu hesaba erişebiliriz. Ve sonra bu şeylere sahip olmadığımızda, sanal bir veri kaynağı adı verilen bir şey var, bu da ister otomatik olarak, kendi bağlayıcınızı yazarak ya da bir CSV yüklemesi gibi yaparak doldurarak belgeleri itmenize izin veriyor, dahili verilerinizle birlikte verileri belgelemek için. Bu tüm arama motoruna yerleştirilir. Makalelerin ve sistem içindeki diğer belgelerin ve konuşmaların içinde referanslanabilir hale gelir. Dolayısıyla, bir sisteme doğrudan bağlanamadığımız zaman bu şekilde işleriz.

Rebecca Jozwiak: Tamam, bu mantıklı. Size bir soru daha soracağım. Bir katılımcı “Bir veri kataloğunun içeriği, kaynak veriler güncellendikçe, kaynak veriler değiştirildikçe, nasıl doğrulanmalı, doğrulanmalı veya korunmalıdır?” diye soruyor.

David Crawford: Evet, bu çok şey aldığımız bir soru ve bence bizim yaptığımız şeylerden biri - dediğim gibi felsefelerimizden biri, kullanıcıların kötü niyetli olduğuna inanmıyoruz. En iyi bilgiye katkıda bulunmaya çalıştıklarını varsayıyoruz. İçeri girmeyecekler ve insanları veriler hakkında kasten yanlış yönlendirecekler. Kuruluşunuzda bir sorun varsa, belki Alation sizin için doğru araç değildir. Ancak kullanıcılar tarafından iyi niyet varsayarsanız, bunu güncellemelerin geldiği bir şey olarak düşünürüz ve genellikle yaptığımız şey, her veri nesnesinin veya verilerin her bir bölümünün sorumluluğunu üstlenmektir. Üst veri üzerinde değişiklik yapıldığında bu görevlilere bildirimde bulunabiliriz ve bu şekilde işleyebilirler. Güncellemelerin geldiğini görüyorlar, onaylıyorlar. Eğer doğru olmazlarsa, geri dönüp değiştirebilirler ve bilgilendirebilirler ve umarım bilgiye katkıda bulunan ve öğrenmelerine yardımcı olan kullanıcıya ulaşabilirler.

Yani bunu yapmayı düşündüğümüz birincil yol bu. Kalabalık tarafından bu tür bir öneri ve yöneticiler tarafından yönetim, bu yüzden bazı yeteneklerimiz var.

Rebecca Jozwiak: Tamam, güzel. Ve eğer sadece Alation ile en iyi nasıl başlayabileceklerini ve daha fazla bilgi almak için nereye gidebileceklerini bilmelerine izin verebilseydiniz. Bunu bir bit paylaştığınızı biliyorum. Burası en iyi yer mi?

David Crawford: Alation.com/learnmore Bence harika bir yol. Bir demoya kaydolmak için Alation.com sitesinde çok sayıda harika kaynak, müşteri tanıtım belgesi ve çözümümüzle ilgili haberler var. Bence bu başlamak için harika bir yer. Ayrıca e-posta da gönderebilirsiniz.

Rebecca Jozwiak: Tamam, harika. Ve biliyorum, katılımcılar, bugün tüm sorulara ulaşmadıysam özür dilerim, ama değilse, David'e veya satış ekibine veya Alation'daki birisine yönlendirilecekler, böylece sorularınızı cevaplamaya ve anlamaya yardımcı olabilirler. Alation'ın yaptığı veya en iyi yaptıkları.

Ve bununla millet, devam edip bizi imzalayacağım. Arşivleri her zaman InsideAnalysis.com adresinde bulabilirsiniz. Bunu Techopedia.com adresinde de bulabilirsiniz. Biraz daha hızlı güncelleme eğilimindedirler, bu yüzden kesinlikle kontrol edin. Ve bugün David Crawford, Dez Blanchfield ve Robin Boor'a çok teşekkürler. Harika bir web yayını oldu. Ve bununla, sana veda edeceğim. Teşekkürler millet. Güle güle.

David Crawford: Teşekkürler.

Öneri gücü: bir veri kataloğunun analistleri nasıl güçlendirdiği