Ev Veritabanları İleri momentum: ilişkisel olanın gelenekselin ötesine taşınması

İleri momentum: ilişkisel olanın gelenekselin ötesine taşınması

Anonim

Techopedia Staff tarafından, Haziran 8, 2016

Paket Servisi: Sunucu Eric Kavanaugh veritabanı teknolojisindeki yenilikleri uzman Dez Blanchfield, Robin Bloor ve Bert Scalzo ile tartışıyor.

Şu anda giriş yapmadınız. Lütfen videoyu görmek için giriş yapın veya üye olun.

Eric Kavanagh: Bayanlar ve baylar, Çarşamba, dört Doğu zamanında. New Orleans'dayım, yaz geliyor, bu sıcak! Hot Technologies'in zamanı, evet, evet, evet. Benim adım Eric Kavanagh, ev sahibiniz olacağım. Hot Technologies için topu buraya atacağım. Bugünün konusu “İleri Momentum: Gelenekselin Ötesine Geçiş İlişkisi”. Millet, bugün telefonda üç veritabanı uzmanımız var, bu yüzden herhangi bir sorunuz varsa, zor olanları gönderin, utanmayın. Bugün sizin için dizilmiş bir sürü iyi içeriğimiz var. Seninkiyle ilgili nokta gerçekten var, benim hakkımda yeterli. Tabii ki, bu yıl sıcak. Techopedia'dan arkadaşlarımızla bir ortaklık olan bu şovda sıcak teknolojilerden bahsediyoruz. Ve elbette veritabanı olan bilgi yönetiminin temeline kadar gidiyoruz. Buraya nasıl geldiğimiz, bugün neler olduğu ve ileride neler olacağı hakkında konuşacağız. Çok ilginç şeyler oluyor.

Açıkçası veritabanı alanında ciddi bir yenilik var. Bir süre sessiz kaldı; işteki bazı analistlerle konuşursanız, muhtemelen 2005'ten 2009'a veya '10 gibi bir yıldan beri, inovasyon açısından çok fazla şey olduğu görülmüyordu. Ve aniden, bir jailbreak ya da bir şey gibi patlak verdi ve şimdi her türlü ilginç şey oluyor. Bunun çoğu, web'in ölçeği ve farklı ilginç şeyler yapan tüm harika web özellikleri nedeniyle. İşte burada NoSQL kavramı geldi. Ve bu iki farklı anlama gelir: SQL olmadığı anlamına gelir, çünkü SQL'i desteklemez, aynı zamanda sadece SQL anlamına gelmez. Bazı insanların kullandığı “NewSQL” terimi var. Ama belli ki, SQL'ler - Yapılandırılmış Sorgu Dili - gerçekten temeldir, sorgulamanın temelidir.

Ve tüm bu NoSQL motorlarının olması ne ilginçti? Ortaya çıktılar, bu konuda çok heyecan vardı ve birkaç yıl sonra hepimiz duymaya başladık mı? Oh, Hadoop üzerinde SQL. Tüm bu şirketler, SQL arayüzlerini NoSQL araçlarına tokatlamaya başladı ve programlama dünyasında olan herkes bunun bazı zorluklara ve bazı zorluklara ve bazı çapraz tellere yol açacağını biliyor. Bu yüzden bugün bunun hakkında bir çok şey bulacağız.

Üç sunumcumuz var: Teksas'taki kendi Robin Bloor'umuz olan Sydney'den Dez Blanchfield'ı çağırıyoruz ve Bert Scalzo da Teksas'ta. Yani, öncelikle Dez Blanchfield'dan haber alacağız. Millet, #HotTech hashtag'inde tweet atacağız, bu yüzden yorumlarınızı göndermekten veya sorularınızı web yayını konsolunun Soru-Cevap bileşeninden veya sohbet penceresinden göndermekten çekinmeyin. Ve bununla, Dez Blanchfield, götürün onu.

Dez Blanchfield: Teşekkürler, Eric. Herkese selam. Bu yüzden, sahneyi son on yılda neler olduğuna ve en azından bir on yıl bir buçuk kez gördüğümüz önemli değişimlere 30.000 fitlik bir bakış açısıyla deneyeceğim. veritabanı yönetim sistemleri ve ticari veya teknik açıdan bazı etkileri ve geç kaldığımız bazı eğilimler ve bizi bugün konu hakkında konuşacağımız konuşmaya yönlendiriyoruz.

Buradaki kapak resmim bir kumul ve tepesinden küçük küçük kum parçaları üfleyen bir rüzgar var. Bunun bir sonucu olarak, kumul yavaşça bir alandan diğerine yürüyor. Ve bu 40 ve 50 metrelik büyük kum dağlarının etkili bir şekilde hareket ettikleri inanılmaz bir fenomen. Ve çok yavaş hareket ediyorlar, ama kesinlikle hareket ediyorlar ve hareket ettikçe manzarayı değiştiriyorlar. Ve kum tepelerinin doğal bir şey olduğu bir yerde hiç vakit geçirirseniz izlemek oldukça kolaydır. Çünkü bir gün pencereden dışarı bakabilir ve bu devasa kum dağının, küçük minik tanelerin aslında tek başına hareket ettiğini ve rüzgârın onu yavaş yavaş bir yerden bir yere kaydırdığını fark edebilirsiniz.

Bence birçok yönden, bu oldukça uzun bir süredir veritabanı sistemlerinin dünyasıydı. Çok yakın zamana kadar, devasa bir kum dağını kumul şeklinde hareket ettiren kum taneleri şeklinde çok küçük bir değişim. Yıllar boyunca veritabanı platformlarına çok az kayma olmuştur ve orta menzil çağının ana çerçevesi aracılığıyla veritabanı sistemleri ve platformları çevresinde oldukça istikrarlı ve sağlam bir ortam olmuştur. Ancak son zamanlarda ticari ihtiyaçlarımız ve teknik itici güçlerimizde oldukça önemli şeyler oldu. Bizi bunlardan geçeceğim.

Bir veritabanının temel kavramının, uzun yıllar boyunca bildiğimiz gibi ve gösteri öncesi şakada duymuş olabileceğiniz gibi, bugün benimle görüşen iki uzmanımızın 80'lerin başında başladığında orada olmanın övünme haklarını paylaşmakta oldukça haklılar. Ama son on yılda bu muazzam bir değişim gördük ve Dr. Robin Bloor'a teslim etmeden önce hızlıca bize geçeceğim.

“Daha büyük, daha iyi, daha hızlı, daha ucuz” deneyimi dediğim şeyden geçtik. Dediğim gibi, bir veritabanı tanımı değişti. Veritabanı platformlarının performansı ele almak zorunda olduğu manzara ve teknik ve ticari gereksinimler de değişmiştir. Daha karmaşık ticari veya daha karmaşık teknik gereksinimlerle başa çıkmak için çözüm talebindeki bu artışı gördük. Ve bence bunun aslında ne anlama geldiğine gerçekten hızlı bir bakış, 90'ların bir çeşitliliğini bulmamız ve internetin tanıtımından ve internetten sonra dediğimiz şeyden etkilenen veritabanı teknolojisini gördük. ölçeği. Sadece terminallerin önünde oturan insanlardan, aslında içinde fiziksel yazıcı bulunan teletip terminallerinden ve 132 kağıttan çıkan metinlerden bahsetmiyoruz. Sonra erken yeşil ekran terminalleri, klavye ile delme.

Ama biliyorsunuz, dünyamız uzun zamandır bilgisayarlarla konuşan terminaller ve seri kablolar ya da ağ kablolarıydı. Sonra internet geldi ve bu patlayıcı bağlantı büyümesi, artık bilgisayara takılmanız gerekmiyordu. Bir veritabanı sistemine ulaşmak için bir web tarayıcısına ihtiyacınız var. Bu nedenle, veritabanı teknolojisi ölçeği örneğinde, dünyayı endekslemek için kullanılan temel arama motoru teknolojilerinden her şeyin ölçeğiyle başa çıkmak için veritabanı teknolojisi önemli ölçüde değişmek zorunda kaldı. Google ve diğerleri gibi insanlar bunu yapmak için bir platform sağladı. Ve tüm yeni veritabanı depolama ve sorgulama ve indeksleme türleri üretildi. Sonra müzik siteleri ve film siteleri geldi.

Ve sonra 2000'lerde dot-com patlamasını gördük ve bu, bir şekilde bir tür veritabanı tarafından desteklenen sistemleri kullanan insan sayısında daha da çarpıcı bir patlama yarattı. Bu aşama, ilişkisel veritabanları hala yükün çoğuyla başa çıktı, sadece daha büyük teneke koyduk ve IBM ve Sun gibi insanlardan Unix platformlarını çalıştıran çok, çok, çok büyük orta menzilli sistemlere gittik. . Dot-com patlaması, bir donanımdan, performans açısından işleri daha büyük ve daha hızlı hale getirdi ve veritabanı motorlarında bazı önemli değişiklikler vardı, ancak daha iyisi için, hala bir şey için gördüğümüzle aynı şeydi uzun zaman.

Sonra web 2.0 çağından bahsediyoruz. Ve bu korkunç bir değişimdi, çünkü aniden çok daha basit veritabanı platformlarına ihtiyacımız vardı ve yatay bir formda bir ölçek olması gerekiyordu. Ve bu, bir veritabanının ne olduğu fikrine yaklaşma şeklimizde çok önemli bir değişiklikti. Bence hala gerçekten yetişiyoruz. Ve şimdi tüm bu bataklıkla uğraşıyoruz ve ben olumlu bir dönüşle, olumsuz bir çağrışımla değil, büyük veri olarak adlandırdığımız şeyin ve büyük bir patlamanın bu bataklığından söz ediyorum ve patlama demek istiyorum. Bu çirkin değişiklik, bir veritabanı hakkında konuştuğumuzda sahip olduğumuz seçeneklerin sayısının ve bir tür ilişkisel sorgulama yeteneğinin grafiğinde dikey olarak kayıyor.

Ve ilginç bir şekilde, şahsen büyük verinin buzdağının sadece görünen kısmı olduğunu düşünüyorum. Büyük verilerin etkisi ve şu anda elimizde olan seçenek türleri konusunda biraz heyecanlanma eğilimindeyiz. NoSQL motorlarından her şeye sahibiz, grafik motorlarımız var, veri atabileceğimiz ve onunla bir şeyler yapabileceğimiz tüm bu farklı platform türlerine sahibiz. Aslında, bugün burada bizimle olan Eric Kavanagh ile ilk yaptığım konuşmalardan biri, sorgulamanıza izin veren açık kaynaklı bir proje olan Apache Drill adlı bir şeyle ilgili bir konuşma etrafındaydı. model içindeki veriler farklı veri türleri: sabit diskte oturan ham CSE dosyalarından petabyte ölçeğinde HDFS dosya sistemlerine kadar her şey. Ve bilirsiniz, her türlü heyecan verici bitkinin yapılandırılmış ve yapılandırılmamış verilerinin SQL tarzı sorgularını yapmanızı sağlar.

“Akıllı bina” nın bir şey haline geldiğini görmek üzereyiz ve akıllı güvenlik ve ısı yönetimi binalarımız olduğunu düşünmek isteriz, ancak kim olduğunuz hakkında çok daha fazla şey bilen akıllı binalardan bahsediyorum. ve nerede yürüdüğünüzde ve akıllıca şehirlere, her şeyi akıllıca nasıl yapacağınızı bilen akıllı şehirlere - şehir düzeyindeki tüm ekosistemlere kadar - her seviyede düzgün şeyler yapın. Ve bunun ötesinde, dünyadaki hiç kimsenin tam olarak kavranmadığını düşündüğüm inanılmaz bir şey var ve bu Nesnelerin İnterneti'nin şekli. Son on yıl boyunca tüm bu farklı değişiklikler oldu ve bence, belki yirmi yıl kabaca, eğer yuvarlarsak, veritabanlarını düşündüğümüz dünyayı biraz etkilemişti bence.

Bunu mümkün kılan birkaç önemli şey oldu. Sabit sürücülerin maliyeti önemli ölçüde düştü ve birçok yönden Hadoop modeli gibi referans mimarilerinden bazılarının sürülmesini mümkün kıldı, çünkü çok fazla veri alıp çok sayıda sabit sürücüye yaydık ve onunla akıllı şeyler yapın. Ve aslında, benim görüşüme göre, ilişkisel veritabanı veya geleneksel DB birim modelinin parçalanması. Ve RAM çok, çok ucuz hale geldi ve bu bize bellek içi gibi farklı referans mimarileri ile oynamak ve çok, çok büyük veri yığınlarını bölümlemek gibi şeyler yapmak için yepyeni bir fırsat verdi.

Ve bu bize şu anda baktığımız bu küçük resmi verdi, bu da büyük veri manzarasındaysanız mevcut platform türlerini gösteren bir diyagram. Ve okumak çok ama çok zor ve bunun sebebi hakkında çok fazla bilgi var. Herhangi bir formdaki veritabanı sistemlerine veri koymak, sorgulamak ve geleneksel okuma-yazma işlemleri yapmak için birçok marka, model ve üretim seçeneği vardır. Ve hepsi uyumlu değil, aslında çok azı herhangi bir temel stil standardına bile uyuyor, ancak yine de kendilerini bir veritabanı olarak görüyorlar. Ve size, 90'lardan ve internet ölçeğinden web 2.0'a ve daha sonra büyük veri yoluyla tüm büyümeye ne demek istediğimle ilgili bir bağlam sunmak için saniyede birkaç ekran göstereceğim. Bu büyük veri teknolojisi manzara grafiğinin heyecan verici olduğunu düşünürsek, üzerinde birçok seçenek var, sadece bir dikey temaya bakalım.

Pazarlama teknolojisine bakalım. İşte veritabanı yönetimi sistemleri veya sadece mar-tech alanı içindeki veri yönetimi seçenekleri, böylece pazarlama ile ilgili teknoloji. Şimdi bu 2011'de, birkaç yıl önce; beş yıl önce manzara böyle görünüyordu. Kısaca bir slayta dönersem, veritabanı teknolojilerinde sahip olduğumuz çeşitli markalarda ve tekliflerde bugünün veri ortamı böyle görünüyor. Beş yıl önce, sadece pazarlama teknolojisinde bir sektör böyle görünüyordu.

Şimdi bugünün görüşüne gidersem, işte böyle görünüyor ve tamamen aşılmaz. Sadece bu marka ve seçenek duvarı ve veritabanı sınıfında olduğunu düşünen, çeşitli şekillerde veri yakalayabilen, oluşturabilen ve alabilen binlerce ve binlerce yazılım kombinasyonu. Sanırım şimdi çok, çok ilginç ve cesur bir zamana giriyoruz, bir zamanlar büyük markaları tanıyabiliyorsunuz, Oracle ve Informix, DB2 ve benzeri beş veya altı farklı platformu tanıyabiliyor ve neredeyse 20 yıl önce mevcut olan tüm markalarda neredeyse bir uzman. On yıl önce, biraz daha kolaylaştı çünkü bazı markalar düştü ve tüm markalar dot-com patlamasının ölçeğiyle başa çıkamadı ve bazı şirketler kırıldı.

Bugün, ilişkisel veritabanları veya son birkaç on yılda bildiğimiz standart veritabanı yönetim platformları olsun, mevcut tüm veritabanı teknolojisi konusunda uzman olmak kesinlikle imkansızdır. Ya da muhtemelen, Neo4j ve bu tipler gibi daha modern motorlar. Ve bence pek çok seçeneğin mevcut olduğu çok cesur bir dünyaya giriyoruz ve şimdi bellekte veya diskte yatay olarak ölçeklendirilmiş platformlarımız var. Ama bence teknoloji ve iş karar vericileri için zor bir zaman, çünkü teknoloji yığınları hakkında çok büyük kararlar vermeleri gerekiyor, bazı durumlarda sadece aylardır var. On sekiz aylık, daha heyecan verici ve yeni açık kaynaklı veritabanı platformlarının bazıları için korkunç bir sayı değil. Ve platformları birleştirmeye başlarlar ve daha da yeni ve daha heyecanlı hale gelirler.

Bugün bunların hepsinin geleneksel veritabanı platformlarını nasıl etkilediğini ve bunlara nasıl yanıt verdiklerini ve buna atılan teknolojilerin türleri hakkında harika bir sohbet yapacağımızı düşünüyorum. Bunu akılda tutarak, şimdi Dr. Robin Bloor'a geçeceğim ve fikirlerini alacağım. Robin, sana geldim.

Robin Bloor: Tamam, bunun için teşekkürler. Evet, bu çok büyük bir konu. Yani, Dez'in size gösterdiği resimlerden birinin şeridini aldıysanız, şeritlerden sadece biri hakkında uzun bir konuşma yapabilirsiniz. Ama biliyorsunuz, bir veritabanına gidebilirsiniz - 1980'lerden beri veritabanlarına bakıyorum, bilmiyorum ve veritabanına farklı şekillerde bakabilirsiniz. Yapacağımı düşündüğüm şeylerden biri, bugün konuşmaya atmak, yıkıcı şeylerin donanım düzeyinde gerçekleşmesinin nedeninden bahsetmekti. Ve aklınızda bulundurmanız gerekir, yazılım düzeyinde de çok fazla yıkıcı şey oldu, bu yüzden bu hiçbir şeyin tam resmi değil, bu sadece bir donanım şeyidir.

Ben de uzun süre konuşmayacaktım, sadece donanım resmini vermek istedim. Bir veritabanı, CPU, bellek ve diski kapsayan veri alma yetenekleridir ve bu önemli ölçüde değişmektedir. Ve bunu söylememin sebebi, veritabanını gerçekte yaptığınız bakış açısından anlamayı öğrenmemdi. Bilirsiniz, aslında CPU'daki veriler ile CPU'dan bellekten alınan veriler ile diskten belleğe ve CPU üzerinden çekilen veriler arasında bir gecikme farkı vardır. Ve eski veritabanı mimarileri bunu dengelemeye çalışıyordu. Bilirsiniz, sadece, “Bu çok yavaş gidiyor, diskteki verileri önbelleğe alacağız, böylece bellekte olacak. Bunu gerçekten doğru bir şekilde yapmaya çalışacağız, böylece istediğimiz verilerin gerçekten iyi bir oranı zaten hafızada. Ve verileri olabildiğince hızlı bir şekilde CPU'ya taşıyacağız. ”

Ve veritabanları eski günlerde yazılmış makineler küçük kümeler için yazılmıştır. Ve şimdi, paralellikten habersiz. Çünkü bir kümeden biraz performans alacaksanız, paralel olarak çeşitli şeyler yapmanız gerekecektir. Paralellik oyunun bir parçasıdır, şu anki gibi bir şey değildir. Olanlar üzerinde biraz yürüyeceğim.

Her şeyden önce, disk. Disk bitti, gerçekten. Veritabanları ile ilgili oldukça fazla. Ben veri arşivleme için bir dizi bağlam olduğunu düşünüyorum ve hatta Hadoop üzerinde çalışan çok büyük veri gölleri, en kötü dönen disk bugünlerde muhtemelen uygulanabilir. Gerçekten, dönen disk ile ilgili sorun okuma hızlarının özellikle fazla gelişmediğiydi. CPU yükselirken Moore'un yasa hızları, bir tür büyüklük derecesi, altı yılda bir daha hızlı. Ve bellek onun ardından takip ediyordu, o zaman bu ikisi birbirine makul bir şekilde ayak uyduruyorlardı, tamamen pürüzsüz değildi, ama yaptılar.

Ama rastgele, kafanın disk hakkında uçtuğu bir diske okudum, yani, başka bir şeyden başka, fiziksel bir hareket. Ve bir diskten rastgele okumalar yapıyorsanız, bellekten okumaya kıyasla inanılmaz derecede yavaştır, 100.000 kat daha yavaştır. Ve son zamanlarda, herhangi bir derinlikte baktığım veritabanı mimarilerinin çoğu aslında disklerden seri olarak okuyor. Gerçekten, şu ya da bu şekilde diskten olabildiğince önbelleğe almak ve yavaş aygıttan çekip hızlı bir aygıta koymak istiyorsunuz. Ve bununla yapabileceğiniz birçok akıllı şey var, ama bir şekilde bitti.

Katı hal diskler veya flash sürücüler, gerçekten, oldukları gibi, dönen diski çok hızlı bir şekilde değiştirir. Ve bu yine tamamen değişiyor, çünkü verilerin bir diskte düzenlenme şekli, diskin çalışma biçimine göre düzenlenmiş olmasıdır. Aslında bir eğirme yüzeyi boyunca hareket eden bir kafa, aslında birden çok eğirme yüzeyi boyunca hareket eden ve verileri giderken toplayan kafa ile ilgilidir. Katı hal sürücüsü yalnızca okuyabileceğiniz bir bloktur. Demek istediğim, ilk şey tüm geleneksel veritabanlarının diski döndürmek için tasarlandığı ve şimdi SSD için yeniden tasarlandığı. Yeni veritabanları muhtemelen - şu anda yeni bir veritabanı yazan herkes muhtemelen dönen diski göz ardı edebilir, hiç düşünmeyin. Ancak, SSD'lerin ana üreticisi Samsung, SSD'lerin aslında Moore'un yasa eğrisinde olduğunu söylüyor.

Sanırım, dönen diskten yaklaşık üç veya dört kat daha hızlıydılar, ama şimdi temel olarak 18 ayda bir çok daha hızlı olacaklar. Çift hızda ve yaklaşık altı yıla kadar 10 kat hızda. Ancak bu sadece olsaydı, size söyleyeceğim gibi değil. Dönen disk elbette bir arşivleme ortamı haline geliyor.

Bellek hakkında. İlk önce RAM. CPU başına RAM arasındaki CPU oranı her zaman artmaktadır. Ve elbette, bir bakıma, çok daha fazla hız sağlar, çünkü şimdi sahip olabileceğiniz bellek dönümleri çok daha fazlasını depolayabilir. Bunun gerçekte yaptığı şey, MLTP türündeki uygulamalar veya rasgele okunan uygulamalar üzerindeki baskıyı bir şekilde azaltır, çünkü bunları ikram etmek daha kolaydır, çünkü artık çok fazla belleğiniz var ve bu şekilde, her şeyi önbelleğe alabilirsiniz hafızaya okunması muhtemeldir. Ancak, daha büyük bir veri yığınıyla sorun yaşarsınız, bu nedenle büyük veriler aslında o kadar basit değildir.

Ve sonra 3D Xpoint ile Intel var ve IBM, faz değiştirme belleği olan PCM olarak adlandırdıkları şeyle, mevcut SSD'lerden en az 10 kat daha hızlı olduğuna inanıyorlar. RAM ile aynı hıza çok yakın. Ve tabii ki daha ucuz. Daha önce, CPU, bellek ve diskin bu veritabanı yapısına sahiptiniz ve şimdi dört katmanı olan bir yapıya doğru ilerliyoruz. CPU, bellek veya RAM var ve daha sonra SSD'den daha hızlı olan bu tür SSD'den daha hızlı bellek ve daha sonra SSD. Ve bu yeni teknolojiler uçucu değildir.

Ve HP'nin memristoru var, henüz değil, bilirsiniz, çünkü yaklaşık yedi yıl önce duyuruldu, ancak henüz ortaya çıkmadı. Ancak duyduğum söylentiler, HP'nin bir memristor ile oyunu biraz değiştireceği, bu yüzden sadece yeni bir hafıza durumunuz var. Bu daha hızlı şeylerimiz gibi değil, yepyeni bir katmanımız var gibi. Ve sonra SSD erişimine paralel olarak okuyabilirsiniz. Birçok farklı dönen diske sahip olmanız dışında, dönen diski paralel olarak okuyamazsınız. Ama bir SSD bloğu, aslında paralel olarak okuyabilirsiniz. Ve bunu paralel olarak okuyabildiğiniz için, aslında tek bir CPU'daki çeşitli işlemler arasında birden fazla işlem kurarsanız ve SSD ile varsa, basit okuma hızlarından çok daha hızlı gider.

Bunu yaparak neredeyse RAM hızlarına ulaşabileceğiniz tahmin edilmektedir. Ve bütün söylediklerimiz, bellek mimarisinin geleceği belirsiz. Demek istediğim, gerçek şu ki, kim olursa olsun çeşitli baskın satıcılar muhtemelen donanımın yönünü belirleyecekler. Ama kimse bu noktada nereye gittiğini bilmiyor. “Olanlardan korkmuyorum” diyen bazı veritabanı mühendisleriyle konuştum, ancak hareket halindeyken nasıl optimize edileceğini bilmiyorlar. Ve her zaman yaptın, bu ilginç.

Ve bir de CPU var. Çok çekirdekli işlemciler sadece çok çekirdekli işlemciler değildi. Ayrıca önemli miktarlarda L1, L2 ve L3 önbelleğimiz var, özellikle de bilmiyorum, onlarca megabayt. Oraya çok şey koyabilirsin. Bu nedenle, çipi gerçekten bir önbellek ortamı olarak kullanabilirsiniz. Böylece oyun değişti. Ve kesinlikle, vektör işleme ve veri sıkıştırma, bir dizi satıcı aslında bunu yaptı, hepsini CPU'da çok daha hızlı hale getirmek için CPU'ya sürükledi. Sonra, GPU'lu CPU'ların analitiği hızlandırma konusunda gerçekten iyi olduğu gerçeğini anlarsınız. Ve belirli türdeki sorgularda gerçekten oldukça iyidirler, sadece sorgunuzun ne olduğuna bağlıdır.

CPU ve GPU'larla kartlar oluşturabilirsiniz veya AMD şu anda yaptığı gibi, bir CPU ve GPU'nun bir tür evliliği olan APU adı verilen bir şey üretiyorsunuz; her iki özelliği de var. Yani bu farklı bir işlemci. Ve daha sonra Intel'in çip üzerine bir FPGA koyacaklarını, bu tür kafamı içeriye soktuklarını duyurdu. “Nasıl olacak?” Diye düşünüyordum. CPU, GPU olasılığı ve CPU, FPGA olasılığınız var - ve bu arada, gerçekten isterseniz, aynı tahtaya bir CPU, GPU ve FPGA koyabilirsiniz. Aslında bu şekilde bir şeyi nasıl yürüteceğiniz hakkında hiçbir fikrim yok, ama böyle şeyler yapan şirketleri biliyorum ve çok, çok hızlı sorgu yanıtları alıyorlar. Bu göz ardı edilecek bir şey değildir, bu kurulmuş satıcılar ve belki de yeni satıcılar tarafından kullanılacak bir şeydir. DBMS'ler her zaman paraleldi, ama şimdi paralel olasılıklar patladı, çünkü bu bunu bununla, bununla, çeşitli yollarla bununla paralelleştirmenize izin veriyor.

Son olarak, ölçeklendirmek veya ölçeklendirmek için mi? Ölçeklendirmek gerçekten en iyi çözümdür, ama bir kere. CPU'nun ve diskteki belleğin performansını tek bir düğümde kesinlikle optimize edebiliyorsanız çok daha iyi düğüm performansı elde edersiniz. Ve daha az düğüm kullanacaksınız, bu yüzden daha ucuz olacak, değil mi? Ve yönetimi daha kolay olacak. Ne yazık ki, donanıma bağlı bir tasarımdır ve donanım değiştikçe, mühendisleriniz donanım değiştiği kadar hızlı çalışamayacağı sürece bunu yapmak daha az mümkün olur. Ve iş yükü sorunları alıyorsunuz, çünkü ölçeklendirirken, iş yükünün ne yapacağına dair çeşitli varsayımlar yapıyorsunuz.

Eğer ölçeklendirirseniz, yani mimarınız ölçeklendirmeden önce ölçeklendirmeyi vurgularsa - aslında ikisini de yapmanız gerekir, sadece birini vurgulamanız gerekir. O zaman daha iyi bir ağ performansı elde edersiniz, çünkü mimari bununla ilgilenir. Donanım açısından daha pahalı olacak, çünkü daha fazla düğüm olacak, ancak daha az iş yükü sorunu olacak ve daha esnek bir tasarım olacak.

Ve sadece bunu atacağımı sanıyordum, çünkü eğer gerçekten sadece tüm parmağımı işaret ettiğim tüm donanım değişikliklerini düşünürseniz ve sonra düşündünüz mü, o şeyleri nasıl ölçeklendirip ölçeklendireceksiniz? O zaman veritabanı mühendislerinin en azından bence iyi ödenmediğinin farkındasınız. Yani, sadece donanım katmanını düşünürseniz, veritabanı zorlukları açıktır. Şimdi bunu hepimize eğitimli hissettirecek Bert'e aktarıyorum.

Eric Kavanagh: İşte bu! Bert?

Bert Scalzo: Çok teşekkür ederim. Doğrudan bu slaytlara gireyim. Geçmek için çok fazla slaytım var, bu yüzden birkaç tanesinde oldukça hızlı gidebilirim. Bu “İleri Momentum: İlişkiselliğin Gelenekselin Ötesine Taşınması” hakkında konuşacağız. Artık babanızın veritabanı değil. İşler değişti ve daha önceki bir konuşmacının söylediği gibi, son altı ila yedi yıl boyunca manzara kökten değişti.

Ben, 80'lerin ortalarından beri veri tabanları yapıyorum. Oracle, SQL Server, kıyaslama ve diğer pek çok şey hakkında kitaplar yazdım. “Dünya çok hızlı değişiyor. Büyük artık küçük atmayacak. Yavaş yavaş yenmek olacak. ”“ Uyum sağlamak için ”ekledim. Bu Rupert Murdoch'tan geliyordu. Bunun gerçek olacağına gerçekten inanıyorum. 10, 15, 20 yıl önce yaptığınız gibi veritabanı işleri yapamayacaksınız. Bunu şimdi işin istediği şekilde yapmanız gerekecek.

Sunduğum şeyde biraz genel kalmaya çalışacağım, ancak bahsettiğim özelliklerin çoğu Oracle'da bulacak, SQL Server, MySQL, MariaDB ve diğer bazı büyük oyuncular. İlişkisel veritabanı devrimi, daha önceki konuşmacılarla tekrar aynı fikirdeyim. 2010 yılına doğru bakarsanız, kırmızı yarış arabasından sarı yarış arabasına gittik. Önemli bir değişiklik oldu ve 2020'ye gelince, başka bir radikal değişiklik göreceğinize inanıyorum. Çok ilginç bir zamandayız.

Şimdi, bu slayt anahtar, bu yüzden oraya bir anahtar koydum. Tüm bu değişiklikler devam ediyor ve sol tarafta teknoloji var ve sağ tarafta iş var. Ve soru şu, hangisi hangisine neden, hangisi hangisini destekliyor? Tüm bu donanım değişikliklerine sahibiz: diskler aşağı iniyor, disk boyutu artıyor, yeni disk türleri, bu nedenle önceki hoparlörler tarafından kapsanıyordu. Bellek düşme fiyatı, veritabanlarının tüm bu yeni sürümleri. Ancak sağ tarafta, veri koruma ve uyumluluk, veri depolama, iş zekası, analitik, zorunlu veri saklama var. Denklemin her iki tarafı da sürüyor ve denklemin her iki tarafı da tüm bu yeni özellikleri kullanacak.

Her şeyden önce, tipik SAS eğirme diskimiz var, şimdi 10 terabayta kadar. Eğer görmediyseniz, Western Digital, HGST helyum sürüşü olarak adlandırdıkları şeye sahiptir, şu anda yaklaşık 10 terabayta kadar çıkıyor. Dönen disk maliyetleri oldukça düşüyor. Daha önce de belirtildiği gibi, yaklaşık iki terabayta kadar katı hal diskleri alabilirsiniz, ancak Samsung'un yakında 20 terabaytlık bir birimi var. Maliyetler makul hale geliyor. Diğerleri hakkında konuşmayacağım bir şey, flash disk kavramı. PCIe, bu PCI Express, NVMe'ye karşı, bu kalıcı bellek ekspresini duymuş veya duymamış olabilirsiniz. Temel olarak, NVMe SAS ve SATA'nın yerine geçecek ve gerçekten her şeyden çok bir iletişim protokolü. Ancak bu diskler şu anda yaklaşık üç terabayta kadar.

Ayrıca, bazı SAS sürücülerinin, standart bir diskle NVMe'yi destekleyen bir SAS veya SATA'dan farklı bir konektör olan U.2 konektörlerle birlikte geldiğini görmüş olabilirsiniz - disk elbette bunu da desteklemelidir. Ve sonra M.2 konektörlü SATA ve bunlar NVMe almaya başlıyor. Aslında, içinde bir NVMe flash diski olan dizüstü bilgisayar satan dizüstü bilgisayar satıcıları var ve bunlar daha önce kullandığınız teknolojiye kıyasla çığlık atacak.

Birçok insan bu farklı flaşların ne olduğunu bilmiyor. Sağ alt köşeye bakarsanız, bu bir M.2 örneğidir. “Pekala, bu soldaki mSATA sürücüsüne çok benziyor.” Diyebilirsiniz. Ama gördüğünüz gibi, pimlerde birinin aksine iki boşluk var ve biraz daha büyük. Ve ayrıca, M.2 üç farklı boyutta gelebilir.

Ve sonra PCI Express yanıp sönüyor ve NVMe yanıp sönüyor. Şimdi, NVMe flaş da PCI Express'tir, ancak PCI Express hala dönen disk için yazılmış bir SAS veya SATA tipi denetleyici algoritmasıdır ve NVMe, özellikle flaş için yazılmış algoritmalar veya tekniklerdir. Ve yine, bunların hepsini göreceksiniz.

NVMe birkaç şey sunuyor. Bence en büyük iki gelişme sağ üst köşede, gecikmenin yüzde 70'e kadar azaldığı. Aslında bundan daha da yüksek gördüm. Ayrıca, sağ alt köşeye bakarsanız, işletim sisteminiz NVMe diskiyle konuştuğunda, daha az yazılım seviyesinden geçer. Temel olarak, işletim sistemine dahil olan NVMe sürücüsünden geçiyorsunuz ve doğrudan medyayla konuşuyor. Bu teknolojinin veritabanı dünyasını kökten değiştirmesinin birçok nedeni var.

Ve çoğu zaman, insanlar “Peki, NVMe ne kadar hızlı?” Derler. Biliyorsunuz, eski güzel günler, 2004'e kadar ve daha önce, saniyede 300 megabayt olan Ultra-320 SCSI'miz varsa heyecanlandık. Bugünün hızları, birçoğunuz muhtemelen fiber veya InfiniBand üzerindesiniz ve bu tür tepeler. Orada sağdaki NVMe, mevcut teknolojilerin bittiği yerde başlar. Ne elde edeceğim, sekiz şeritli bir bağlantıya sahip PCI Express 3.0 neredeyse 8000'de başlıyor ve daha yeni PCI Express sürümleri, sürüm 4 ve benzeri sürümleri alırken artacak. NVMe'nin yukarı dışında gidecek hiçbir yeri yok.

Şimdi, veritabanında değişen bazı şeyler nelerdir? Şimdi slaytlarımın sağ üst köşelerinde teknolojinin ortaya çıktığını düşündüğüm iş nedenlerini koydum. Bu durumda, veri depolama ve zorunlu veri saklamaya ilişkin yasal nedenlerden dolayı, veritabanları bunlarda sıkıştırma sunmaya başlamaktadır. Şimdi, bazı veritabanları bir eklenti olarak sıkıştırma sunar, bazıları standart olarak yerleşik olarak sunar, diyelim ki veritabanlarının kurumsal sürümü ve yine de Oracle gibi bazı veritabanlarının daha da iyi bir sıkıştırma sürümü olabilir. diyelim ki, Exadata platformlarında, bu yüzden çok özel bir sıkıştırmayı destekleyebilecek donanımlar geliştirdiler ve örneğin Exadata'daki bir donanım 40x sıkıştırma oranı alıyor ve bu yüzden çok önemli. Ve bence bu zorunlu veri saklama, insanlar sadece veriyi daha uzun istiyor. İşletmeler, analitik ve BI yapmak için son 5, 10, 15 yıllık verilere ihtiyaç duyarlar.

Şimdi 2008, 2009 döneminde ortaya çıkmaya başlayan bir başka özellik de bölümleme idi. Yine, bunu Oracle, SQL Server gibi veritabanlarında ve her ikisi için de ödemek zorundasınız. Oracle'da bölümleme seçeneğini satın almanız ve SQL Server'da veri merkezi sürümünde olmanız gerekir. Geleneksel bölme-fethetme tekniğiniz ve yaptığınız şey, üstte mantıksal büyük bir masa kavramına sahip olmanız ve diske takıldığında, aslında kovalara bölünmesi. Ve bu bölümlerin ayırma işlevi için tipik olarak başvurulan veya bölümleme işleviniz olarak adlandırılan bazı ölçütlere göre düzenlenmiş olduğunu görebilirsiniz ve daha sonra bazı veritabanı platformlarında alt bölümleme de yapabilirsiniz ve daha da ileri gidebilirsiniz.

Yine, hem veri depolama hem de zorunlu veri saklama bunu zorladı ve bu veritabanlarının bazılarında 64.000 bölüme kadar sahip olabilirsiniz ve 64.000 alt bölüme kadar bile diğer bazı veritabanlarına inanıyorum. Bu, verilerinizi yönetilebilir parçalara ayırmanıza olanak tanır. Ayrıca dizinleri bölümleyeceksiniz; bu bir seçenek, zorunda değilsiniz, ancak dizinlerinizi de bölümleyebilirsiniz. Bunu yapmanın nedenlerinden biri, kayan bir veri pencereniz olması olabilir. 10 yıllık veri tutmak istersiniz, ancak bu akşamki toplu yükü çalıştırmak için dizinleri bırakmak için, dizinleri her satırda, yalnızca geçerli gruptaki satırlarda bırakmak zorunda kalmazsınız. Çoğu insanın büyük yararının planlarınızda bölüm eleme işleminin devam ettiğini ve dolayısıyla sorgularınızı hızlandırdığını düşünmesine rağmen, bölümleme aslında çok iyi bir yönetim aracıdır. Bu gerçekten kekin üzerine krema.

Şimdi muhtemelen parçalanmayı duydunuz ve muhtemelen “Peki, neden bu slaydı buraya koydunuz?” Diye düşünüyorsunuz. Bu şu NoSQL'den biri - bu Hadoop tipi ortamlardan biri. Oracle 12c, henüz G8 olmayan iki tane yayınladı, ancak gösterilen veya önizlenen aslında içinde parçalanıyor. Oracle gibi geleneksel bir veritabanı sistemine sahip olacaksınız ve Hadoop modelinde yaptığınız gibi parçalanabileceksiniz ve böylece bölmenizi ayıracak başka bir bölme ve fethetme tekniğiniz olacak tabloyu düğüm başına gruplandırmalara satırlar halinde ve bu da tıpkı bazı NoSQL veritabanlarında gördüğünüz gibi olacaktır. Ve aslında MySQL, bunu aslında kümeleme tekniklerinden birini kullanarak başarabilirsiniz, ancak geleneksel bir veritabanına geliyor ve tahminim Microsoft'un geride kalmak istemeyeceği. Bu iki oyun sıçrama kurbağa her zaman birbirleriyle belki SQL Server sonraki sürümünde parçalanma görmek beklenir.

Veri yaşam döngüsü yönetimi, yine zorunlu veri saklama, aynı zamanda iş zekası ve analitik için. Gerçekten, bu bir bölme ve fethetme tekniğidir ve tipik olarak DBA'lar bunu manuel olarak yapar ve bu, “Bu yılın verilerini hızlı disklerde tutacağım, geçen yılın verileri biraz daha yavaş disklerde tutacağım, belki de gidiyorum son iki yılı daha yavaş disklerde tutmak için, ve sonra bir arşivleme yöntemim olacak. ”Genellikle artık bantlanmamış, tipik olarak - bir çeşit ağa bağlı depolama veya çok sayıda cihaza sahip bir cihazınız var ve bildiğiniz gibi, maliyet etkin ama hala disk dönüyor.

Ve böylece aslında - hem Oracle'da hem de SQL Server'da - kuralları tanımladığınız bir seçenek satın alabilirsiniz ve bu sadece arka planda otomatik olarak gerçekleşir. Artık senaryo yazmak zorunda değilsiniz, hiçbir şey yapmanıza gerek yok. Ve daha önce Haziran ayında çıkan SQL Server 2016'yı gördüyseniz, temelde yapmanıza olanak tanıyan “Streç Veritabanları” adı verilen yeni bir özellik var - oradaki sağ alt köşede - birden fazla katmandan doğrudan buluta geçebilirsiniz ve yine bu veritabanında yerleşik olan bir özellik, sadece “Veriler 365 günden daha eski ise, lütfen buluta taşıyın ve bilirsiniz, benim için otomatik olarak yapın” gibi bir şey söylersiniz.

Bu gerçekten harika bir özellik olacak, aslında gelecekte göreceğimiz şey olabileceğini düşünüyorum, bu da bazı yerel tutacağınız hibrit veritabanlarına sahip olacaksınız. ve bazıları bulutta. Bundan önce, insanlar “Ah, ben ya yerinde yapacağım ya da bulut üzerinde yapacağım” diye düşünüyorlardı. Şimdi bu iki teknolojinin evliliğini bu melez tarzda görüyoruz. Bunun oldukça büyük olacağını düşünüyorum ve Microsoft önce oraya geldi.

Redaksiyon, bunun nedeni veri koruma ve uyumluluğudur. Eski güzel günlerde, “Hey, uygulama geliştiricisi, bunu raporda görüntülediğinizde, bunu ekranda görüntülediğinizde burada kontrol etmeniz gereken bazı güvenlik şeyleri var ve lütfen bilirsiniz, sadece verileri gösterin görmemeleri gereken verileri görmeleri veya maskelemeleri ya da düzeltmeleri gerekiyor. ”Eh, her zamanki gibi, uygulamaya yönlendirdiğinizde tek bir yerde yapılmadığından farklı bir şekilde yapılır ya da bazı yerlerde yapılmaz. Ve şimdi veritabanı sistemlerinizde bu yeteneğe sahipsiniz.

Şimdi SQL Server 2016'da, bu özellik yerleşiktir, bu yüzden henüz veri merkezi ekinde olmak için isteğe bağlı bir maliyet öğesi değildir, inanıyorum; Oracle 12'de de yaşam döngüsü yönetimi eklentisini satın almanız gerekiyor, ancak bu yeni bir şey ve yine işletme tarafından yönlendiriliyor. Ve özellikle şu anda çok fazla veri tuttuğunuz ve veri madenciliği yaptığınız için, bu nedenle BI ve analitik, kimin hangi verilere eriştiğini bilmeli ve sadece neyi görmelerine izin verildiğinden emin olmalısınız görmelerine izin veriliyor.

Aynı şekilde, veri korumasına ve uyumluluğuna tekrar bakın. Şimdi veritabanı sistemlerinin birçoğunun sıkıştırma oluşturduğunu göreceksiniz veya üzgünüm, doğrudan veritabanına şifreleme ve bu şifreleme hakkında önemli olan şey, eğer yazdığı diyagramdaki aşağı oka ve yukarı oka bakarsanız sonra diske geri okur ve şifresini çözer. Bu aslında bir model, aslında sadece ağdaki bu verileri gerçek istemci uygulamasına ilettiğinde yapacak başka bir model var.

Bu durumda, hala bellekte veritabanı sunucusunda bile şifrelenebilir ve yalnızca istemci uygulamasına gönderildiğinde şifresi çözülebilir. Burada iki farklı model var ve bunları veritabanlarında bulacaksınız ve aslında bunu yeni ekleyen veritabanlarından biri 10.X sürümlerinde MariaDB idi; Şimdi 10.1 veya 10.2'de olduklarına inanıyorum. Ve aslında bu şifrelemede bir kıyaslama yaptım ve bu şifrelemeyi elde etmek için, sadece verim veya hızda yüzde 8'lik bir düşüş yaşadım. Bir kıyaslama testinde, şifreleme o kadar çok şey yapmadı ve bu yüzden çok kullanışlı bir özellik.

Şimdi, daha önce flash bellek ve SSD'lerden ve bunun gibi şeylerden bahsetmiştik. Oracle ve SQL Server'da birçok kişinin fark etmediği özelliklerden biri, veritabanı sunucunuzda bulunan bir flash veya SSD alabilmeniz ve veritabanına “Bunu bellekmiş gibi kullanın. RAM'i tercihli olarak ele alın, ancak bunun yavaş bir bellek gibi davranın ve bunu genişletilmiş bir önbellek olarak kullanın. ”Şimdi SQL Server 2014'te bu çıktı ve“ Buffer Pool Extension ”olarak adlandırıldı, ücretsiz. Oracle'da, 11g R2'de çıktı ve buna “Veritabanı Flash Önbelleği” adı verildi ve orada da ücretsizdi.

Benim tavsiyem ise, bu özelliği dikkatlice test etmektir. Arama yapmaya gittiğinizde önbelleği her büyüttüğünüzde daha uzun sürer. Üç terabaytlık bir flash kart koyarsanız ve veritabanına “Bunu hafızanıza ekleyin” derseniz, içeriye bakma ve flash'ta olduğunu görme zamanı nedeniyle bir şeyin yavaşladığını görebilirsiniz, kirli mi yoksa temiz? Geri dönüşün azaldığı bir nokta var. Benim tavsiyem tekrar test sürüşü, sizin için neyin işe yaradığını görün, ama yine de, veritabanınızda ve Oracle'ın durumunda, hem SQL Server hem de Oracle'da, birkaç yıldır orada.

Ve sonra bu bizi bellek içi veritabanları olan büyükbabana getiriyor ve bunun nedeni veritabanı fiyatlarının düşmesi. Muhtemelen bunun gerçekleştiğini düşünmenizin bir diğer nedeni, analitiklerin çoğunun verilere çok hızlı bir şekilde erişilebilir olmasını gerektirmesidir ve bu nedenle bellekte olması gerekir. Veritabanlarının bu verilere erişmek, sıkıştırmak, şifrelemek, depolamak için kullandığı algoritmaların bazı durumlarda bellekte bir satır olarak depolamaya devam edebileceğini unutmayın.

Bazı durumlarda, bazı veritabanları bunu sütun odaklı olarak parçalayabilir ve bunu yapmanın nedeni, satır sırasına göre sütun sırasına göre saklayarak 11 ila 12X civarında bir yerde çok daha yüksek bir sıkıştırma düzeyi elde etmeleridir. Bu ilk olarak SQL Server 2014'te ortaya çıktı, buna “Hekaton” adı verildi. SQL Server 2016'da radikal bir şekilde artırıldı, bazı farklı isimlerle referans aldığını görecekler ve Oracle 12c'de çıktı; Burada ikinci sürüm diyorum, R2 değil. Oracle 12c'nin iki farklı sürümü vardı, 12.1.0.1 ve 12.1.0.2. Bu, veritabanının R1 sürümünün ikinci sürümüdür.

Ve onu tanımladığınız şekilde, bellek içi nesne her iki veritabanında da benzerdir. Burada sağ üst köşede görebilirsiniz, bir SQL Server oluşturuyorum ve bellek optimize edilmiş ve dayanıklılık sadece şema ile diyor görebilirsiniz. Tüm bu sözdizimi anlamlarının üzerinden geçmeyeceğim ve Oracle'da aslında daha da basit, sadece bir tabloyu değiştirip bellek içi ya da değil deyin ve bunu değiştirebilirsiniz. Bugün bellekte olduğunu söyleyebilirim ve yarın değil ve bu yüzden çok esnek.

Bellek içi tablolarla Oracle üzerinde bazı testler yaptım, orada üst sıradaki yaklaşık 40 dakika süren testler yaptım. Şimdi önemli olan en alt iki sıraya geldiğimde, çalışma zamanını arttırdım veya azalttım, söylemeliyim, yaklaşık beş dakikaya kadar ve sıkıştırma faktörüne baktığımda, bellekteki veriler aslında 3.6 idi 4.6 kat daha küçük. Bu önemli çünkü bu durumda sütun odaklı format ve sıkıştırma kullanıyordum. Ve tahmin edin ne oldu? Aslında hafızamda neredeyse dört ila beş kat daha fazla veri uyuyordu. Sadece bellek içi avantajı değil, sütun odaklı avantajı değil, aynı zamanda bellek önbelleğinde beş kata kadar daha fazla veri avantajı elde ettim, bu oldukça güçlü bir teknik. Yine Oracle ve SQL Server, bunlara bakmak istiyorsunuz, gerçekten harika özellikler. Ve bence, bunu sorulara açacağım.

Eric Kavanagh: Eh, Bert, her şeyden önce bu harika eğitimde çok bencilsin. Bir dakika ne yaptýđýn hakkýnda konuţabilir misin? Çünkü bahsettiğiniz şeyi kolaylaştıracak bir teknolojiniz var. Bir dakika için ne yaptığınız hakkında konuşun ve sonra Dez ve Robin'i buradaki denkleme indirelim.

Bert Scalzo: Evet, IDERA adlı bir şirkette çalışıyorum. Texas'tayız, merkezi Houston'dayız ve şu anda Austin'de oturuyorum ama Dallas'ta yaşıyorum. Veritabanı araçları üretiyoruz ve sorunları çözmenize yardımcı olacak veritabanı araçları yapıyoruz. Bu sorun üretkenlik kadar basit bir şey olabilir, bu durumda veritabanı yönetim görevlerinizi yapmanızı sağlayan DBArtisan adlı bir aracımız var ve 12 farklı veritabanı platformunu yönetmenize izin veren bir araçtır. SQL Server'ı yönetebilirim, Oracle'ı yönetebilirim, MySQL, DB2, Postgres'i yönetebilirim ve bir araç, bir yürütülebilir, bir GUI tasarımı ve bir tutarlı iş akışı kümesi kullanıyorum. Ayrıca uyumluluk için araçlar yapıyoruz, uyumluluk ihtiyaçlarınızı karşılamanıza yardımcı olacak SQL Uyumluluk Yöneticisi adlı bir aracımız var. SQL Security adlı başka bir araç, bu yüzden etkili ve verimli olmanıza yardımcı olacak araçları yapmaya çalışıyoruz ve web sitemize giderseniz gerçekten güzel olan şey var, orada bir sürü ücretsiz yazılım var, bu yüzden başka bir şey yoksa git - Sanýrým 20 veya 25 serbest zamanýmýz var. Bir SQL Server ve bir Windows Yardım Kontrolü var gibi sadece gerçekten iyi şeyler var ve sadece temelde neye sahip olduğunuza bakacak ve size sorunlarınız veya şeyleriniz olup olmadığını söyleyecek ve tamamen ücretsiz.

Eric Kavanagh: Ve sen gerçekten biraz …

Bert Scalzo: Kesinlikle ilk şeyler-

Eric Kavanagh: Bugün piyasadaki heterojenlikten bahsediyorsunuz, eskiden 2005'te Dr.Michael Stonebraker ile görüşürken hatırladığım bir tür herkese uyan bir denklem vardı. büyük bir itme sütun odaklı veritabanı hareketi hakkında konuştu ve tek bedene uyan ilişkisel modelin uzun yıllar boyunca nasıl egemen olduğu hakkında konuşuyordu ve her şeyin değişeceğini tahmin ediyordu ve oğlan haklıydı söyledi. Şimdi çok farklı seçenekler ve fırsatlarla gerçekten çok çeşitli ve ilginç bir ortama sahibiz, ancak bunların hepsini yönetmek için birine ihtiyacınız var ve bana öyle geliyor ki, şirketiniz matematik problemlerini çözmeye oldukça akut bir şekilde odaklanmış, böylece heterojenlik başlığı, değil mi?

Bert Scalzo: Kesinlikle. Demek istediğim her zaman “GUI aracı kullanmak istemiyorum, her şeyi betiklerle yapıyorum” diyen DBA'lar olacak. Süpermen tipi DBA olduklarını düşünüyorlar ve bu iyi ama çoğu insan için sadece iş yapmak istiyoruz ve - biliyorsunuz, Microsoft Word'ü belgelerimi yazmak için kullanıyorum. E-postamı yapmak için Microsoft Outlook kullanıyorum. Demek istediğim, görevler için araçlarım var. Aynı tür bir konsept geliştiriyoruz, veritabanı yöneticileri ve geliştiricileri için, ne yapmak istediklerine değil, ne yapmak istediklerine odaklanmalarına yardımcı olacak araçlar geliştiriyoruz.

Eric Kavanagh: Bu mantıklı, ama sizi uzmanlarımıza teslim edeyim ve insanlar dalış yapmaktan çekinmeyin. Seyircilerden gelen birkaç yorumumuz var. Belki Dez, birkaç soru ve Robin birkaç soru?

Dez Blanchfield: Tabii. Size atmak istediğim ilk sorulardan biri, sahip olduğunuz muazzam deneyim süresi göz önüne alındığında, bunların herhangi birinin yavaşlayacağı yakında bir nokta görüyor musunuz? Yoksa gerçekten sürekli bu değişim çizgisinin giriş noktasında olduğumuzu düşünüyor musunuz? Sanırım şirketlerin karşılaştığı en büyük sorunlardan biri ve daha sonra her zaman bu şirketlerin işlerini yürütmeleri için sağlanan teknolojiyi desteklemeye çalışan insanlar, değişim oranının o kadar dramatik olduğu, farklı özellikler, yazılımlar, sistemler, çerçeveler, mimariler ve yeni kodlar ortaya çıkıyor ve ardından bunun altındaki donanım, mevcut değişim oranının hemen yavaşladığını görüyor musunuz? Demek istediğim, tüm IDERA süitiyle bu kadar geniş bir platform yelpazesiyle ilgileniyorsunuz, yakında yavaşlayacak mıyız yoksa bu çılgın kaçak yük treninde uzun süre mi çalışacağız?

Bert Scalzo: Sanırım bu büyüme eğrisinin ilk yüzde 20'sindeyiz ve gidecek çok yolumuz var ve onu iten iki şey var. Teknoloji gelişmeye devam ediyor. Çıkacak yeni bellek türlerinden bazılarından bahsettiniz, bu harika olacak. Samsung yakında çok yakında 20 terabaytlık bir flash sürücüye sahip olacak. Bu bir şeyleri değiştirecek. Tüm bu NoSQL ve bulut veritabanlarına sahibiz, bu sadece devam edecek. Komik olan tek şey, Oracle ve SQL Server gibi veritabanlarına ve diğerlerinden bazılarına baktığımda, artık gerçekten ilişkisel veritabanları değiller. Yapılandırılmamış verileri Oracle'a koyabilir ve yine de ACID uyumluluğunu koruyabilirim. Bana 20 yıl önce söylemiş olsaydın, sadece uyuşturucu kullandığını söylemiştim.

Dez Blanchfield: Evet, evet, havalılar . Eh, şimdi bile GIS gibi oldukça güzel niş dikeylere sahip olan motorlar, şimdi yerel kapasiteden daha iyi. DBA'ların karşılaştığı zorluklar ve yer çevresinde görmeyi umduğumuz farklı DBA zamanları hakkında harika yorumlar yaptınız, ancak dünya, uğraştığınız işin bu katmanına nasıl benziyor? Demek istediğim, bunlar teşhis yöneticinizden, envanter araçlarına ve birleştirme işlemine kadar farklı platformları kullanan insanlar, DBA'lar bu değişiklikle nasıl başa çıkıyorlar ve nasıl?, peyzajlarındaki bu önemli değişimle başa çıkmak için araçlarınızla ne yapıyorlar?

Bert Scalzo: Neredeyse 20 yıl önce geri döneceğim, o zaman DBA'ların bir organizasyonda çok özel bir rolü çözdüklerini söyleyeceğim. Genellikle bir veritabanı platformuyla, belki iki tanesiyle çalışırlar ve nispeten az sayıda veritabanını yönetirler. Şimdi bugün ve veritabanı yöneticisine hızlıca, aslında 10 veritabanı platformunu tanıyacak. O yönetiyor ve bu şaka değil, bazı durumlarda binlerce veritabanı; bu daha çok SQL Server dünyasında veya MySQL dünyasında. Ama yine de Oracle dünyasında yüzlerce veritabanını yönetiyor olabilirler. Ve böylece tüm bu yeni özellikler ortaya çıkıyor, tüm bu yeni platformlara sahipler ve sorumlu oldukları tüm bu veritabanlarına sahipler. Verimliliklerini sağlayacak ve aynı zamanda bazı şeyleri öğrenmelerine yardımcı olacak araçlar arıyorlar.

Ve size bir örnek vereceğim - bir tabloyu bölümlemek istersem oldukça belirsiz bir sözdizimi ve eğer alt bölümlere ayırmak istersem sözdizimi daha da zorlaşır. Ne yapmak istediğimi biliyorum, kovalar oluşturmak istiyorum. DBArtisan gibi, “Hey, işte nasıl yapmaya çalıştığınız yerine yapmaya çalıştığınız şeye konsantre olmanızı sağlayan güzel bir ekran var ve bu arada, İşiniz bittiğinde SQL düğmesini gösterin, size SQL'in ne olduğunu gösterelim, böylece bunu gerçekten öğrenmeye ve ustalaşmaya başlayabilirsiniz. ”

DBA'lar işlerini yapmalarına yardımcı olan ancak aynı zamanda kullandıkları tüm bu yeni şeyleri öğretmelerine yardımcı olan araçları buluyorlar ve aynısı doğru olacak - diyelim ki ben bir Oracle adamıyım ve MySQL'e gidiyorum ve diyorum ki, “Tamam, bir veritabanı oluştur, DBArtisan. Şimdi bana SQL'i göster çünkü MySQL'de bir veritabanı oluşturmanın nasıl bir şey olduğunu merak ediyorum ve ben sadece sözdizimini öğrenmeyi öğrendim. ”Ve bu yüzden onlara sadece veritabanında çalışmalarına yardımcı olmakla kalmıyor, aynı zamanda veritabanında da eğitiyoruz.

Dez Blanchfield: Daha modern - ya da daha modern olmayan bazılarına çıktığınızda daha da ilginç hale geliyor, bu adil bir şey değil - ama bir zamanlar bir veritabanı bir veritabanıdır. Bu günlerde, geleneksel olarak satıcılardan gördüğümüz teknolojinin istiflediği ve bunun içine bir çeşit açık kaynak ve ayrıca iyi olduklarının ek zorluklarıyla orada bahsettiğiniz her şeyi görüyorum. Sadece veritabanı motorları ve sorgu dilleri ile uğraşmakla kalmaz, aynı zamanda çok tipli bir HDFS spektrumunun uzak ucundan her şeyle uğraşmak zorunda kaldığınız veri türleriyle, yapılandırılmış ve yapılandırılmamış olarak da uğraşırlar. küçük kaplar ve paket dosyaları ve çeşitli günlük dosyası formatlarına ortam.

Ve bence şu an bir şey görüyoruz ki, sadece ne kadar insan yok, ne kadar bir süpermen, süper kadın, ne düşünürlerse düşünün, fiziksel olarak, bu değişim oranıyla zihinsel olarak başa çıkamazlar ve varyasyon ölçeği. Sanırım şimdi sunduğunuz araç paketi, varsayılan olarak birçok şekilde olacağı bir noktaya gelecektir, böylece onlar olmadan sahip olduğumuz veritabanı ortamlarını çalıştıramayacağız çünkü sadece fiziksel olarak O kadar çok cesedi onlara atamazsın. Sunumundan gerçekten keyif aldım. Dr. Robin Bloor'a geçeceğim, eminim size de atması gereken birçok soru var.

Robin Bloor: Tamam. Kesinlikle sorularım var. Bert, nereye gittiğini bilmiyorum - birkaç gün önce birinin bana en son DU veri korumasını anlatmaya başladığı gerçekten ilginç bir konuşma yaptım ve bana inanılmaz bir şey olduğunu söyledikleri şeyden gibi geldi ısrar ettikleri şeyler açısından. Buna gerçekten bakıp bakmadığınızı merak ettim; aşina olduğunuz bir şey mi?

Bert Scalzo: Kesinlikle. Evet.

Robin Bloor: 2016, tamam, bize anlatın.

Bert Scalzo: Ve aslında--

Robin Bloor: Çok ilginç.

Bert Scalzo: Aslında bir süre bir flash satıcısı için çalıştım, veritabanı alanlarında veritabanları için flash ürünler oluşturmalarına yardımcı oldum ve size acımasızın tamamen aşağı gittiğini söyleyebilirim. Demek istediğim, bir slaytımı hatırlarsanız, bazı veritabanlarında şifrelemeyi yapacağını söyledim, ancak sunucu belleğine koyar ve bazı veritabanlarında şifrelemeyi korur - hala sunucu belleğinde şifrelenir, yalnızca şifresi çözülürse müşteriye gönderilir. Ayrıca bu hükümet standartlarından bazıları, özellikle ABD'de Savunma Bakanlığı veya askeri burada, flaş seviyesine kadar iniyorlar ve sadece şifreleme ve şifre çözmeyi desteklediğinizi bilmek istemiyorlar. ama eğer birisi fişleri çaldıysa - bilirsiniz, bunları sunucunuzdan çıkarırsınız, orada ne var şifreli ve böylece depolamaya sahip olsalar bile olamazlar ve gerçek yoldan aşağıya doğru - flaş parçasının kendisine değil, ayrı çiplere kadar. Bu çipi çiple bilmek istediler, her şey şifrelenmişti.

Robin Bloor: Vay canına. Demek istediğim bir çok şey var - biliyorsunuz, bence bu konuda ortaya koyduğunuz sadece bir veya iki slayttı, ama gerçekten ilginç olduğunu düşündüğüm bir şeydi. Örneğin, bilginin düzeltilmesi, sadece çeşitli alanları maskelemekten biraz zekice olmak zorunda çünkü özellikle bugünlerde makine öğrenimi ile, daha önce yüzeye çıkamayacağınız bilgileri ortaya çıkarmanızı sağlayan tümdengelimli şeyler yapabilirsiniz.

Korunmaya çalışıyorsanız, sağlık bilgilerini söyleyelim, o zaman ABD'de sağlık bilgileri ile ilgili çok, çok acımasız bir kuraldır, ancak aslında çeşitli makine öğrenme tekniklerini kullanarak, birisinin tıbbi bilgilerinin kim olduğunu genellikle öğrenebilirsiniz. aslında. Bunun hakkında söyleyecek bir şeyiniz olup olmadığını merak ettim çünkü hepsi bunun ilginç bir alan olduğunu düşünüyor.

Bert Scalzo: Evet, kesinlikle ve bunu sadece örnek olarak kullanıyorum, bir veritabanının diğerinden daha iyi olduğunu söylemeye çalışmıyorum, ama bu sadece sorduğunuz şey için çok iyi bir örnek. Oracle'da, örneğin John Smith tıbbi kaydını görmeme izin verilmediği gibi, bir veri satırı görmeme izin verilmiyorsa. Oracle'da, “Bu kaydı seç” dersem, engelleneceğim, ya da ne görmeme izin verileceğime izin verilecek ve redaksiyon yapılacak. Ve "John Smith'e eşit olan tablodan hesap yıldızı seç" dersem, sıfıra ulaşacağım.

SQL Server'da redaksiyon yapabilir, ancak bazı delikleri vardır. “John Smith'e eşit olan tablodan hesap yıldızı seç” dersem, aslında bir tane alırım, bu yüzden bir John Smith olduğunu biliyorum. Biri diğerinden daha güvenlidir. Şimdi bunu düzeltmelerini bekliyorum, hep birbirleriyle sıçrayan kurbağa oynuyorlar. Ve yine, bir örnek göstermek dışında veritabanları arasında ayrım yapmaya çalışmıyorum - şu anda ne konuştuğumuza bakın, teknik olarak seçili hesap kadar basit bir şey de redaksiyon tarafından kesilmelidir konuşursak, sıranın varlığı dışında hiçbir şey düzeltilmez.

Robin Bloor: Evet, doğru. Bu biraz ilginç. Yani, başka bir genel soru, çünkü çok fazla zamanım yok, gerçekten sadece iyileştirmelerle ilgili. Demek istediğim, bize çalıştırdığınız çeşitli test sonuçlarının örneklerini gösterdiğinizi bildiğiniz bir yerde bulunuyorsunuz - geleneksel veritabanlarının onlara baskın veritabanları, SQL Server ve Oracle diyelim mi? tamamlanmadan önde kalacaklarını mı düşünüyorsun? Yoksa pazarda gerçekten onlar için çalışan çeşitli aksaklıklardan biri ya da diğeri tarafından yakalanacaklarını mı düşünüyorsunuz? Senin düşüncen nedir?

Bert Scalzo: Bir fikrim var ve bu - bilirsiniz, yine benim fikrim diyeceğim - Microsoft, örneğin, Ballmer sonrası dönemde benden yaşayan cehennemi etkiliyor. Yani bu streç veritabanı Linux üzerinde SQL Server almak, Linux üzerinde .NET almak, Linux üzerinde PowerShell almak; Geleneksel veritabanı satıcılarının geride kalacağını sanmıyorum. Bence karar verdiler, “Hey, yeni adamlar, yeni başlayanlar bir şeyler tanımlasın. Parçalamanın ne olduğunu ve nasıl mükemmelleştirilmesi gerektiğini bulsunlar ve tüm araştırma ve geliştirmeleri yaptıktan sonra, kullanıcıların tam olarak ne istediğini biliyoruz, şimdi Oracle'a parçalama ekleyelim. ”Bence sadece akıllı oluyorlar ve “Hey, hakim oyuncu olduğunuzda ikinci veya üçüncü olmak kötü değildir, çünkü o zaman insanlar sizden göç etmezler.”

Robin Bloor: Evet, yani kullanılan bir strateji. IBM demek istediğim, bütün bunları ürün yelpazelerinin tamamı için yapıyordu ve birileri hiç kimsenin aklından hiç çıkmadığı tamamen duvarın dışında bir şey ortaya çıkana kadar makul bir şekilde iyi sonuç veriyor, ama planlayamazsın buna karşı.

Seyirciden sorular, Eric?

Eric Kavanagh: Evet, ama bence sadece biri için zamanın var ve Bert'in kaçması gerektiğini biliyorum. Burada bir şey vardı - tamam, Oracle 12c'deki parçalayıcı mimari bir göstergedir - ya da sizin fikrinizde bir göstergenin ne olduğunu, orada ne olduğunu düşünüyorsunuz?

Bert Scalzo: Oracle, diğer tüm veritabanı satıcılarının sahip olduğu her şeyi emiyor ve / ve sunuyor. Örneğin, yapılandırılmamış verileri Oracle'a koyabilirim. Nasıl yapılandırılmamış veri koymak ve sonra ilişkisel bir veritabanı olarak adlandırmak bilmiyorum, bu yüzden mantıklı değil, ama yapabilirsiniz. Ve şimdi Oracle kırma ekliyor, bu yüzden Oracle, “Biliyor musun? Pazar ne isterse, veritabanı teklifimizi yapacağız çünkü pazar pazarın istediklerini istiyor ve çözümü sunmak istiyoruz, onların bizimle kalmasını istiyoruz. ”

Sanırım ek öğeler göreceksin. Bir Oracle rafında veya gerçek uygulama kümesinde değil, temelde bu parçalamayı yapan geleneksel Hadoop tipi kümelemede veritabanı düğümlerinin Hadoop benzeri kümelemesini görmekten şaşırmazdım. Sanırım Oracle gibi bir veritabanını Hadoop gibi dağıtabileceksiniz ve bu tür trendler devam edecek. Bu büyük veritabanı satıcıları, milyarlarca dolar kazanıyorlar ve pazarlarını kaybetmek istemiyorlar, bu yüzden herhangi bir şeye uyum sağlamaya ya da herhangi bir şeyi benimsemeye hazırlar.

Eric Kavanagh: Biliyorsunuz, komik, çünkü açık kaynak satıcılarını bir süredir takip ettim ve tüm bunları merak ettim, ancak geleneksel kapalı kapılar teknolojisi ve bir süredir ne kadar büyük bir etkisi olacak açık kaynaklı satıcıların ciddi bir ilerleme kaydettiğini hissettim ve şimdi pazara baktığımda, ne dediğini görüyorum, büyük adamların matematiklerini yaptığını, kalemlerini keskinleştirdiğini ve nasıl olduğunu anladılar bu şeylerin çoğunu mimarilerine örtebilirler. IBM ya da Oracle ya da SAP olsun - geçen ay sadece SapphireNow Konferansı'ndaydım ve bu şirketin yarısını yöneten Steve Lucas, SAP'nin artık HANA bulut platformlarına, diğerlerinden daha açık kaynaklı bileşenlere dahil olduğunu övünüyor rakipler. Bu konuda matematik yaparsanız, oldukça etkileyici bir ifade ve bana büyük adamların yakın zamanda hiçbir yere gitmeyeceklerini söylüyor.

Bert Scalzo: Hayır, her ikisine de paramı yatırırdım . Yani, bakarsanız, Microsoft'un hisseleri son zamanlarda yaklaşık 50 $ idi ve bilirsiniz, sadece birkaç yıl önce 25 yaşındaydı. İyi şeyler yapmadıkça stok fiyatınızı kısa sürede iki katına çıkarmazsınız ve Windows 10'dan ilk yıl için ücretsiz olmaktan yaptıkları diğer tüm akıllı şeylere kadar her şeyi yapmaktan, bence bu streç veritabanı özelliği olağanüstü. Bence olacaklar, bir çok insanın Azure'a gidecek olması, doğrudan değil, dedikleri gibi değil, “Veritabanımı Azure'a taşıyalım.” Bu sihirli bir şekilde göç edecek çünkü arşivlenecek orada bu yeni streç veritabanı özelliği kullanarak ve böylece Azure benimseme sadece skyrocket olacak.

Eric Kavanagh: Bu pazarda görebildiğim, hatta Mac'inizdeki trendlerden biri. Bazı dokümanları kaydetmek için Mac'inize gittiğinizde, bunlar şimdi - ve yeni Mac'ler buluttan geçiyor, değil mi? Demek istediğim, bu stratejide çok fazla anlam var ve ben de ona bakıp gidiyorum, “Tamam arkadaşlar, beni bulut ortamınıza parça parça çekmeye çalışıyorsunuz, ve sonra bir gün film izlemek istediğimde kredi kartımın süresi doldu Başım belada olacak. ”

Bert Scalzo: Evet, ama Facebook'ta yapıyorsun.

Eric Kavanagh: Evet. Bu doğru.

Bert Scalzo: Her şeyi Facebook'a koydunuz.

Eric Kavanagh: Pekala, her şey değil.

Bert Scalzo: Hayır, yani-

Eric Kavanagh: Evet, devam et.

Bert Scalzo: Bu sosyal trendler işletmelere ulaşıyor. Şimdi işletmelerin hala yapmaları gereken birçok şey var, ancak bu eğilimleri görüyorlar ve aynı şeyleri yapıyorlar. Oracle veya Microsoft'un gittiğini görmüyorum. Aslında, her düşüşte hisse senedi satın alacağım.

Eric Kavanagh: Evet, gerçekten. Millet, idera.com, IDERA dot com adresine gidin. Bert'in dediği gibi, orada bir sürü ücretsiz şey var ve pazardaki yeni trendlerden biri - size oynamak için bazı ücretsiz şeyler verin, bağlantınızı alın ve sonra gerçek şeyleri satın alın.

Millet, bu başka bir Sıcak Teknoloji oldu. Bugün zaman ayırdığınız için teşekkürler Bert, tabii ki Dez ve Robin de. Gelecek hafta seninle konuşacağız, millet, bir sürü şey oluyor. Herhangi bir fikriniz varsa, kendinize e-posta göndermekten çekinmeyin. Sizinle bir dahaki sefere konuşacağız, kendine iyi bak. Güle güle.

İleri momentum: ilişkisel olanın gelenekselin ötesine taşınması