Ev Yazılım Ses tanıma teknolojisi: yararlı mı yoksa acı verici mi?

Ses tanıma teknolojisi: yararlı mı yoksa acı verici mi?

İçindekiler:

Anonim

Hiç yardım almak veya faturanızı ödemek için bir şirketi aradınız mı, sadece sizinle sohbet etmek isteyen hoş bir kayıtlı sesle karşılaşacaksınız - ama söylediklerinizin yarısını anlayamıyor musunuz? Ya da belki bir iPhone'unuz vardır ve Siri ilk kez iyi bir müttefik gibi görünse de, bazen (Tamam, dürüst olalım, çoğu zaman) onu anlamadığını fark ettiniz mi? Konuşma-metin olarak da bilinen ses tanıma teknolojisi (VRT) ortak bir tuzağa düşüyor: inanılmaz derecede serin olma potansiyeline sahip (ve oğlan, bunun için kök salıyoruz), ancak daha sıklıkla, diş taşlama hayal kırıklığı içinde egzersiz.


Bir zamanlar bilim kurgu alanına ait bir fikir olan ses tanıma, 1950'lerde bebeklik döneminden, Bell Laboratories Audrey sisteminin tek bir sesle konuşulan rakamları tanımak için tasarlandığı, şimdi etkileşim kurduğumuz modern elektronik elektronik ağına kadar büyüdü. günlük olarak - karışık sonuçlarla.

Bir İnsanla Konuşmak İçin Lütfen 0'a Basın

Günümüz işletmelerinin çoğu, müşteri hizmetleri çağrılarını yönetmek için etkileşimli sesli yanıt (IVR) adı verilen sistemleri kullanmaktadır. En yaygın kullanım sesli navigasyon menüleri içindir, ancak bazı şirketler müşteri hesap bilgilerine erişebilen ve küçük soruları cevaplayabilen IVR sistemleri kullanır. Menü IVR yazılımı genellikle "evet", "hayır" ve sayılarla sınırlandırılabilen sınırlı bir kelime dağarcığına sahiptir. Daha karmaşık sistemler, şirkete özgü kelimeleri ve kelime öbeklerini tanıyabilir.


Bu sistemler - en azından işletmeler için - basit bir nedenden dolayı daha popüler hale geliyor: maliyet-etkin. Wall Street Journal tarafından yayınlanan 2010 tarihli bir rapora göre, bir müşteri temsilcisine ulaşan tipik bir müşteri çağrısı 3 ile 9 dolar arasında değişirken, otomatik bir sistem üzerinden yapılan bir çağrı yalnızca beş ila yedi sente mal oluyor. Ve elbette, bilgisayar programları yorulmuyor, hastalanmıyor veya müşterilerle hayal kırıklığına uğramıyor (müşteriler kesinlikle onlarla hayal kırıklığına uğruyor!).


Neyse ki, bu her zaman IVR'nin işleri insanlardan uzaklaştırdığı veya en azından tüm insanların çağrı merkezlerinden kaybolduğu anlamına gelmez. Sesle etkinleştirilen bu yardımcılar, çağrıları yönlendirerek ve basit soruları yanıtlayarak insan müşteri hizmetleri temsilcilerinin daha verimli olmalarını sağlar.


Elbette bu teknolojilerle etkileşime giren insan kullanıcıları için her zaman sorunsuz yelken değil. Teknoloji, IVR teknolojisinde aksanlarla ilgili sorunlar gibi yaygın sorunların iyileştirilmesine yardımcı oluyor, ancak otomatik sistemlerin görevden alınması hala yaygın bir tema. IVR sistemlerindeki arızaların üretebileceği hayal kırıklığını vurgulayan ses tanıma özelliğine sahip bir asansör hakkındaki bu komedi skeçine göz atın.

Kişisel Telefon Uygulamaları: Siri, Google Asistan

Çoğu kişi akıllı telefonlar için ses tanıma özelliğine sahiptir. En son telefon modellerinin çoğunluğu VR ile birlikte gelirken, Apple 2011'de iPhone 4S için hafif alaycı, sesle aktive edilen "kişisel asistan" Siri'yi tanıttığında popülaritesi ve notoriety şişti. Google yakında doğrudan bir rakip yarattı: Google Şimdi Android Jelly Bean OS için. Her iki sistemde de kadın sesleri ve kullanıcıların rahat dilini kullanarak telefonlarıyla "konuşmalarını" sağlayan gelişmiş tanıma özellikleri bulunur.


Ancak bu sistemler öncekilerden çok daha karmaşık ve işlevsel olmakla birlikte, teknolojinin hala daha uzun bir yolu olduğunu gösteriyor. Siri'nin başarısızlığıyla ilgili şakalar popüler bir İnternet memesi haline geldi. Hatta bir adam, Apple'ın Siri'nin yetenekleriyle ilgili yanlış reklamlar için dava açtı.


Belki de bu yüzden Apple Siri'yi gelişmiş ve bilgilendirici olmak için yaratırken, VR yazılımı da sassy tarafında biraz. Örneğin, 1968 filminden "2001: A Space Odyssey" - "bölme kapılarını aç" filminden sinema tarihinin en meşhur istihbarat teknolojisi hatlarından birini konuşursanız - Siri, filmin cevaplama çizgisiyle yanıt verecektir " Üzgünüm (adınız), korkarım bunu yapamam "ya da daha alaycı, " biz istihbarat ajanları bunu asla yaşamayacağız. "


Sizi adıyla aramak, Siri'yi sevmeyi kolaylaştıran işlevlerden sadece bir tanesi ve biraz daha insan. VR asistanı, herhangi bir şeye dokunmaya gerek kalmadan arama yapmak, dikte almak ve metin göndermek, bilgi için İnternet aramaları yapmak, yakındaki mağazaları bulmak, yol tarifleri vermek ve daha fazlasını yapmak için sesli komutları takip edebilir. Cevaplar aynı anda telefon tarafından söylenir ve ekranda görüntülenir.


Android Jelly Bean platformunun VR kısmı Google Asistan, Siri'ye çok benziyor. Sistem, sıradan konuşmayı kullanıcıların arama yapmasına, metin göndermesine, arama yapmasına, hesaplamalar ve dönüşümler yapmasına, kelime tanımlarını almasına, alarmları ayarlamasına, şarkı çalmasına ve harita ve yol tarifleri almasına izin veren komutlara çevirerek aynı kapsamlı tanıma özelliklerini sunar.


Siri ve Google Asistan gibi kişisel ses yardımcılarıyla, avantajları açıktır. Arama ve mesajlaşmadan arama ve eğlenceye kadar her şey daha hızlı ve daha kolaydır. Ne istediğinizi söyleyin ve (çoğu zaman) VR uygulaması sizin için yakalar. VR'nin hands-off teknolojisi sürüş sırasında özellikle yararlıdır. Birçok kişi Siri'nin kusurlarını çözerken ve yazarlar Google Asistan'ın esasen kullanıcıların hayatlarını yönetme yeteneğinin hem ürkütücü hem de hakaret ettiğini savunurken, çoğu insan hala bu fütüristik teknolojilerin oldukça havalı olduğunu düşünüyor.


Tabii ki, Siri ve Google Asistan gibi kişisel telefon uygulamaları mükemmel olmaktan uzak - bu teknolojinin gelecekte nereye gidebileceğini gösteriyor olsalar da. Bu, Siri yanlış bir cevap bulsa bile, bir sonraki versiyonun çok daha iyi olacağını bilerek ona gülüp affedeceğimiz anlamına gelir.

VR Nereye Düşüyor

Bir işletmeyi aradığınızda bir IVR ile karşılaşırsanız, iletişimin önündeki bazı engelleri fark etmiş olabilirsiniz. Bazı programlar kelimeleri yanlış yönlendiren ve anlaşılmasını zorlaştıran robotik bir metin-konuşma sesi kullanır. Diğerlerinde, yazılımın çok yüksek, çok yumuşak veya dikkatlice duyurmuyorsanız söylediklerinizi işleyememesine neden olan hassasiyet sorunları vardır.


Buna ek olarak, birçok insan hala bir makineyle konuşmaktan rahatsızlık duymuyor. IVR'de birkaç arama yaparsanız, insanların IVR sistemlerini atlamanın ve "gerçek bir kişiye" ulaşmanın yollarını bir araya getirdiği listelerle karşılaşırsınız. Bu çözümler, "bir operatör için 0 tuşuna basmaya devam et" ile "bir insanı getirene kadar makinede yemin et" e kadar değişir. Sonuç olarak, IVR sistemlerindeki son gelişmelerin çoğu, onları insanlar için daha lezzetli hale getirme etrafında dönmüştür; sesleri daha sempatik ve daha az robotik hale getirerek sistemin gezinmesini kolaylaştırır ve arayanlara her şeyin baştan sona ne kadar süreceğini bilmesini sağlar. Bu, daha iyi teknolojinin buradaki savaşın sadece yarısı olduğunu gösteriyor; diğer yarısı ise kullanıcıları bir makine ile konuşmaya çağırıyor.

Gelecekte Neler Var

Bu zorluklara rağmen, ses tanıma teknolojisi sürekli gelişmektedir. Siri ve Google Now gibi uygulamalar - kusurlar ve hepsi - performanslarında hala olağanüstü derecede etkileyici ve birçok şirket VR yeteneklerini diğer uygulamalara genişletiyor.


Örneğin, Dragon NaturallySpeaking konuşma-metin yazılımının yaratıcıları Nuance, televizyonlar ve otomobiller için ses kontrolleri zaten geliştirdi ve bu teknolojinin sürümleri bazı Samsung TV'lerine ve bazı Ford araçlarında kullanılan SYNC eğlence sistemlerine dahil edildi.


Google ve Apple, ses tanıma teknolojileri için yeni kullanımlar bulmaya devam ettikçe, televizyonlarımızdan tost makinelerine kadar her türlü günlük makineyle giderek daha fazla konuşacağız. Ve bir kez daha, bilim kurgu haklı gibi görünüyor. Bu zeki yazarların bir konuda yanıldıklarını ummak zorundayız. Bu makineler devralırsa, Siri'den "bölme kapılarını açmasını" bir dahaki sefere sorun yaşayabilirsiniz.

Ses tanıma teknolojisi: yararlı mı yoksa acı verici mi?