Teknoloji, hem fiziksel hem kuramsal boyutuyla hayatı kolaylaştırıyor. Hayatı kolaylaştıran teknolojilerden biri de ses tanıma teknolojisi. Peki, ses tanıma teknolojisi nedir, nasıl kolaylık sağlar? Bu yazımızda ses tanıma sistemi hakkındaki detaylara değiniyoruz.
Parmak izi, retina, kulak şekli gibi fizyolojik ölçütler, fiziksel saldırı haricinde kaybolması ve unutulması olasılığı bulunmadığı için doğrulama yöntemi olarak kullanılıyor. Bu eşsiz ölçütlerden biri olan ses tanıma sistemi giderek daha fazla alanda karşımıza çıkıyor. Bu teknoloji son yıllarda popüler hale gelse de geçmişi 1960’lara uzanıyor. Gelecekte ise standarda dönüşme potansiyeli taşıyor.
Ses tanıma nedir?
Teknolojideki büyüme durmaksızın devam ediyor. Bunun örneklerinden biri olan ses tanıma, gündemimizde önemli yer kaplıyor. Ses tanıma nedir sorusunun yanıtına gelirsek, aslında ses tanımayı bir bilim olarak ifade edebiliriz. Bu bilim, konuşulan dilin metne dönüşmesini sağlayan metot ve teknolojileri geliştiriyor.
Ses tanıma algoritması, iki şekilde karşımıza çıkıyor: Automatic Speech Recognition(ASR) ve Speech ToText (STT). Bu algoritmaları şöyle açıklayabiliriz:
- Automatic Speech Recognition(ASR): ASR, Türkçede otomatik ses tanıma olarak karşılık bulunuyor. Seslerin, donanım tabanlı teknikler ve yazılım tabanlı teknikler kullanılarak tanımlanması ve işlenmesini ifade ediyor.
- Speech ToText (STT): STT, Türkçede sesi metine dönüştürme olarak karşılık buluyor. Seslerin bilgisayarlar tarafından metine dönüştürülmesi anlamına geliyor.
Ses tanıma teknolojisi modelleri de kendi içinde ikiye ayrılıyor. Türkçede saklı Markov modeli olarak karşılık bulan HiddenMarkov Model(HMM), istatistiksel bir model olarak kullanılıyor. Dynaamic Time Warping(DTW), yani dinamik zaman eğrisi, zaman serileri analizini yapabilmeyi sağlıyor.
Ses tanıma teknolojisi hakkında yaptığımız tüm bu tanımlamalar, matematiksel bir sisteme işaret ediyor. Elbette bu sistemin bazı handikapları da bulunuyor. Fondaki gürültü düzeyi, aksan ve tonlama farklılığı zorluk çıkarabiliyor.
Ses komutuyla yönetilen ürünler
Türkiye’nin öncü e-ticaret sitesi GittiGidiyor, ses komutuyla yönetilen ürünlere ev sahipliği yapıyor. İşte, o ürünlerden bazıları:
- Akıllı telefon
iPhone’la hayatımıza giren sesli asistan hizmeti, ses tanıma işlevinin bir mobil cihazda çalışabileceğinin kanıtıydı. iOS 14 işletim sistemiyle gelen ses tanıma işlevi, büyük kolaylık sağlıyor. Sesler ağlayan bebek, araba kornası, elektrikli alet, akan su şeklinde filtrelenebiliyor. iOS 14’ün ses tanıma özelliğinin benzerini Google de Android için çıkardı. Bu özellik özellikle de işitme problemi yaşayanlar için avantaj sağlıyor.
- Televizyon
Smart özellikleri taşıyan 4K TV’ler ses tanıma teknolojisiyle geliyor. Örneğin, son çıkan smart TV modellerinden biri olan LG Smart LED TV, AI ThinQ yapay zeka teknolojisi ile güçlendirilmiş. Cihaz, Türkçe akıllı ses tanıma fonksiyonuyla segmentinde öne çıkıyor.
- Akıllı hoparlör
Bluetooth hoparlör modelleri, karmaşık kablo görüntüsünden kurtarıyor. Ses performansıyla da fayda sağlıyor. Bu cihazların asistan özelliğine sahip olanları, sesli komutla kulanım imkânı tanıyor. Örneğin, “bugün hava nasıl” sorusuna yanıt verebiliyor.
- Akıllı saat
En popüler giyilebilir teknoloji ürünlerinin başında gelen akıllı saatler, sesli asistan desteğiyle daha işlevsel hale geliyor. Örneğin, Google Asistan desteği sunan bir akıllı saat, Google Translate ile , yabancı dilde basit cümleler kurmaya yardımcı oluyor.
- Akıllı buzdolabı
Gelişen teknolojiyle birlikte buzdolapları da akıllı hale geldi. Bazı modeller sesli asistan desteğiyle çok daha işlevsel hale geldi. Örneğin, CES 2021 İnovasyon Ödülleri’nde “En İyi İnovasyon Ödülü”nü kazanan LG InstaView buzdolabı, sesli komutla açılıyor.
Sesinizle yönetip hayatınızı daha kolay hale getirebileceğiniz ürünlere GittiGidiyor avantajlarıyla sahip olabilirsiniz. Sesinizle yönetebileceğiniz son teknoloji bir telefona ihtiyaç duyuyorsanız seçiminizi yapmadan önce iPhone 13 Ailesi [Ön İnceleme] yazımızı okumanızı öneririz.