Érintés nélkül is minden kezelhetővé válik: a koronavírus-járvány hatása a VUI fejlesztésekre

A koronavírus-járvány alapvetően változtatta meg nem csak a társas viselkedést, de a hétköznapi tárgyak használatának módját is. Egy olyan helyzetben, amikor a különböző eszközök megérintése fertőzés veszélyével jár, az alkoholos kézfertőtlenítő gyakran meg ritkább árucikk, mint az élesztő, az emberek kétszer is meggondolják, mihez nyúljanak hozzá.

Csakhogy az okoseszközök olyan mértékben váltak az életünk részévé, hogy éppen olyan automatizmussá vált az üzenetek ellenőrzése, mint az orrvakarás. Járvány idején pedig mindkettő veszélyes lehet.

A hangalapú kezelésé a jövő

A legjobb megoldás persze az, ha úgy tudjuk a telefonunkat használni, hogy nem kell megérintenünk a képernyőt, vagy a képernyő végignyomkodása nélkül vásárolhatunk jegyet, bérletet automatából. A koronavírus egyik fő terjedési útja éppen így küszöbölhető ki az egész vásárlási folyamat során.

Ennek pedig az a legegyszerűbb módja, ha minél szélesebb körben válik lehetővé a hangalapú vezérlés, és az ezt támogató kezelőfelület, a VUI.

 

Mi az a VUI?

A VUI jelentése magyarul Hangalapú Felhasználói Felület (Voice User Interface), azaz olyan kezelőfelület, amely lehetővé teszi a felhasználók számára, hogy hang- és beszédparancsok által kommunikáljanak az adott rendszerrel.

A legismertebb példák a VUI-ra a virtuális asszisztensek, mint például az Apple által kifejlesztett Siri, a Google Segéd, a Microsoft Cortana-ja vagy a világ legnagyobb online áruháza, az Amazon által jegyzett Alexa.

 

A VUI kifejezetten hasznos megoldás

A VUI legfőbb előnye, hogy lehetővé teszi az érintés és láthatóság nélküli felhasználói módot, amellyel a felhasználók vezérelhetik a különböző eszközöket.

Az életben számos olyan helyzet és terület található, amikor a testileg ép felhasználók számára is hatékonyabb a hangalapú kezelés: ilyen általában a gépjárművezetés, vagy járvány idején a közhasználatú eszközök (például bankjegy automaták) kezelése.

 

Az érintésmentes használat már régebb óta jelen van, mint gondolnánk

Ha megkérdezünk egy átlagembert nyugaton, hogy mikor találkozott először VUI-val, valószínűleg értetlenül nézne ránk. Amennyiben viszont azt kérdezzük, hogy beállított-e hangparancsot bármelyik mobilján is, jó eséllyel azt feleli, igen, természetesen.

Már 1999-ben léteztek olyan mobilok, mint az Ericsson R380-asa, amelyeknél alapvető funkciónak számított a hang alapú tárcsázás, ám évtizedekkel korábban jelent meg a gépi beszédszintetizálás technológiája.

Ericsson R380

Egész pontosan 1936-ban kezdtek rajta dolgozni a Bell Labs munkatársai, és 1939-ben jegyezték be rá a szabadalmat. 1962-ben az IBM mutatta be a tizenhat angol szó felismerésére képes gépét, és 1993-ban az Apple dobta piacra a mindennapi felhasználóknak szánt „ős VUI”-t, a Speakable items-et.

Azóta pedig a technológia elképesztő fejlődésen ment át – a mostani covid-19-járvány pedig még nagyobb lökést adott az innovációnak.

[Készítsd fel vállalkozásod az érintésmentes használatra az Ergománia szakmai támogatása által]

 

A hangalapú kezelés jelene és jövője

A nagyközönség először a sci-fi mozifilmekben és tévésorozatokban találkozhatott hang alapú számítógép kezeléssel – vagy legalábbis annak filmes adaptációjával. A 2001 Űrodüsszeia HAL-jával, vagy a Star Trek sorozat Enterprise űrhajójával VUI-n keresztül is lehetett kommunikálni.

Persze, ezek filmek voltak, ahol a forgatókönyvíróknak nem kellett megbirkózniuk a tényleges megvalósítással, és magától értetődőnek vettek olyan funkciókat, amelyek a jelen valóságban komoly fejtörést okoznak.

A modern igényeket kielégítő, hangalapú kezelőfelület tervezése ugyanis messze nagyobb kihívást jelent, mint a GUI, azaz grafikus felületek tervezése. Ennek az oka egyszerű: a látás dominál az emberi érzékszervek körében, egyes becslések szerint az agyat érő ingerek 80%-a érkezik a szemen keresztül.

A GUI esetében ráadásul több módszer is adódik a nyelvi akadályok áthidalására – a legismertebb az ikonok/piktogramok alkalmazása.

HAL 9000 a 2001: Űrodüsszeiában

A VUI tervezésekor viszont hatalmas kihívást jelent, hogy, szemben a grafikus felületekkel, maga a VUI nem biztosít vizuális fogódzókat. A felhasználók számára a VUI-n belül nem lehet képekkel, animációkkal segíteni, nincs egyértelmű jele annak, hogy mit tehet értük az interfész, vagy mik a lehetőségeik.

Sőt egy pillantással át se láthatják a felületet, kénytelenek a lineáris, hang alapú tájékoztatást követni. Persze mindez csak a tisztán hang alapú kezelőfelületekre igaz, mint amilyeneket a telefonos ügyfélszolgálatok is alkalmaznak.

Érthető módon minden cég igyekszik grafikus felülettel kombinálni a VUI-ját. Az idők során azonban éppen a fogyatékkal élők adhatták a legnagyobb segítséget az ergonómiai szakemberek számára.

 

A hangalapú megoldások eleinte a vakokat, gyengénlátókat és a fogyatékkal élőket segítették

Míg az ép felhasználók számára a VUI inkább kényelmi szolgáltatást jelent a hétköznapok során, a vakok, gyengénlátók és a súlyosabb fogyatékkal élők számára a hangalapú vezérlés konkrétan az informatikai eszközhasználatot teszi lehetővé: a hangparancsok funkcionálnak kézként, a szövegfelolvasás pedig a grafikai megjelenítést helyettesíti.

A legtöbb fejlesztés is őket segítette, és ennek köszönhetően megannyi fogyatékkal élő számára nyílt meg az internethasználat vagy akár a mobiltelefonálás lehetősége is.

A Microsoft például 2002-ben integrálta a beszédfelismerést az Office programcsomagjába, a 2007-ben debütált Windows Vista-ban pedig már alapértelmezetten jelen volt. Ám a beszédfelismerés technológiája legalább annyira bonyolult, mint a képfelismerésé, vagy a gépi fordításé.

Ennek a legfőbb oka pedig a kontextus. Az emberek a születésüktől kezdve legalább tíz-tizenöt évig tanulják az anyanyelvük kontextuális szabályait. Ez teszi lehetővé, hogy felismerje valaki a szarkazmust, az iróniát, hiszen az egyes szavak és kifejezések jelentése teljesen eltérő lehet szövegkörnyezettől függően.

Ahogy a képek esetében azt tanulják a gépek, hogy miként különböztessék meg például a vízcsapot egy vörös csőtől, vagy az almát a baracktól, úgy a hangalapú rendszereknél a beszédhang felismerése, vagy a folyamatos beszéd értelmezése jelent kihívást.

[Iratkozz fel itt a hírlevelünkre, hogy mindig elsők között értesülj az ergonómiai újdonságokról!]

 

Hangalapú vezérlés otthon: a mesterséges asszisztensek előnyei és hátrányai

Amikor beírjuk a Google vagy a Bing keresőjébe, hogy „mikor született Gandhi”, akkor ezt könnyen értelmezik az algoritmusok, és pillanatok alatt kiadják a választ. Ám ha azt hallja a kereső, hogy „mikó születet az a kanti vagy gandi vagy hogyhívják” akkor az algoritmusok számára a feladat nehézségi foka hatványozottá válik.

Márpedig nem várható el, hogy mindenki tisztán érthetően, kitűnően artikulálva, lassan tegye fel a kérdéseit vagy adja ki a hangparancsait. Az emberek nem ilyenek. Idegesek, fáradtak, izgulnak, túláradóan örülnek, motyognak, álmosak, stb.

Ha pedig arra gondolunk, hogy járvány idején megannyi ember akad, aki szájmaszkon, pláne műanyag arcpajzson vagy védőöltözeten keresztül beszél, akkor egész jó rálátásunk lesz a feladat összetettségére.

Szerencsére a munka nehezét már elvégezte a szolgáltatóipar, mert ezekkel a kihívásokkal évek óta foglalkoznak a szilícium-völgyi óriások. A VUI is azóta értékelődött fel a mindennapi felhasználók számára, hogy az Apple piacra dobta 2011-ben a Siri-t.

 

Siri, Alexa és Cortana: segítenek vagy kémkednek?

Amióta léteznek titkok a világon, azóta próbálják illetéktelenek megtudni azokat. Akik pedig minden technikai újítás mögött összeesküvést sejtenek, hajlamosak azt hinni, hogy a kormányok, illetve mostanság már a nagyvállalatok is igyekeznek lehallgatni, megfigyelni őket.

A különféle virtuális asszisztens rendszerek esetében sincs ez másként – és maguk az IT óriások adják a lovat az összeesküvés-elmélet hívők alá. Igaz, hogy más célokkal, de a digitális segédek valóban megfigyelik a környezetüket, sőt továbbítanak is szövegrészleteket harmadik félnek.

Ahhoz, hogy egy rendszert érintés nélkül, pusztán hangparanccsal el lehessen indítani, szükséges, hogy folyamatosan „füleljen” – viszont egyáltalán nem szükséges rögzítenie, pláne továbbítania azt, amit érzékel!

A VUI fejlesztésének kardinális pontja a hétköznapi, élő emberi beszéd felismerése, ehhez pedig irdatlan mennyiségű hangmintát kell feldolgozni, értelmezni. Érthető, hogy a beszéd egy részét vagy egészét ilyenkor elküldi a virtuális asszisztens, de nem következik ebből, hogy az adatfeldolgozóknak bármilyen személyes információhoz hozzá kéne jutniuk.

Cortana

Számos nívós újság és portál foglalkozott több alkalommal is a jelenséggel, mint például a Guardian (Hey Siri! Stop recording and sharing my private conversations és ‘Alexa, are you invading my privacy?’ – the dark side of our voice assistants), a CNBC (I asked Siri, Alexa and Google Assistant if they’re spying on me — here’s what they said), az Usatoday (Hey Siri, Google and Alexa — enough with the snooping), vagy éppen a Slate.com (Which Smart Speaker Should You Trust Most—and Least?).

Az biztos, hogy a GDPR 2018 május 25-i élesedésével és megannyi adatvédelmi botrányt követően mindegyik techóriás komoly fejlesztéseket és változtatásokat hajtott végre, hogy megőrizzék, illetve visszanyerjék a felhasználók bizalmát.

 

Az otthoni asszisztensek átvehetik az online böngészők szerepét

Anélkül, hogy telefonhoz, vagy pláne asztali géphez kéne nyúlni, pusztán néhány hangparanccsal megtudakolhatjuk a várható időjárást, foglalhatunk időpontot szolgáltatásokra, lekérhetünk tőzsdei híreket vagy éppen sporteredményeket, sőt 2018 óta akár még be is vásárolhatunk hangparancsokkal például az Alexán keresztül.

Mindez pedig különösen fontossá válik akkor, ha egy járvány idején, higiéniai okokból, el akarják kerülni a felhasználók a tárgyakkal való érintkezést.

 

A VUI terjedése gyorsulni fog a közeljövőben

A hangalapú kezelőfelületek tervezésekor fontos, hogy a rendszer egyértelműen ismertesse a lehetséges interakciós lehetőségeket. Természetesen, ha akad lehetőség a grafikai felületbe ágyazásra, az rengeteget segít, ám alapvető ergonómiai elvárás, hogy egy VUI önmagában is megállja a helyét.

A VUI tehát mondja el a felhasználónak, hogy milyen funkciókat érhet el, az egyes szolgáltatásokat hogyan használhatja, és az általa megadott információ mennyiségét korlátozza olyan kis mennyiségre, amelyre még emlékezni képesek a felhasználók!

 

A modern UI design egyik alapja a hangalapú szemlélet

A járványok idején ráadásul már amiatt is érdemes optimalizálni a bemutató folyamatot, mert a „szociális távolságtartás” (helyesebb volna a szociális összetartás és fizikai távolságtartás kifejezés) miatt eleve kevesebb ember és lassabban veheti igénybe az egyes szolgáltatásokat.

A VUI-val szemben támasztott egyik fundamentális elvárás ezért az, hogy nem csak a beszélt nyelvet értse kitűnően (kiváltképpen szűrőn, maszkon keresztül), de emellett még a felhasználókat is hatékonyan és közérthetően tájékoztassa arról, hogy milyen típusú hangutasításokat tudnak használni, és milyen típusú interakciókat hajthatnak végre.

 

Az egészségügyi dolgozók és betegek lehetnek a legnagyobb nyertesek

A mostani koronavírus-járvány során még úgy is kiemelten fontossá váltak az érintésmentes megoldások, hogy maga a vírus nem terjed (ép) bőrön át – viszont szembe, szájba jutva, vagy nyílt seben át már igen.

Ezért rengetegen választották a kesztyűhasználatot, csak éppen ezek többnyire nem tartoztak a taktilis kesztyűk közé, így például mobiltelefonálni, vagy már érintőkijelzőt meglehetősen bajos használni bennük.

Az egészségügyi dolgozók és betegek lehetnek a legnagyobb nyertesek

Ráadásul ugyanúgy átvihetik a fertőzést, ha valaki a koszos kesztyűvel nyúl a szemébe vagy az arcához. A kórházakban, szakrendelőkben való érintésmentesség pedig még járványmentes időszakban is kifejezetten ajánlott mindenki számára, pláne COVID19 idején!

Az egészségügyben ezért a VUI minden esetben ideális megoldást kínál, pláne grafikus kezelőfelülettel kombinálva, hiszen akkor teljes érintésmentesség valósítható meg.

 

Az Ergomania élen jár a VUI fejlesztésben

Az Ergomaniánál a kezdetek óta azt a szemléletet alkalmazzuk, hogy a felhasználók számára könnyű legyen a különféle felhasználói felületek használata.

Egyaránt tervezünk GUI-t és VUI-t, illetve hibrid kezelőfelületet, a megrendelőink igényeinek megfelelően. Nálunk a tervezési folyamatban végig érvényesül a felhasználók érdekének elsődlegessége.

Amikor hangalapú kezelőfelületet tervezünk, kiemelt célunk a maximális UX, azaz ügyfélélmény. Tapasztalataink szerint akkor dolgozunk jól, ha az emberek szeretik használni a VUI-kat, mert egyszerűek, érthetőek és könnyen kezelhetők, mert nem okoznak frusztrációt vagy zavart.

A szakmai tapasztalataink és az iparág ismereteink révén egyaránt otthonosan mozgunk a nagyvállalati intranetek, ipari kezelőfelületek és lakossági célú felhasználói felületek tervezésében.

Úgy látjuk, hogy a hangalapú kezelőfelületeké a jövő. Te készen állsz rá?

[Mi a közös az OTP-ben, a Telenorban és a Joautok.hu-ban? Az, hogy az Ergomania szakmai segítsége által válhattak még sikeresebbé. Lépj velünk kapcsolatba itt]

Oszd meg velünk véleményed

    Kérem írd be üzenetedet

    Kérem írd be email címed!

    Kérem írd be üzenetedet

    Küld

    Website-okat, mobil applikációkat és szoftvereket tervezünk, hogy segítsünk megvalósítani üzleti céljaidat!

    Csapatunk

    Kapcsolat

    Kedves Ergo,

    A nevem
    . Az email címem
    . Üzenetem:

    ajánlott
    cikkek

    Tudj meg többet a témáról

    A vártnál is népszerűbbek: a legjobb hangalapú kezelőfelületek titka

    2020. Sze. 03. | 14 perc olvasás

    A VUI, azaz hangalapú kezelőfelület segítségével kommunikáló személyi asszisztensek sokkal népszerűbbekké váltak, mint amire eleve számítottak a legnagyobb iparági szereplőknél. Az Amazonnál, a Microsoftnál...

    Mi az a hangalapú kezelőfelület és miért van rá valójában szükség?

    2020. aug. 11. | 13 perc olvasás

    A hangalapú kezelőfelületek az élet számos területén jelen vannak. Néha kifejezetten hasznosak, például ha fontos az érintésmentes használat, mondjuk egy járvány idején, közterületen, vagy bármikor egy...