Magyar látássérültek segítik a hangalapú kezelőfelületek tervezését az Ergomániánál

Az Ergománia 2020 végén kezdett bele egy nagyobb szabású projekt következő fázisába. 2013 óta foglalkoztat bennünket a hangvezérlés, hanggal való navigáció kérdése, ezért most vakokat és gyengénlátókat kerestünk meg egy hangvezérléssel kapcsolatos kutatáshoz.

Az interjú apropóját az adta, hogy a látássérült résztvevőknek világszerte egyre inkább kiemelt szerep jut a VUI (voice user interface), a hangalapú kezelőfelületek tervezésében, márpedig az Ergománia elsősorban felhasználói élmény tervezéssel foglalkozik, kiváltképpen online felületeken.

 

A VUI révén természetesebbé válik a tárgyak használata

Habár elsőre furán hangozhat, kiváltképpen a billentyűzetekkel, egerekkel, nyomógombokkal és érintőkijelzőkkel teli világunkban, de már átléptünk a küszöbén annak, hogyan fogjuk a tárgyakat kezelni a közeljövőben.

Még évekkel korábban, az elsők között ismertük fel azt, amire most, a koronavírus-járvány idején döbbent rá a világ nagy része: a hangalapú, érintésmentes kezelés szó szerint létfontosságú eleme számos szolgáltatásnak.

 

A hangalapú felhasználás számaránya folyamatosan növekszik

Az is megfigyelhető, hogy folyamatosan növekszik a hang alapú keresések száma és aránya: 2020-ban a keresések 20%-a volt hangalapú, és a mobil használók 58%-a legalább egyszer már kipróbálta ezt a funkciót.

Ráadásul, ahogy folyamatosan növekszik az otthoni digitális asszisztensek száma (csak Amerikában legalább 40 millió háztartásban van már valamilyen), úgy növekszik stabilan a hangalapú felhasználás számaránya is.

Eltekintve attól, hogy bizonyos eszközöket elsősorban hangalapú felhasználásra terveztek, illetve hogy adott estben a hangalapú használat lehetséges csak, van még egy komoly oka annak, hogy miért beszélnek egyre többen az okoseszközeikhez.

 

A tárgyakat kézzel irányítjuk, az állatoknál hangot is használunk

A válasz lényegében ugyanaz, amiért olyan sokan idegenkednek attól, hogy egy okostelefont vagy jegyautomatát hanggal kezeljenek – és másoknak meg miért természetes az, hogy például beszéd útján keressenek rá a Google-ben valamire.

Az emberiség az elmúlt évezredek alatt megszokta, hogy az élettelen tárgyakat kezeli kézzel, míg az élő, legalább minimális értelemmel bíró „eszközöket”, a haszonállatokat pedig hanggal is irányítja. Mindegy, hogy egy-egy parancsszót mondtak az ökröknek és lovaknak, vagy hosszabban beszéltek a kutyákhoz, macskákhoz, az esetükben a „hang alapú kezelés” természetesnek számít.

Röviden, az élettelen tárgyaknál a kézi irányítás, az élőlényeknél a hangalapú kezelés a természetes az emberek többsége számára.

Márpedig amíg egy mobiltelefon vagy számítógép még inkább tárgynak minősül (bár mindkettőt lehet hangparancsokkal irányítani), addig az okostelefonok és a digitális asszisztensek már inkább „állatoknak” minősülnek, sőt akár személyes, értelmes cselédnek, vagy akár beosztottnak is.

Google Home

 

A digitális asszisztensek emberekké válnak?

Azok a digitális asszisztensek, amelyek képesek embert imitálva elintézni időpontfoglalást, ételrendelést vagy más tevékenységeket, sokak számára lassan már nem is gépnek minősülnek, hanem embernek.

Vannak, akik éppen arról számoltak be, hogy képtelenek voltak puszta gépként kezelni a digitális asszisztensüket, sőt akad olyan filozófus is, aki szerint sokat elárul az emberről az, miként bánik egy mesterséges intelligenciával – miközben alapvetően mégis csak gépekről beszélünk.

Ahogy az emberek a magánszférájukban egyre inkább élőlényekként, sőt emberekként kezelik a digitális asszisztenseket és okoseszközöket, joggal számíthatunk arra, hogy az üzleti élet és a gazdaság szereplői esetében se lesz ez másként.

A VUI-k, úgy látjuk, egyre nagyobb népszerűségnek örvendenek megrendelőink körében is. Ezért úgy döntöttünk az Ergomániánál, hogy bevonjuk a VUI tervezésbe azokat az embereket, akiknek egyébként is a hangalapú kezelés a (szinte) kizárólagos lehetőség az okoseszközök használatánál.

 

Az Ergománia a látássérült emberekre is gondol

Célunk továbbra is, hogy jobban megértsük az ő igényeiket, ezáltal minél jobban használható felületeket, hang navigációt tervezzünk. Az embertársaink megsegítése mellett legalább ilyen fontos szempont az, hogy mennyi ember számára tudunk ezzel élhetőbb környezetet teremteni: legalább harmincezer vak ember él Magyarországon, ha pedig az összes látássérültet vesszük, több mint kétszázezer emberről beszélünk – jelentős részük ráadásul időskori szembetegség miatt veszíti el részlegesen vagy teljesen a látását. Világszinten a vakok száma közelíti az 40 milliót, a gyengénlátóké pedig a 250 milliót.

Olyan látássérült embereket kerestünk, akik szívesen beszélgettek velünk egy órát a témában. Az interjúkat Tóth Rózsa Vanda vitte végig és úgy építettük fel azokat, hogy a lehető legjobban megismerjük és megértsük mindazon kihívásokat, lehetőségeket és vágyakat, amelyek a vakok és gyengénlátók számára a napi valóság részei.

Célunk volt megérteni a vakok és gyengénlátók igényeit.

Az interjút végül hatan vállalták el. Személyiségvédelmi okok miatt az interjú résztvevőinek a keresztnevét közöljük csak.

Anita gyengénlátó, marketinggel foglalkozik, Sándor, Anita férje, teljesen vak. Szilvi aliglátó, akinek a hangnavigáció komoly segítséget jelent. Edit teljesen vak, sosem volt látó, hittudományi főiskolát végzett. Szilvia születése óta vak, jogot végzett. Mihály teljesen vak, informatikusként dolgozik. Péter aliglátó, gyógypedagógus végzettséggel bír.

 

Amiről a magyar látássérültek beszélnek – így épült fel az interjú

Az interjúk során elsősorban arra voltunk kíváncsiak, hogy a résztvevők hogyan élik a mindennapjaikat és kiváltképpen, milyen (okos)eszközöket és hogyan használnak.

Ezen belül külön kitértünk a felolvasó szoftverekre, a számítógépekre és a digitális asszisztensekre. Szerettük volna megtudni, hogy mi működött jól, mi működött rosszul és általánosságban véve mi okozza a legnagyobb nehézséget a fent említett eszközök használatakor?

A szoftverhasználat terén olyan kérdésekre kerestük a választ, mint hogy milyen kiegészítő szoftvereket használnak, amik segítik a mindennapjaikat, és kértük is, ha van rá mód, mutassák meg a használatukat.

Fontosnak tartottuk kideríteni, hogy szerintük mi a legnagyobb hiányossága vagy értéke ezeknek a szoftvereknek. Kitértünk arra, hogy hogyan működik ezen szoftverek esetében az ikonok, gombok, képek felismerése, találkoztak-e már ezzel összefüggésben bármilyen problémával.

Az internet használata terén arra voltunk elsősorban kíváncsiak, hogy milyen ügyet intéznek online, illetve milyen esetekben, helyzetekben részesítik előnyben az online ügyintézést. Mindezt pedig inkább számítógépen vagy okoseszközön teszik, és milyen paraméterekkel használják az internetet, továbbá milyen eszközök, szoftverek segítik őket ebben.

 

Magyar látássérültek szoftverhasználata a mindennapokban

Általában azt mondhatjuk, hogy a látássérültek a felolvasó szoftverek, gyakorlatilag hangalapú felületek segítségével tudják az okoseszközöket és az általuk elérhető szolgáltatásokat használni.

Szilvia például, aki gyerekkora óta látássérült és jogot végzett, már középiskolában dolgozott laptoppal (2000-ben ez nagyon új dolognak számított Magyarországon), az egyetemen is a hordozható számítógép segítségével írta a jegyzeteit – a Jaws képernyőolvasó szoftver már akkor is rendelkezésre állt.

Az okostelefonok megjelenése előtt azok, akik belekóstoltak a számítástechnika világába, szinte mind csak számítógépet használtak először, de most már egyre inkább használják a telefonokat is. A gépen könnyebb navigálni.

Akad olyan vélemény is, hogy az egyes oldalak betöltését vélhetően a képernyőolvasó gátolja, de látássérültként nehéz erről meggyőződni – olyan lehetséges hiba ez, amit mindenképpen érdemes kivizsgálni fejlesztői oldalról. Ahogy Szilvia mondta, sokszor van, hogy nem beszél a képernyőolvasó, nem tudják, mi történik, mert ugye elhallgatott, lefagyott.

Mihály egy évtizedekkel ezelőtti magyar fejlesztésű beszédszintetizátort használ, a Profiboxot (a BME Távközlési és Telematikai Tanszék és az MTA Fonetikai Labor munkatársai fejlesztették ki), ha pedig hangoskönyvre van szükség, akkor a Dex dramatizált, elektronikus könyv és konvertáló szoftvert alkalmazza.

Itt mindenképpen említésre méltó az nytud.hu, mint a magyar nyelvű, magyarul tudó NLU (Natural language understanding, azaz természetes nyelvi megértés) és az NLP (Natural Language Processing, azaz természetes nyelvek feldolgozása) fejlesztői, akik évek óta dolgoznak olyan megoldásokon, amelyet a látássérült emberek is hasznosítani tudnak.

Mihály leginkább olyan hiányosságot emelt ki, hogy tapasztalatai szerint nem fejlődött kellő mértékben a magyar nyelvű technológia és úgy véli, emberközelibb hangú szoftverek inkább külföldön készülnek. Márpedig ha az intonálás, a hang nem magyaros, fárasztó hosszú távon hallgatni.

 

A nyomógombos telefonok fontos előnnyel bírnak

Mihály és Sándor is régi vágású felhasználók, akik úgy vélik, a telefon telefonálásra, a számítógép meg internetezésre való – Mihály például nyomógombos Nokia E51-et használ. Tény és való, hogy egy vak ember számára a fizikai gombokkal messze jobban, egyszerűbben használhatók az eszközök.

Ahogy Mihály fogalmazott, ő azt a mobilt hiányolja, ami egyszerre érintőképernyős és nyomógombos. Amikor valamit gyorsan akarna elintézni, akkor kellene a nyomógomb. Sms-t, emailt gyorsabb úgy megírni. Érintőképernyőt akkor használna, ha navigálni szeretne.

A hangalapú keresés egyre népszerűbb, függetlenül attól, hogy látó-e valaki.

 

A fiatalabb generációk a látássérültek között is lépéselőnyben vannak

A mostani generáció már belenőtt felhasználóként az emberközpontú, könnyedén elérhető számítástechnika használatába, de ahogy Szilvia mondta, vannak olyan látássérültek, akiknek nagyon új ez az egész technika. Példaként egy idősebb hölgyet említett, aki 70 évesen vakult meg – neki például nagyon nehéz bármit megtanulni.

Amit a legjobbnak tartanak a fiatal és középkorú látássérültek az az, hogy egy csomó minden elérhető számukra, ami régebben elképzelhetetlen volt. Nagyon nagy biztonságot tud adni, akár tanulásról, vagy munkáról, akár közlekedésről vagy szórakozásról van szó.

Edit is úgy véli, hogy a látássérültek számára népszerű, hogy beszélő számítógépek és telefonok állnak rendelkezésre, bár ő egy kisebbségi véleményt képvisel. Edit születése óta vak. Hittudományi főiskolát végzett, 15 éve önkéntes egy alapítványnál, így sok országban megfordult már. Tőle a modern világ fogyasztói társadalom szemlélete nagyon távol áll.

Edit a Braille kijelzők híve, és inkább megy el az ország vagy a világ másik felébe, mint hogy online szörföljön – kiváltképpen a privát szféra védelme miatt. A Braille írásra alapuló technológiák egyébként mind nagyobb piaci forgalmat generálnak. A klasszikus megoldások közé tartoznak a Braille karórák, mint amilyet Mihály is használ, de egyre több újszerű megoldás jelenik meg a piacon, például Braille könyvolvasók.

 

Ha képernyőolvasó, akkor Jaws vagy beépített voiceover

A tapasztalat az, hogy még mindig túl sok olyan oldal akad, ami nem akadálymentes, ráadásul a képeken lévő infókat a Jaws korábbi verziói nem olvasták fel. Márpedig ez az a szoftver, ami igazán elterjedt, mert az Office-szal is kiválóan együttműködik.

Habár léteznek más megoldások (például NVDA, vagy a Windows saját Narrátora), Szilvia a Jaws-t szokta meg. Funkcionalitás és hangminőség terén is ezt tartja a legjobbnak. Péter, aki gyógypedagógus és gyógymasszőrként dolgozik, szintén azt emelte ki, hogy számítógépen sokkal könnyebb szöveget szerkeszteni.

Ő például szívesen használna számítógépek esetében is Apple termékeket, habár a Microsoftos környezetet szokta meg. Péter úgy fogalmazott, hogy “ha lehetőségem lenne egy mac géphez hozzájutni, akkor szívesen elsajátítanám annak a kezelését. Úgy tudom, hogy sokkal akadálymentesebb, működik rajta is a diktálás akár mint az Iphone készülékeken.”

Anita viszont csak próbálta a JAWS-t, mert szerinte az NVDA jobb, érthető, nem gépies a hangja. Ugyanakkor a fordítottja is előfordul, amikor egy honlapot nehéz használni, viszont az applikációján keresztül sok funkció elérhető.

Ahogy Anita megfogalmazta, az IPhone-on is a Gmailt webről használni elég bonyolult, de a Gmail alkalmazást „jól megcsinálták”, azaz könnyű a használhatósága.

Telefonok esetében a képernyőolvasó gyárilag adott, és Szilvia is például így használja az iPhone-ját. Tanulni tudnak vele és dolgozni, de Szilvia például nincs a hangjától elragadtatva. Hogy milyen hangnak örülne?

Nos, minták alapján könnyebb megmondani, ám a felolvasó szoftverek hangja ma már egyre inkább közelít az emberi hanghoz. Az első felolvasó hangja még olyan volt, mint egy brekegés – ahogy Szilvia fogalmazott.

Számítógépen még mindig könnyebb szöveget szerkeszteni a vakok és gyengénlátók számára is.

Általában egyébként ez volt megfigyelhető interjú résztvevőinknél, hogy okostelefonként iPhone-t, míg laptopként Windows-os eszközt használtak. Péter például régen Nokiát használt, és annak a saját szövegfelolvasóját, de külön kellett Nuance-t telepítenie a normális felolvasáshoz, mert a készülék sajátja csak néhány funkciót tudott meghangosítani. Néhány látássérült még mindig ezen tizenéves készülékeket használja.

Péter úgy foglalta össze a helyzetet, hogy most már “a Microsoft gépekben is benne van a Narrátor program, ha viszont valaki ennél testreszabhatóbb, professzionálisabb olvasó programot szeretne használni, akkor a Jaws, vagy Nvda programokat telepíti fel.

Egyébként a Windows 10 megjelenésével nagyon sokat fejlődött a Narrátor, és a Szabolcs Ms beszédszintetizátorral vált magyar nyelven is elérhetővé. A korábbi Windows programokban az Ms Sam angol nyelvű beszédszintetizátor volt csak.”

Aki rendelkezik valamennyi látással, tehát alig látó, mint Szilvi is, szövegnagyító alkalmazást, vagy éppen fizikai nagyítót használ, ha szükséges. A ZoomTtext nevű nagyító szoftver nem összekeverendő a népszerűvé vált videochat alkalmazással – ez chatelés helyett egyszerre képes nagyítani és fel is olvasni a szöveget.

Mihály is azt kifogásolta, amit többen is megjegyeztek, hogy a Windowson nem tud egyelőre diktálni magyarul.

 

Internet-használati tapasztalatok

Az Internetet alapvetően még mindig a látóknak készített tartalmak dominálják, pedig a látássérültek is mindent használnának, ha hozzáférhető lenne. Jó hír viszont, hogy ma már akadálymentesített a mobil bankolás, az online jegyvásárlás, vagy éppen, mint Szilvia beszámolt róla, a jogtárak használata is.

Közösségi oldalt ritkábban használnak, chat programokat (Messenger, Skype, Viber) már annál inkább. A keresés terén vegyesek a tapasztalatok. A Youtube hangalapú keresője felemás hatékonyságú, ahogy Péter fogalmazott, „van, amikor jót ír be, van, amikor rosszat.”

 

Az online ügyintézés messze nem eléggé akadálymentesített

Ami viszont egyöntetű tapasztalat, hogy általában minden látássérültnek meggyűlik a baja a kormányzati, hivatali oldalakkal – az ügyfélkaput egyáltalán nem, a NAV oldalát nehézségekkel tudják használni.

A bankolás és online számlafizetés esetén a megtévesztő oldalak, adathalászat kiemelt problémát okoz a látássérülteknek, hiszen még ép emberek is gyakorta bedőlnek a profi csalóknak, ha például valamelyik közműszolgáltató nevében küldenek emailt.

A látássérültek inkább telebankot használnak, ahol, egyelőre, még élő ügyintéző azonosítja be őket. A netbank, és általában az online ügyintézés terén az asztali gépek, laptopok még mindig előnyt élveznek, mert messze könnyebb használni még gyengénlátóként is.

 

A szöveges képek még gondokat okoznak

Habár a Jaws egyre jobb funkciókkal bír és most már képet is fel tud olvasni, ahol sok kép van, vagy grafika, a képernyőolvasó belassul, sőt időnként le is fagy, akár olyan mértékben, hogy a számítógépet is újra kell indítani.

A Jaws használata egy bemutató során.

Sőt olyan is akad, hogy a UI-ban (user interface, azaz kezelőfelület) hibáznak, és nem nevezik el az adott gombot – ekkor a szövegfelolvasó csak annyit mond, hogy „gomb”, de a funkciójáról semmit. Persze, ez inkább frontend kérdés, de a legtöbb látássérült számára a felhasználói felület eleve felolvasással kezelhető.

Hang navigálásnál is probléma, hogy a látó azt látja, hogy ott van egy kis mikrofon jel, de a látássérült felhasználók nem minden esetben találják meg a diktálási ikont.

Érdemes lehet talán az olyan emberek IKT (informatikai technológia) eszközhasználatából kiindulni, akiknek többféle fogyatéka is van (például látássérült és mozgássérült), amit Péter említett. Néhány eszköz van már, ami kommunikátorként működik.

Korábban kártyákkal kommunikáltak, de manapság a kommunikátorok segítségével a kérésüket, képekkel kifejezett gondolataikat a TTS (text to speech, beszédszintetizátor) fel is tudja olvasni. Ha például rákattint a pohárra és az almalére, akkor azt jelenti: “Kérek egy pohár almalevet”.

 

Az online vásárlás még eléggé döcögős

Az online vásárlás kifejezetten bonyolult a látássérültek számára, kiváltképpen az oldalon belüli navigáció okoz gondot az óriási weboldalaknál vagy webáruházaknál. Ahogy interjú résztvevőink fogalmaztak, „nagyon bonyolult bevásárolni, egy csomó idő elmegy ezzel”. „A legtöbben azt csinálják, ha elfogy a türelmük, akkor az első termékre rákattintanak”.

Hiába kérik, hogy mutassa a webáruház az akciós termékeket, ha túlságosan sokat jelenít meg egyszerre. Ami egy ép ember esetében is zavaró, az egy látássérültnél fokozottan igaz – ha sok száz terméket kéne egyenként végigbogarászni, inkább bele sem kezdenek, mert hamar megunják.

Szilvia is azt kifogásolta, hogy a bankok azzal, hogy biztonságosabbá tették az online vásárlást, egyben meg is nehezítették azt – és egy vak, vagy alig látó ember számára ez még hatványozottabban jelentkezik.

 

Látássérültek közlekedése okoseszközökkel

A hangalapú kezelési lehetőségeknek köszönhetően a különböző navigációs alkalmazások is rendelkezésére állnak a látássérülteknek: a Blindsquare, a Google Maps vagy éppen a Térkép (iPhone alkalmazás).

A tapasztalatok azonban vegyesek. Ahogy Szilvia mondta, jó bennük, hogy beír egy helyszínt és a telefon kiírja, hogy milyen messze van, kérheti, hogy adjon autós, gyalogos útvonalat. És leírja, hogyan jut el, mikor megy jobbra vagy balra. Bemondja, hogy közeledik, távolodik, most kell jobbra vagy balra fordulni, sőt azt is, hogy milyen boltok vannak a környéken.

Anita és Sándor tapasztalata is alátámasztja azt, ami az interjúkból kiderült: az Iphone-t inkább találják akadálymentesnek, mint az Androidot.

Ami viszont nem jó szerintük, az a frissítés gyakorisága: a tapasztalataik szerint előfordul, hogy bemond egy helyet, de már nincs ott, megszűnt, amiből az is következhet, ami ott van üzlet, azt nem említi a térkép alkalmazás. Olyan is előfordul, hogy páros oldalon megy és páratlant mond be.

Többen is említették, például Anita és férje, Sándor, hogy a plázákban, bevásárlóközpontokban lehetnének kombinált segítségek, például vakvezető sáv a boltok bejáratához, vagy VUI-val (voice user interface, hangalapú kezelőfelület) is rendelkező információs pontok – egy látó könnyen tudja használni a digitális térképeket, de egy vak vagy gyengénlátó számára használhatatlanok.

Vakvezető sáv segít a navigációban.

 

A tömegközlekedésnek van hova fejlődnie

A GPS alapú navigáció a tömegközlekedésben is nagy segítség, mert például Szilviával is előfordult olyan, hogy a buszon nem mondta be a megállók neveit az utastájékoztató rendszer. Egy ép utasnak ez kisebb gond, leolvassa a kiragasztott menetrendről, melyik utca következik, de egy látássérültnek nincs erre módja. Viszont ha bekapcsolja a Térkép alkalmazást, az bemondja.

A másik, ami még nehézséget okoz, az a jegyautomata. Mi van, ha a jegyautomatát nem tudja kezelni és tilos a sofőrtől jegyet venni? Vagy éppen nincs megfelelő utastájékoztatás és fejből kell tudni a menetrendet – aki okoseszközt használ, annak látássérültként sincs ezzel több gondja, mint a látóknak, de eszköz nélkül bizony komoly gondok adódnak, pusztán azért, mert nem akadálymentesített a közlekedés.

Az online vonatjegy vásárlása már gördülékenyen megy, de a taxi rendeléséhez még mindig a telefonálás a legjobb, mert nehezen találni akadálymentes taxi appot.

Akadnak azonban a látássérültek között olyanok is, mint Edit, akik nem szeretik az alkalmazásokat és a gépeket – nekik emberi, élő hangra van szükségük. Természetesen mindez az ép emberek egy jelentős részére is igaz: inkább addig nyomkodják a telefonos ügyfélszolgálat menüpontjait, mire élő ügyintézőhöz kerülnek, mintsem hogy a gép tájékoztassa őket.

 

Látássérültek és a digitális asszisztencia

A digitális támogatás, azaz asszisztencia tárgykörébe nem csak a Siri-féle digitális asszisztensek tartoznak, de lényegében minden olyan szoftver, ami asszisztensi, régebbi szóval titkári feladatokat lát el.

Az okostelefonoknál általában a diktáló funkciót használják, bár van, aki külön Bluetooth-os billentyűzettel is kezeli olykor. IPhone-t például sokan azért választanak, mert ott kihangsúlyozzák, hogy akadálymentes.

Sőt például az Apple megoldotta azt, amit az állam nem: akadálymentessé tették a pénzfelismerést. Habár volt rá kísérlet még az első 5000 Ft-os címletnél, hogy Braille-írással is rákerült a címlet, ez nem igazán terjedt el.

Az iPhone-ban ezzel szemben van pénzfelismerő funkció, így az okostelefon által egy látássérült is viszonylag könnyedén meg tudja mondani, milyen bankjegyet tart a kezében.

A digitális asszisztensek használata kapcsán általában a nyelv okoz akadályokat – de ahol adott az angol nyelv, ott az érintés hiánya okozhat idegenkedést. Szilvia például ismeri, tudja is kezelni a Sirit, de nem igazán szereti használni, habár úgy fogalmazott, „nem tudom, hogy miért idegenkedek tőle”.

A Siri az egyik legnépszerűbb digitális asszisztens a világon.

 

Két fő akadály: nyelv és ár

A két legnagyobb akadály az okoseszközök és digitális asszisztensek látássérültek általi tömeges használata előtt az, hogy a vakok és gyengénlátók ritkán dolgoznak olyan pozícióban, hogy ilyesmire teljen nekik, illetve, ahogy Péter fogalmazott, nem tud magyarul, ezért a legtöbb látássérült nem használja.

A Microsoft és az Apple küzdelmében az utóbbi áll győzelemre: Péter úgy becsülte, hogy a Siri képes még beszédhibánál is közel 80%-os pontosságra. Ő úgy fogalmazta meg, hogy “míg a Microsoft programokban, ha a diktálásra koppintok, azzal a hibával, hogy “ez a funkció nem érhető el az Ön nyelvén” leáll az alkalmazás, a Siri a magyar platformon is működik, a ‘kol’ hívóparancs bemondással az esetek 90%-ában a bonyolultabb magyar kontakt nevekkel is elboldogul.”

Ráadásul olyan alapvető aggályokat említettek az interjú résztvevői, mint például a digitális asszisztenseknél külön meg kell tanulniuk, hogyan lehet elindítani, mert sokan gombbal szeretnék megoldani.

Jelezték, hogy a hangok keveredése is problémás lehet, mert például okostelefonok esetében, ha jól van beállítva, a képernyőolvasó hallgat, amikor a hangnavigáció beszél.

Olyan problémákat említett Szilvia, mint például a felolvasó szoftvert lekapcsolja a hangnavigáció, és ha neki nyolc oldal van nyitva, akkor, ha kikapcsolja a vezérlőt, nem tud átnavigálni. Átlépni egy másik tabra pedig elég bosszantó lenne, hogy újra kell indítani. Mi van, ha a kettő között akar ugrálni?

Sirinél a legnagyobb nehézséget egyébiránt az okozza, hogy nem mindig megy át, hogy mit akar a használója. Az embernek előbb meg kell tanulnia, hogy mire képes a Siri, és akkor már tudja, hogy mit lehet tőle elvárni. Csakhogy a felhasználók többsége nem tudja pontosan, hogy a Siri, vagy más digitális asszisztensek mire képesek – kiváltképpen magyarul.

 

A felolvasó szoftverek és az adatvédelmi aggályok

Akad még egy vetülete a felolvasó szoftverek használatának, amelyre az egyik interjú résztvevőnk is felhívta a figyelmet. Edit úgy fogalmazott, hogy a képernyőolvasás jó ugyan, de ha más is hallja a privát beszélgetést, levelezést, pláne bankszámla egyenleget, akkor ott komoly adatvédelmi aggályok merülnek fel.

Szilvia is hasonló aggályokat mondott. Bank utalásnál például honnan tudja a rendszer, hogy az mondja az adatokat, aki jogosult rá? De ugyanígy bármely ügyfélszolgálatnál, ha tudnak pár adatot, akkor kiadnak bizalmas információkat számlaegyenlegről – miközben ezeket más is ismerheti.

A captcha szintén olyan akadály, ami egy vak számára gyakorlatilag megoldhatatlan, ha csak képi felismerésből áll a feladvány.

 

A hangalapú kezelés lehetséges jövője

Az interjú során kitértünk arra is, milyen eszközök azok, amelyeknél a látássérültek örülnének a hangvezérlésnek – és megbizonyosodhattunk róla, hogy bárki másnak is jól jönne, ha például a mosógépnél nem kéne gombokat nyomogatni meg tárcsákat tekerni, csak kiadni a hangparancsot és elindulna a megfelelő mosás, vagy sütőnél a megfelelő hőfokon történő melegítés, sütés, főzés.

Persze az, hogy a háztartási eszközök „beszéljenek”, azaz hangjelzésen túl emberi beszédet szimulálva adjanak tájékoztatást, ismét olyan fejlesztési lehetőség, amit mindenki tudna hasznosítani.

Összességében elmondható tehát, hogy a hangalapú kezelőfelületek tervezésénél a látássérültek bevonása a folyamatba elengedhetetlenül fontos, mert ha valakik, ők biztosan meg tudják mondani, mennyire jól használható egy-egy VUI (Voice User Interface, Hangalapú felhasználói felület).

Oszd meg velünk véleményed

    Kérem írd be üzenetedet

    Kérem írd be email címed!

    Kérem írd be üzenetedet

    Küld

    Website-okat, mobil applikációkat és szoftvereket tervezünk, hogy segítsünk megvalósítani üzleti céljaidat!

    Csapatunk

    Kapcsolat

    Kedves Ergo,

    A nevem
    . Az email címem
    . Üzenetem:

    ajánlott
    cikkek

    Tudj meg többet a témáról

    A beszédhang is alkalmas biometrikus azonosításra

    2021. jún. 08. | 23 perc olvasás

    Az elmúlt években a hangalapú interfészekkel való beszéd életünk normális részévé vált. Valójában már ma is számos hangvezérelt szolgáltatást használunk, mint például a beszélgetés során megvalósított...

    Van jövője a banki interface-eknek? Elmondom miért nincs.

    2021. ápr. 27. | 12 perc olvasás

    Talán elsőre kicsit furcsán hangozhat a blogbejegyzés címe, mert „bombasztikus” hatást akar kelteni. Persze egy rutinos olvasó tudhatja, hogy lesz valami csűrcsavar, amivel kihozom, hogy habár nincs, ...