IME - AZ EGÉSZSÉGÜGYI VEZETŐK SZAKLAPJA

Tudományos folyóirat

   +36-30/459-9353       ime@nullimeonline.hu

   +36-30/459-9353

   ime@nullimeonline.hu

Vakok tájékozódását segítő eszköz integrált sztereo ultrahangos és rádiós rendszerrel

  • Cikk címe: Vakok tájékozódását segítő eszköz integrált sztereo ultrahangos és rádiós rendszerrel
  • Szerzők: Mihajlik Péter, Tatai Péter, Balog András
  • Intézmények: BME, AITIA Informatikai Rt.
  • Évfolyam: III. évfolyam
  • Lapszám: 2004. / 2
  • Hónap: március
  • Oldal: 43-47
  • Terjedelem: 5
  • Rovat: INFOKOMMUNIKÁCIÓ
  • Alrovat: ÚJDONSÁG

Absztrakt:

A cikkben beszámolunk egy vakok számára készült újszerű eszközről, amely a Budapest Műszaki és Gazdaságtudományi Egyetemen, az AITIA Informatikai Rt.-vel való együttműködésben lett kifejlesztve. A készülék sztereo ultrahangos visszhanglokációval deríti fel a vak felhasználó előtti terepet, és speciális hangeffektusokkal jelzi az akadály helyét, megközelítőleg úgy, mintha a hangot maga az akadály adta volna ki. Emellett egy másik komplett rendszer is helyet kap a készülékben: a kiemelt objektumokra szerelt rádió adó/vevőkkel képes kommunikálni és így segíteni a világtalan felhasználót az objektumok megtalálásában. A készülék lelke egy digitális jelprocesszor, amely még az eszköz vezérlésén kívül a beépített kötetlen, magyar nyelvű beszédszintézist is végzi. A cikkben ismertetjük a készülék működési elvét és felépítését különös tekintettel az akadálydetekcióra és visszajelzésre, a rádiós rendszerre és a mesterséges beszéd előállítására.

Szerző Intézmény
Szerző: Mihajlik Péter Intézmény: BME
Szerző: Tatai Péter Intézmény: BME
Szerző: Balog András Intézmény: AITIA Informatikai Rt.

[1] J. Borenstein, I. Ulrich, A. Arbor: The GuideCane – A Computerized Travel Aid for the Active Guidance of Blind Pedestrians, Proceedings of the IEEE International Conference on Robotics and Automation, Al-buquerque, NM, Apr. 21-27, 1997, 1283-1288.
[2] Tony Heyes: An Electronic Travel Aid for the Vision Impaired, http://www.sonicpathfinder.org/
[3] Mihajlik Péter, Tatai Péter: Ultrahangos tájékozódó eszköz vakok számára, Hiradástechnika – Journal on C5, 1999, Vol. 50, 64-72
[4] Jens Blauert, Spatial Hearing: The MIT Press, Cambridge, MA, 1983, 171-182
[5] Bill Gardner, Keith Martin: HRTF Measurements of a KEMAR Dummy-Head Microphone, MIT Media Lab Perceptual Computing – Technical Report #280, May, 1994, http://sound.media.mit.edu/KEMAR.html
[6] Lükő Bálint: A Low-Cost Speech Synthesis Method, Proceedings of 2003 Polish-Hungarian-Czech Workshop On Circuit Theory, Signal Processing, And Applications, Prague, Czech Republic, 11-13 Sept. 2003.
[7] Mihajlik Péter, Guttermuth Mária, Seres Krisztián, Tatai Péter: A DSP-based Ultrasonic Navigation Aid for the Blind, Proceedings of IEEE Instrumentation and Measurement Technology Conference, Budapest, Hungary, 2001, 1535-1540.

INFOKOMMUNIKÁCIÓ ÚJDONSÁGOK Vakok tájékozódását segítő eszköz integrált sztereo ultrahangos és rádiós rendszerrel Mihajlik Péter, Tatai Péter, Budapesti Műszaki és Gazdaságtudományi Egyetem, Balog András, AITIA Informatikai Rt. A cikkben beszámolunk egy vakok számára készült újszerű eszközről, amely a Budapest Műszaki és Gazdaságtudományi Egyetemen, az AITIA Informatikai Rt.-vel való együttműködésben lett kifejlesztve. A készülék sztereo ultrahangos visszhanglokációval deríti fel a vak felhasználó előtti terepet, és speciális hangeffektusokkal jelzi az akadály helyét, megközelítőleg úgy, mintha a hangot maga az akadály adta volna ki. Emellett egy másik komplett rendszer is helyet kap a készülékben: a kiemelt objektumokra szerelt rádió adó/vevőkkel képes kommunikálni és így segíteni a világtalan felhasználót az objektumok megtalálásában. A készülék lelke egy digitális jelprocesszor, amely még az eszköz vezérlésén kívül a beépített kötetlen, magyar nyelvű beszédszintézist is végzi. A cikkben ismertetjük a készülék működési elvét és felépítését különös tekintettel az akadálydetekcióra és visszajelzésre, a rádiós rendszerre és a mesterséges beszéd előállítására. A vakok és csökkentlátók számára rendkívül nehéz a társadalmi beilleszkedés, a közlekedés és szinte minden tevékenység. Az utóbbi években világszerte kutatnak és fejlesztenek a vakok számára korszerű segéd-eszközöket (pl.: [1], [2]), azonban ezek magas ára miatt hazánkban jóformán csak a fehér bot és esetleg a vakvezető kutya tekinthető általánosnak. A cikk beszámol egy vakok számára készített új eszközről, amely szereo ultrahangos visszhanglokációval deríti fel a vak felhasználó előtti terepet. A korszerű információtechnológia már ma is számos lehetőséget kínál a vakok életének és beilleszkedésének megkönnyítésére, de ezek terjedése lassú, aminek oka részben anyagi, részben az eszközök korlátozott használhatóságára vezethető vissza. A kutatások és maguk a hatékonyabb eszközök is költségesek, a vakok anyagi lehetőségei pedig rendszerint még a létező eszközök vagy programok megvásárlására sem elegendőek. A fentiek alapján rendkívül jelentős, hogy olcsó, könnyen használható, de a legkorszerűbb tudományos, műszaki és technológiai lehetőségeket kihasználó eszközöket kutassunk, fejlesszünk és terjesszünk. A projekt egyszerre több probléma megoldását is célul tűzte ki. Egyrészt az önálló közlekedést kívánja támogatni az útba eső akadályok akusztikus jelzésével, továbbá a fontos objektumok (buszmegálló, üzletek és szolgáltatási pontok stb.) megtalálását segíti magyar nyelvű beszédinformációval. Az első funkciót – az elkerülendő akadály detektálását – egy sztereo ultrahangos visszhanglokációs rendszerrel valósítottuk meg, a másodikat – a kiemelt objektumok megtalálását – pedig egy rádiós rendszerrel. A két rendszer vezérlését, irányítását korszerű digitális jelprocesszor végzi, csakúgy, mint a tájékoztató hangeffektusok és a mesterséges beszéd előállítását. 1. ábra A „Superbat” készülék elve A készülék akkumulátorról üzemeltethető, könnyű, kisméretű és egyszerűen használható, hogy a vak felhasználói igényekhez minél jobban igazodjon. MEGVALÓSÍTÁS A következőkben az egyes részegységek, alrendszerek működési elvét tárgyaljuk vázlatosan. Kétdimenziós ultrahangos visszhanglokátor 2. ábra A kétdimenziós ultrahangos visszhanglokáció elve A középen elhelyezett ultrahang adó periodikusan bocsát ki rövid mérőimpulzusokat a hallható hangtartomány feletti szűk frekvenciasávban (40 kHz névleges frekvencián). A visszhangjeleket mindkét oldali vevő érzékeli, és a visszaverődési időkből mind a távolságot, mind az irányt meg lehet határozni. Ehhez demodulálni kell a jeleket, majd a burkolót mintavételezni és digitálisan feldolgozni a precíz akadálylokáció érdekében IME III. ÉVFOLYAM 2. SZÁM 2004. MÁRCIUS 43 INFOKOMMUNIKÁCIÓ ÚJDONSÁGOK Mivel mindenkinek a hallórendszere a saját füléhez és fejéhez alkalmazkodott, ezért egy átlag szűrőkészlettel az érzeti térbe helyezés csak megközelítőleg lesz jó. A problémán egyénre szabott HRIR készletekkel lehet segíteni, pl. megoldható, hogy egy teszt alapján lehessen választani, majd az Interneten keresztül letölteni a kívánt szűrőpárkészletet. 3. ábra A baloldali vevő idealizált burkolójele A legközelebb lévő akadály távolságának és az irányának közelítő meghatározása: (további részletek a [3]-ban találhatók). A fent meghatározott akadálypozíciót speciális hangeffektusokkal jelezzük vissza a vak felhasználónak, úgy, hogy egyrészt megközelítőleg úgy hallja a hangot, mintha az akadály adta volna ki. Másrészt a távolságot hangmagassággal is érzékeltetjük kellemes gitárpengetés szerű szintetizált hanggal. Ennek a hangnak az előállítása nem tekinthető bonyolult feladatnak, azonban az akadály virtuális érzeti térbe helyezését érdemes röviden ismertetni. Kétdimenziós érzeti térbe helyezés Esetünkben csak a fejhez viszonyított vízszintes síkban detektáljuk az akadályokat a felhasználó előtt, így elég 5°-os felbontás esetén 18 szűrőpárt eltárolni, amelyeket 128 pontos FIR szűrők valósítanak meg [5]. Rádiós alrendszer A kiemelt objektumok megtalálását a rájuk szerelt fix telepítésű rádióadó/-vevők segítik. Ahogy az alábbi ábra is mutatja, a vak felhasználónál lévő mobil egység is rendelkezik rádióadó/-vevővel, így duplex adatátvitel is megvalósítható a két egység között. Így lehetővé válik a vak számára a „poll”-ozás, vagyis a közelében levő fix egységek lekérdezése, a kívánt egység kiválasztása, majd ultrahang segítségével a rávezetés is lehetséges. A kétirányú adatátvitel hasznos lehet továbbá buszon a leszállás jelzésére, jelzőlámpáknál és sok egyéb helyen. Az, hogy térben – főként az előttünk lévő vízszintes síkban – viszonylag jól azonosítani tudjuk egy hangforrás helyét, elsősorban a fejünk és fülkagylónk jellegzetes spektrumformáló tulajdonságainak, és az ehhez fűződő tanulási folyamatnak köszönhető [4]. Vagyis, sztereó fejhallgatóval elvileg tetszőleges érzeti teret hozhatunk létre, hiszen csak két hangcsatorna kódolja mind a forráshangot, mind annak a fejhez viszonyított relatív helyét. Tehát egy hangot úgy tehetünk az érzeti tér egy bizonyos pontjába, hogy a kiválasztott ponthoz tartozó szűrőpárral megszűrjük jobb és baloldalon a hangjelet, és fülhallgatón keresztül a megfelelő fülbe vezetjük az így kapott jeleket. A szűrők biztosítják a fej és a fülkagyló iránytól függő frekvenciamenetének modellezését. Matematikai szempontból a HRTF (Head Related Transfer Function) időtartománybeli megfelelőjével, a HRIR-rel (Head Related Impulse Response) végzünk konvolúciót két csatornán. 5. ábra A rádiós alrendszer egyszerűsített blokkvázlata Amint az illusztráció mutatja, általános soros adatátvitelt valósítunk meg a szabad ISM sávú rádiókommunikációval, így kötetlen szavas beszédszintetizátor esetén bárhol, bármikor felolvashatja a beszédszintetizátor a sugárzott információt. A rádiós összeköttetés távolsága maximum kb. 50 m lehet, amit egyéb technikákkal szükség esetén szűkíteni lehet. Kötetlen beszédszintézis 4. ábra A kétdimenziós érzeti térbe helyezés alapelve 44 IME III. ÉVFOLYAM 2. SZÁM 2004. MÁRCIUS A beszédszintetizátorunk az LSP (Line Spectrum Pair) beszédparaméterek azon tulajdonságait használja ki, hogy azok az idő folyamatos függvényei, azaz sok más beszédparaméterrel ellentétben – mint pl. a formánsok, LPC, vagy kepsztrum paraméterek – nem változnak ugrásszerűen, és nem is szűnnek meg egyes beszédszakaszokban. Így különösen alkalmasak arra, hogy kis hangadatbázis esetén is viszonylag jó beszédhangminőséget adjanak [6]. INFOKOMMUNIKÁCIÓ ÚJDONSÁGOK • • • • • 6. ábra A kötetlen beszédszintetizátor egyszerűsített blokkvázlata A rendszerbe be van építve egy graféma/fonéma átalakító és egy fonémából LSP, hangmagasság, zöngésség, erősítés-be konvertáló egység, így a rádiós soros összeköttetéssel karakterenként vett szavakat, mondatokat azoknak mennyiségétől és minőségétől függetlenül, azaz kötetlen módon fel tudja olvasni. A kísérleti eszköz funkcionális blokkvázlata Az eddig tárgyalt funkciókhoz egy kisméretű, hordozható jelprocesszor (DSP) alapú készüléket terveztünk. Az eszköz funkcionális blokkvázlata az alábbi ábrán látható. Analóg burkoló-demoduláció Ultrahang-frekvencia: 40 kHz Ultrahang-impulzus generálás: az egyik időzítő (timer) kimenetét felhasználva A rádiós modul oldható kötéssel illeszkedik Személyi számítógéphez soros v. párhuzamos porton kapcsolódik. Számítógépről a készülék működtető programja frissíthető, (akár interneten keresztül is), és a flash-memóriában tárolható. Az analóg interfészek segítségével pedig sztereó visszajelző hang generálható, valamint az ultrahangos modul felől érkező visszhang-burkoló jelek digitalizálhatók be. A saját fejlesztésű kártya tehát alkalmas arra, hogy a készülék magja legyen, a perifériák könnyen cserélhetők, párhuzamosan tesztelhetők, feljeszthetők. EREDMÉNYEK A projekt eredményeként elkészült egy egybeintegrált kísérleti eszköz, amelyet gyakorlatilag a létrehozandó termék prototípusának tekinthetünk. A készüléket elsősorban a működtető programjának írásával, bővítésével folyamatosan fejlesztjük, a DSP-t tartalmazó központi hardvert véglegesnek tekintjük. 8. ábra A készülék központi, DSP-s modulja 7. ábra A kísérleti eszköz funkcionális blokkvázlata Rövidítések feloldása, a rendszer legfontosabb jellemzői: • • • HPI: interfész a hoszt (PC) felé (program frissítés stb. céljából) DSP: alacsony fogyasztású, 16 bites fix pontos, 100 MIPS jelprocesszor AIC-k: Analóg interfész áramkörök: 16 bit, 22 KSPS DAC-ADC A készülék minden funkciója, és azoknak beállítása – a mobiltelefonokéhoz hasonlóan – négy vezérlőgombbal lehetséges. A rádiós modul nem látható a képen, de szintén a fenti készülékbe helyezhető, avagy igény szerint elhagyható. Az ultrahang szenzoros modul egy külön hardver egység, melyet a fülhallgatókhoz hasonlóan célszerű a fejjel egy koordinációs rendszerbe helyezni (pl. baseball-sapkára, szemüvegre), hogy a rendszer képességeit maximálisan ki lehessen használni. A készülék egyes funkcióit külön teszteltük, különös tekintettel a teljesen újszerű sztereo visszhanglokációs akadálydetektoros rendszerre, melynek eredményét több helyen is publikáltuk [3], [7]. IME III. ÉVFOLYAM 2. SZÁM 2004. MÁRCIUS 45 INFOKOMMUNIKÁCIÓ ÚJDONSÁGOK átfogó tesztelése jelen tanulmány megírásának pillanatában zajlik, az eredményeket publikálni fogjuk. ÖSSZEFOGLALÁS 9. ábra Vak programozó tesztelés közben Az elkészült egybeintegrált készüléket több konferencián is bemutattuk, ahol a vak illetve látó érdeklődők ki is próbálhatták az éppen aktuális szoftverváltozattal. A rendszer A vakok és gyengénlátók társadalmi beilleszkedését, mindennapi életét segítő speciális készüléket fejlesztettünk. Az eszköz prototípusa csaknem teljesen elkészült; az ultrahangszenzoros modul sorozatgyárthatósághoz való formálása és a szoftver fejlesztésének befejezése van csak hátra. Mivel a szükséges alkatrészek ára viszonylag alacsony, főként sorozatgyártás esetén jó eséllyel érhetjük el a célunk, hogy a vakok számára fejlesztett eszközt ők maguk is meg tudják vásárolni. Azonban a fix telepítésű rádiós egységek tekintetében az állami, önkormányzati szerepvállalás nélkülözhetetlennek látszik, és természetesen a mobil egységek elterjesztésében is számítunk erre. A készülék rádiós interfésze kompatíbilissá tehető más hazai rendszerekkel pusztán a működtető szoftver módosításával, így az országhatáron belül – vagy akár azon kívül is – bárhol használható lehet. IRODALOMJEGYZÉK [1] J. Borenstein, I. Ulrich, A. Arbor: The GuideCane – A Computerized Travel Aid for the Active Guidance of Blind Pedestrians, Proceedings of the IEEE International Conference on Robotics and Automation, Al-buquerque, NM, Apr. 21-27, 1997, 1283-1288. [2] Tony Heyes: An Electronic Travel Aid for the Vision Impaired, http://www.sonicpathfinder.org/ [3] Mihajlik Péter, Tatai Péter: Ultrahangos tájékozódó eszköz vakok számára, Hiradástechnika – Journal on C5, 1999, Vol. 50, 64-72 [4] Jens Blauert, Spatial Hearing: The MIT Press, Cambridge, MA, 1983, 171-182 [5] Bill Gardner, Keith Martin: HRTF Measurements of a KEMAR Dummy-Head Microphone, MIT Media Lab Perceptual Computing – Technical Report #280, May, 1994, http://sound.media.mit.edu/KEMAR.html [6] Lükő Bálint: A Low-Cost Speech Synthesis Method, Proceedings of 2003 Polish-Hungarian-Czech Workshop On Circuit Theory, Signal Processing, And Applications, Prague, Czech Republic, 11-13 Sept. 2003. [7] Mihajlik Péter, Guttermuth Mária, Seres Krisztián, Tatai Péter: A DSP-based Ultrasonic Navigation Aid for the Blind, Proceedings of IEEE Instrumentation and Measurement Technology Conference, Budapest, Hungary, 2001, 1535-1540. A SZERZÔK BEMUTATÁSA Tatai Péter 1964-ben végzett a BME Villamosmérnöki Karának híradástechnika szakán. 1964-től 1986-ig a Távközlési Kutató Intézetben dolgozott, ahol digitális átviteltechnikai és automatikus mérő rendszerek kutatásával és fejlesztésével foglalkozott. 1976-tól 1986-ig a Kódmodulációs Rendszerek osztályát 46 IME III. ÉVFOLYAM 2. SZÁM 2004. MÁRCIUS vezette. Összesen kb. 2 évet töltött tanulmányutakon japán, angol, svéd és német egyetemeken. 1986 óta a BME-n dolgozik, és részt vesz a távközlés oktatásában. Idejének nagyobb részét azonban a kutatás, valamint több kutatási téma irányítása tölti ki. Jelenleg főként digitális jelfeldolgozással, távközlési mérésekkel és beszédfelismeréssel foglalkozik. Több mint 90 publikációja jelent meg. INFOKOMMUNIKÁCIÓ ÚJDONSÁGOK Mihajlik Péter 1999-ben végzett a BME Villamosmérnöki és Informatikai Karán távközlési főszakirányon és orvosbiológiai technika mellékszakirányon. 1999től 2002-ig villamosmérnöki PhD képzé- sen vett részt a BME Távközlési és Médiainformatikai Tanszékén, majd ugyanott ügyvivő szakértőként dolgozott. 2004től tudományos segédmunkatársként foglalkozik a tanszéken kutatással, oktatással, és disszertációja elkészítésével, melyet automatikus beszédfelismerés témában ír. Balog András 2002-ben végzett a BME Villamosmérnöki és Informatikai Karán műszaki informatikusként. Utolsó egyetemi éveitől kezdve digitális jelfel- dolgozással és jelfeldolgozó rendszerek alacsony szintű programozásával foglalkozik. Jelenleg a vakok tájékozódását segítő eszköz szoftverének fejlesztését végzi az AITIA Informatikai Rt.-nél. Átadás Parádfürdőn 2004. február 6-án, ünnepélyes keretek közt adták át a Parádfürdői Kórház betegfelvételi egységét. A közel egy évig tartó beruházás keretében nemcsak a hotel szárny új bejárata és recepciós része valósult meg, hanem egy teljesen újszerű hálózati megoldással kiépült a most bevezetett integrált informatikai rendszer infrastruktúrája, valamint a betegágynál is használható telefonálási és internetezési lehetőség. Az ünnepélyes megnyitón Rácz Jenő, az ESZCSM helyettes államtitkára elmondta, hogy az országos intézetek fejlesztési elképzeléseiben a Parádfürdői Kórház – Hévízzel és a Sportkórházzal együtt – kiemelt helyet foglal el. Sós Tamás, a Heves Megyei Közgyűlés elnöke, a térség országgyűlési képviselője köszöntőjében kiemelte, hogy a Mátra és környéke az európai-uniós csatlakozás után is a régió egyik legjelentősebb idegenforgalmi területe, melyben fontos szerepet kap a gyógyturizmus. Zámbó László kórházi főigazgató hangsúlyozta, hogy a megújult és megszépült épületrészek ugyanúgy a betegek komfortérzetét és gyógyulásukat támogatja, mint az ezzel egy időben elkészült informatikai és kommunikációs rendszer. A kórházban elsőként épült ki egy olyan kábeltelevíziós hálózat, amely lehetővé teszi, hogy a betegágyak mellől közvetlenül lehessen a telefon hálózatot és az intranet szolgáltatásokat használni. A korszerű számítástechnikai lehetőségek igénybevételéhez szintén a kábeltelevíziós hálózat biztosít hátteret. A kórházi informatikai rendszert (MedSolution) rekord gyorsasággal telepítették és januártól a kórház teljes betegadminisztrációját e rendszerrel végzik. (Tudósítónktól) IME III. ÉVFOLYAM 2. SZÁM 2004. MÁRCIUS 47