Mindennapi boimetria – Autentikáció az egérmozgás vizsgálatával

Varga Gábor, 2005. április 26., Chip Magazin

Bizonyára az olvasó is használ számítógépes egeret. Bizonyára az olvasót is érdekli a biztonság. De vajon van-e a számítógépében biometrikus azonosítást lehetővé tevő eszköz?

1. Az ötlet a kutatás mögött

Néhány évvel ezelőtt vetődött fel a gondolat, mely szerint a számítógépes egér kezelésében nagy valószínűséggel megjelennek az egyéb finommozgásokra, például az írásra jellemző egyéni attribútumok. Több kutatócsoport is végzett ezt megelőzően kutatásokat az egér pszichés alapjellemzők kereséséhez, pillanatnyi lelki állapot meghatározásához vagy kézeredet azonosításához történő felhasználásával kapcsolatban, ám a gyakorlatban is használható megoldással egyikük sem állt elő. Az ELTE TTK Multimédiapedagógiai és Oktatástechnológiai Központ munkatársai a kézírás elemzésével, illetve a kézeredet azonosításával rokon, az informatika világához tartozó tudomány létjogosultságát kezdték el kutatni. Az Algernon projekt kutatásai arra irányultak, vajon megjelennek-e a számítógép használata során azok a speciális agyi területek által kontrollált finommozgások, melyek kifinomultsága és részletgazdagsága a kézírás esetében lehetővé teszi a szerző azonosítását. Újszerű kutatásmódszertannal, interdiszciplináris csapattal, az Informatikai és Hírközlési Minisztérium támogatásával érdekes eredményre bukkantak.

Abból a feltevésből indultak ki, hogy az írás egyénre jellemző mozgásmintázatainak egy része az egér kezelésében is megjelenik. Reményeik szerint megismerhető és tudományosan leírható az a mód, ahogy az egér mozgatása során megjelennek azok a finom eltérések ember és ember között, mely alapján akár a személyek azonosítását is el lehet végezni. A feladat tehát az egérrel történő interakció minél pontosabb rögzítése, és a különféle írássajátosságok hátterében meghúzódó struktúrák felismerése volt. Ezek segítséget nyújthatnak az egyén személyiségjellemzőinek becsléséhez, illetve a személyazonosság vizsgálatához a statisztika eszköztárára támaszkodva.

2. Jogi problémák

Jogi kérdések is felmerülhetnek a fejlesztés – és később a használat – során: az íráselemzéshez például az érintett személy írásbeli hozzájárulása szükséges, az azonosításhoz elengedhetetlen mozgásminták rögzítése és tárolása így szintén kényes kérdés lehet. A lehetséges felhasználók emellett vélhetőleg minőségbiztosítási tanúsítványokat is elvárnának a módszerhez, ezek megszerzése szintén néhány évet igénybe vehet.

A minták tárolása érzékeny terület, alapvető igény fűződik ahhoz, hogy megbízható szervezet lássa el ezt a feladatot. Ezt figyelembe véve került sor kliens-szerver architektúra kialakítására, ahol egy adott – titkosított - protokoll szerint történik az azonosítás. A mintavételt végző kliens nyílt forráskódú lesz, így bármilyen programozási nyelven készíthető lesz a protokollt ismerő szoftverkomponens.

3. Miért Java?

A fejlesztések kivitelezéséhez és a referenciaprogram megvalósításához Java környezetet választottak. A Java egy multiplatform programozási nyelv, ezt a tulajdonságát kihasználva azonnal széles körben elérhető lehet a szolgáltatás, megkönnyítheti további implementációk létrejöttét.

A rendelkezésre álló nagy osztálykönyvtár egyszerűbbé teszi a fejlesztést is, levéve a triviális feladatok terhét a fejlesztők válláról. Hálózati támogatása erős, célszerű választás kliens-szerver alkalmazás megvalósítására.

4. A mérés nehézségei

A mozgásminta rögzítéséhez a végzett mozdulatsort számítógépen lekérdezni nem túl bonyolult feladat, a legtöbb programozási nyelven mindössze pár soros az a program, ami jelentős hibákkal ugyan, de rögzíteni képes az egér elmozdulása esetén az egér vélt helyét, és a vélt pontos időt. A megoldandó feladathoz azonban ezek túl durva adatok. Akármilyen egeret is használunk, az egér helyzetének koordinátái egész számok, mivel ennél pontosabb adatra a számítógépnek nincs szüksége. Az így rögzített adatok csupán tizedmilliméter pontosságú helymeghatározáshoz elegendőek, ami a finommozgások vizsgálatához kevés.

4.1. A golyós egér alkalmatlan

A hagyományos – golyós – egerekben levő golyó perdületi tehetetlensége miatt egyrészt nehezen indul, másrészt késve áll meg. Hirtelen mozdulatoknál a golyó nem csak elfordulni, hanem elmozdulni is képes az egérben, mivel egy rugós szerkezet igazítja a forgatott fésűs kerekekhez, melyek az adatokat előállítják. A fésűs görgők és a golyó, illetve a golyó és az asztal közötti súrlódási együttható gyakran nem elég a csúszásmentesség biztosításához. Pontos fizikai modell felállítása esetén is – ami persze a számtalan különféle tehetetlenségű golyó, különféle rugóállandójú rugó, különböző súrlódási együtthatók és a mérési pontok ritkasága miatt egyébként is szinte lehetetlen – számolni kellene azzal, hogy a mérési adatok alapján gyakran megközelítőleg sem meghatározható a végzett mozdulat. Golyós egeret használva az egérrel végzett mozgás meghatározása a mért adatokból rendkívüli pontatlanságokat eredményezhet, melyek akár a finommozgások tartományába is eshetnek, ezért a kísérletekben ezzel nem foglalkoztak a kutatók.

4.2. Az optikai egér sem mindig elég pontos

Az optikai egereknél az adatok lekérdezése gyakoribb, mint a hagyományos egereknél, továbbá a mozgó alkatrészek hiánya miatt nem lép fel probléma sem a súrlódás, sem a tehetetlenség miatt. Ugyanakkor az optikai leképzés tökéletlensége miatt az egér nagy sebességű mozdítása esetén az elmozdulás már nem meghatározható, ez okozza az optikai egerek esetében a hirtelen rántásnál a kurzor helyben maradását. Ám ilyen nagy sebességű mozdítás az egérrel viszonylag ritka, és megoldható ezen mozdulatok utólagos közelítése tekintettel arra, hogy csupán néhány adat helyén találunk véletlen számokat, és a nagy sebességű mozgásszakaszok általában elég jól közelíthetők másodrendű görbével. Léteznek olyan egerek – számítógépes játékosoknak fejlesztve – amelyek ezt a hibát kiküszöbölik, azonban nem elég elterjedtek ahhoz, hogy mozgáselemző rendszert érdemes legyen fejleszteni hozzá.

4.3. Az idő mérése

A mozgás minél pontosabb meghatározásához természetesen nem elég csak az egér helyét ismerni, hanem az ahhoz tartozó időt is mérni kell. Ennek lekérdezése a legtöbb programnyelven elvileg milliszekundum pontossággal lehetséges, azonban ennek hibája rendkívül nagy. Rendszeresen két-három egérpozícióhoz is ugyanazt az időt kapjuk, és hasonló nagyságrendi tévedések fordulnak elő fordítva is. Ennek a problémának a kiküszöbölésére súlyozott átlagolás elvű közelítést alkalmazható.

4.4. A mozgás leírása

Figyelembe véve a hibákat a mozgás minél pontosabb leírása egy olyan görbe segítségével történik, mely az egér pillanatnyi megállása esetén tetszőleges iránytörést elszenvedhet, azonban mozgás esetén nem lehet benne törés, hanem a mozgás sebességétől függően minél nagyobb simulókörrel rendelkező Bezier-szerű görbe. Abban az esetben, hogyha a lekérdezett adatpontok egymástól távoliak, akkor nem okoz különösebb pontatlanságot feltételezni, hogy az egér valóban keresztülhaladt a mérési ponton. Egymáshoz közeli mérési pontok esetén azonban feltételezhető, hogy az egér nem cikk-cakkban haladt, vagyis a mérési pontokon nem ment keresztül, hanem egyszerű átlós irányú mozgást végzett. Ennek megfelelően, amennyiben a pontok egymáshoz közeliek, akkor egy másképp megfogalmazott, de lényegében továbbra is Bezier-szerű görbével becsülhető a végzett mozgás.

4.5. Más mutatóeszközök

Az eddigi mérések úgy történtek, hogy a tesztek résztvevői mindig ugyanazt az egeret használták. Azt egyelőre nem lehet tudni, hogy mennyire lennének sikeresek a mérések, ha ugyanaz a személy másik egérrel, vagy másfajta eszközzel – touchpaddel vagy trackballal – irányítaná a kurzort, ezek vizsgálata további kutatást igényel.

5. Jellemző minták keresése a nyert adatokban

Az egér mozgásának minél pontosabb mérését követően egy másik, sokkal nehezebb feladat megoldása következett. Akkor tudjuk felismerni a felhasználókat, ha meg tudjuk fogalmazni azokat a jellemzőket, amik viszonylagos állandóságot mutatnak egy egyén különböző mozgásainál, viszont minél nagyobb változatosságot különböző személyek egyazon feladat során végzett mozgásainál. Tehát az adatokon ún. szórásszétválasztást kellett alkalmazni.

100 jobbkezes ELTE hallgató 18 db, egyenként mintegy 10 másodperces, egérrel készített firkáját rögzítették. A firkakészítés egy pszichológiából vett módszer, melynek során az alanyok csupán azt az utasítást kapják, hogy egy megadott felületre, megadott idő alatt firkálják azt, amit szeretnének. Az első 7 firkát egyszerűen kidobták, mert ezek általában használhatatlanok a cél szempontjából, ennyi idő után unják meg ugyanis a kísérleti személyek, hogy különféle rajzokat készítsenek tényleges firkák helyett. A nyolcadikról még később lesz szó, és az utolsó tizet tették el, mint egyénre jellemző minta.

A mozgás vizsgálatához a kísérletben 400 féle mozgásjellemzőt határoztak meg. Az íráselemzésből már ismert egyéni jellemzőket a matematika, fizika, illetve az algoritmusok nyelvén fogalmazták meg, ez adta a paraméterek döntő részét, ilyenek voltak például a mozgás dinamikusságára, gördülékenységére, dőlésszögére vonatkozó adatok, vagy a kész firka fekete-fehér aránya. További mintegy 100 értékkel egészítették ki a mozgásjellemzést a modern pszichológia számítógépes rajzvizsgálatban használatos paramétereinek egeres környezetre adaptálásával, innen származott például a firka térkitöltésének fogalma.

Ahhoz, hogy el lehessen dönteni, hogy ezek közül mely paraméterek valóban egyénre jellemzők, a statisztika – már említett – szórásszétválasztó módszerét alkalmazták. A kutatócsoport által meghatározott jellemzők közül 11 bizonyult különösen erősnek a rögzített 100 teszt bármelyik felét véve alapul. Ebből következőleg az egész adathalmazt használhatták az eredmények teszteléséhez.

6. Eredmények

A felhasználók 30%-át egyáltalán nem jellemzi a megtalált 11 erős paraméter egyike sem. Ennek a 30 embernek az egy kéz által szolgáltatott mintán belüli szórása megegyezik a különböző emberek mozgásai közötti szórással. A felhasználók e része – a vizsgálat részeként kitöltött kérdőívből tudhatóan – általában nagyon keveset használ számítógépet. E csoport személyazonosítása éppúgy nem remélhető jelenleg, mint ahogy az írástudatlanok aláírásának a kézeredet-azonosítása sem megoldott.

A korábban már említett nyolcadik mérést hasonlítva a 100 db 10-es sorozathoz megpróbálta a program kitalálni, hogy kihez tartozhatott. Az algoritmus valójában minden egyes méréshez egy névsort készített, előre rakva azokat, akik nagyobb egyezést mutatnak, és a végére azokat, akik nem mutatnak egyezést. Közel 30 esetben elsőre eltalálja a program, hogy a 100 regisztrált felhasználó közül kinek a kezében volt az egér, és további közel 30 esetben meg tudja mutatni a program azt a 10 embert, amely között van a tényleges felhasználó.

Figyelembe véve ezt az eredményt kimondható, hogy a számítógépes egérrel végzett firka alapján a kézeredet azonosítása – jelentős hibával ugyan – de lehetséges. A személyazonosítás feltehetően pontosítható lenne további jellemzők megfogalmazásával. Bár a módszer jelenlegi állapotában nem rendelkezik azzal a megbízhatósági szinttel, amely önmagában alkalmassá tenné megbízható azonosításra, a mai autentikációs megoldások kiegészítéseként nagyban növelheti a biztonságot.

A pontosságot két értékkel jellemezhetjük: a jogosulatlanul beengedett felhasználók számával (FAR – false accept rate), és a jogosult felhasználók kirekesztésének arányával (FRR – false reject rate). A két görbe metszéspontja a CER (crossover error rate) arány, ennek 8-9% körüli értéke általában már normálisnak mondható. A mérések során egyelőre csak 21%-os CER értéket értek el, de mivel a módszer kidolgozása még kezdeti fázisában tart, jelentősen javulhat, ami bizalomra adhat okot.

A biometrikus rendszereket általában öt fontos tulajdonságukkal jellemezhetjük: az egyediség (a jellemvonás minél inkább egyedi legyen), az egyetemesség (minél több emberen legyen elvégezhető a módszer), az állandóság (időben minél kevesebbet változzon a jellemző), a mérhetőség (a mérés egyszerűsége és erőforrásigénye) és a felhasználóközeliség (kényelem). A biometrikus azonosítórendszerek nem egy egyszerű skálán helyezkednek el, hanem a fenti jellemzők által meghatározott ötdimenziós térben. Látható, hogy míg az írisz- vagy DNS-minta megfelelő biztonságot képes garantálni, drága és körülményes, nem mindig megfelelő, vannak esetek, amikor jobb választás egy olcsóbb, kényelmesebb megoldás választása annak ellenére, hogy akár nagyságrendekkel pontatlanabb.

A számítógépek kevesebb mint 1%-a rendelkezik biometrikus azonosítás elvégzéséhez szükséges hardverrel, azonban közel 100%-a rendelkezik egérrel. A két százalékos érték közötti mintegy 99% számára az egérmozgáson alapuló azonosításon kívül semilyen „nem leleshető” biometrikus eszköz nem áll jelenleg rendelkezésre. A projektnek bár célja megközelíteni más rendszerek pontosságát, azonban 99%-os hiánypótló jellegéből fakadóan más költséges biometriai rendszerekhez képest lényegesen gyengébb érték is komoly eredménynek, biztonságot növelő tényezőnek tekinthető.

7. További kutatások

A kutatócsoport tovább folytatja ennek az izgalmas területnek a felfedezését. Mindenekelőtt javítani kell a vizsgálati módszer megbízhatóságát ahhoz, hogy a mindennapi életben is használni lehessen majd. Az a kérdés foglalkoztatja az Algernon csoport munkatársait, hogy az optikai egérrel szerzett tapasztalatok hogyan ültethetők át más mutatóeszközökre: a digitalizálótáblára, a trackballra vagy az érintőképernyőre. Azt is érdemes lehet megvizsgálni, hogy a viselkedést vagy az érzékelést befolyásoló hatások, mint például az alkoholfogyasztás, kimutathatóak-e az egérkezelés vizsgálata útján.

Kutatások folynak a technológia más területeken történő felhasználásáról is. Mivel alkalmas személyiségjegyek becslésére, így alkalmazható olyan helyzetekben, ahol bizonyos csoportokat kell felismerni adott jellemzők alapján, ilyen például a célzott hirdetések kiszolgálása. Minél finomabb a targetálás, annál nagyobb hatékonysággal működhetnek az online reklámozók. Használható minden olyan területen, ahol gyors személyiségtesztekre van szükség: munkainterjúk elemeként, fejvadász cégeknél vagy az emberi erőforrás-menedzsmentben.

A szoftver egérmozgást rögzítő és elemző komponense felhasználható oktató és fejlesztő programokban is, a kutatócsoport Egérút projektjének célja részképességzavaros – diszlexiás, diszgráfiás, tanulási és viselkedési zavarokkal küzdő – gyermekek kezelésének segítése egy terápiás anyagokat tartalmazó CD-vel.

8. A jövő

Elképzelhető, hogy lejár a banki átutalásokhoz szükséges pinkódok korszaka. Lehetséges, hogy elektronikus leveleink olvasásához is sokkal nagyobb biztonsággal léphetünk be saját egérmozgásunkkal, mint jelszavunkkal. Bűnöző hajlamú elemek nem tudnak majd repülőjegyet foglalni az interneten – ezek nem is olyan távoli víziók, az Algernon projekt kutatásai hatalmas lépést jelentenek ezen az úton: olcsó, mindenhol elérhető biometrikus azonosítást prognosztizálnak.

A digitális aláírások mellett egy újabb eszköz jöhet létre, amely nagy biztonsággal azonosítja a felhasználót. Tényleg megvalósulhat az információs társadalom a papír alapú társadalom helyett.

A kutatás világújdonságnak számít, a projekt jövője viszont egyelőre bizonytalan. Több év alapkutatás után még mindig legalább ugyanennyi időt kell a kutatással és fejlesztéssel eltölteni, ez idő- és erőforrásigényes feladat.