Ennustus

Richard Wiseman on ehdottomasti eräs suosikkejani tieteen popularisoinnissa, hän on täysin omalla tasollaan havainnollistaessaan erilaisia ilmiöitä. Hän myös julkaisee mainioita Youtube-videoita, joissa on erilaisia temppuja. Tässä videossa hän tekee ennustuksen: jos toimit sääntöjen mukaan, hän pystyy ennustamaan sormesi sijainnin näytöllä. Kuuntele säännöt tarkasti! Huomaa, että videon kuluessa hän kertoo koko ajan, mitä lappua et ole valinnut. Itse en heti saanut tästä selvää ja luulin, että hän kertoo, missä sormen pitäisi minäkin hetkenä olla, ja temppu näytti epäonnistuvan alusta lähtien.

Kategoriat: videot | Avainsanat: | Jätä kommentti

Psykologia ja Wikipedia

Kirjoitin iltapuhteeksi lyhyen artikkelin Wikipediaan. Etsiskelin italialaisen psykologin Gaetano Kanizsan taustatietoja ja google ohjasi tietenkin englanninkieliseen Wikipediaan. Huomasin, että artikkeli oli tosi lyhyt ja nopeasti käännettävissä suomeksi, joten naputtelin siitä suomennetun version. Suomenkielisessä Wikipediassa on psykologiasta luvattoman vähän artikkeleita ja ne, jotka sieltä sattuvat löytymään, ovat todella lyhyitä. Jos vaikka vertailee hakusanan ”psykofysiikka” suomenkielistä ja englanninkielistä versiota, niin erot ovat aika selkeitä. Jonkun siis pitäisi parannella noita, mutta taitaa olla niin, että ne jotka osaisivat tuonne kirjoittaa, eivät ehdi sitä tekemään ja ne jotka ehtisivät, eivät osaa tai heitä ei kiinnosta.

Eräs hyvä resurssi olisivat psykologian opiskelijat, heillä olisi intoa ja aikaa tehdä tällaista. Mallia voisi ottaa Association for Psychological Sciencen hankkeesta englanninkielisen Wikipedian psykologia-artikkelien parantamiseksi. Ehkä tästä voisi jopa jakaa opintopisteitä. Allekirjoittanuthan oleilee yliopistolla opintopisteitä jakamassa, joten ehkä pitäisi itse kehitellä tätä eteenpäin.

Kategoriat: psykologia | Avainsanat: , , | Jätä kommentti

Pop-out -virittymistä viivoilla ja väreillä

Äskeisen kauppareissun jälkeen löysin autoni marketin parkkipaikalta aika helposti, punainen auto sattui helposti silmiini muiden autojen joukosta, koska lähellä ei ollut muita punaisia autoja. Ihan mukavaa vaihtelua, joskus autoa on todella vaikea löytää kauppakeskusten jättimäisiltä parkkipaikoilta. Visuaalisen kognition näkökulmasta suoritin parkkipaikalla visuaalisen haun tehtävää, jossa etsin kohdeärsykettä (punainen Mazda) häiriöärsykkeiden (muut autot) joukosta.

Yleensä visuualisen haun tehtävät tehdään yksinkertaisemmilla kuvioilla, joissa kohdeärsykettä täytyy hakea häiriöärsykkeistä koostuvasta matrisiista. Alla olevassa kuvassa tehtävä on todella helppo, vihreä palkki erottuu punaisten palkkien seasta välittömästi ja täysin vaivattomasti. Tällaista hakua kutsutaan tehokkaaksi visuaaliseksi hauksi ja kohdekuvion välittömästi esille hypähtävää luonnetta kutsutaan ”pop-out”-ilmiöksi, mikä vapaasti suomennettuna voisi olla vaikka silmille hyppäysilmiö.

Popout

Kuva 1. Pop-out-ilmiö: Vihreä palkki erottuu punaisten joukosta välittömästi.

Joissain tapauksissa kohdetta ei ole niin helppo erottaa häiriöärsykkeiden joukosta. Esimerkiksi kuvassa 2 T-kirjaimen löytämiseen menee hetken aikaa, koska siinä on samoja piirteitä kuin häiriöärsykkeinä toimivissa L-kirjaimissa. Kyllähän se T sieltä löytyy, mutta se ei samalla tavalla hyppää silmille vaan sitä pitää tietoisesti etsiä. Tällaista hakua kutsutaan vähemmän tehokkaaksi visuaaliseksi hauksi.

Notpopout

Kuva 2. T-kirjaimen löytämiseen L-kirjainten joukosta menee hetki aikaa.

Popout-ilmiön yhteydessä on havaittu mielenkiintoinen virittämisilmiö, jossa aikaisemmin havaitut ärsykkeet vaikuttavat tehokkaan visuaalisen haun nopeuteen. On esimerkiksi huomattu, että jos henkilö katsoo peräkkäin useampia ärsykematriiseja, joissa kohdeärsyke on tietyn värinen, vaikkapa vihreä, hänen reaktionopeutensa kasvaa. Tämä tarkoittaa sitä, että henkilön kognitiiviset järjestelmät pystyvät jollakin tavalla virittymään vihreyden löytämiseen ja siksi henkilön reaktionopeus paranee.

Mistä haun kohdetta määrittelevässä virittymisilmiössä sitten on kyse? Eräs mahdollisuus on se, että kognitiot herkistyvät havaitsemaan tietynlaista kohdeärsykettä. Toinen mahdollisuus on kuitenkin se, että kognitiot tottuvat häiriöärsykkeisiin ja pystyvät paremmin jättämään ne huomiotta. Tätä tutkittiin Journal of Visionin artikkelissa, joka minulla on syyslomalukemisena (Michal & Beck, 2014).

Kokeessa koehenkilöiden piti mahdollisimman nopeasti löytää kuvaruudulle ilmestyvien kuvioiden joukosta se ympyrä, jonka viivat olivat eri suuntaisia kuin muiden ympyröiden. Eli kuvan 3 esimerkissä kohdeärsyke on ympyrä, jossa oli pystysuoria viivoja ja häiriöärsykkeenä oli vaakasuoria viivoja. Kun he olivat löytäneet poikkeavan ympyrän, heidän piti mahdollisimman nopeasti raportoida, oliko poikkeava ympyrä kuvan oikealla vai vasemmalla puolella. Lisäksi ympyrät saattoivat olla sinisiä tai punaisia, mutta tämä oli vain lisähäirintää, joka koehenkilön piti jättää huomiotta.

Visual search

Kuva 3. Kokeessa koehenkilöt etsivät pystysuoria viivoja vaakasuorien joukosta. Väri piti jättää huomiotta.

Tutkijat olivat kiinnostuneita siitä, miten kokeessa muunneltavien piirteiden (viivojen suunta ja väri) toistuminen vaikutti reaktionopeuteen. Jos esimerkiksi vaakasuorat viivat ovat useamman kerran peräkkäin kohdeärsykkeenä, voisi olettaa, että virittymisen seurauksena reaktionopeus kasvaisi.

Kiinnostavaksi kokeen tekee se, että siinä vaihtelee myös tehtävän kannalta epäolennainen väri ja myös se voi toistua eri koekertoina. Itse asiassa kahden peräkkäisen ärsykematrisiin esityskerran välillä voi tapahtua neljä erilaista asiaa: kohteena olevan kuvion viivojen suunta toistuu (tehtävän kannalta olennainen piirre), kohdeärsykkeen väri toistuu (tehtävän kannalta epäolennainen piirre), sekä kohdeärsykkeen väri että viivojen suunta toistuu tai kumpikaan ei toistu.Vertailemalla reaktionopeutta eri tilanteiden välillä pystytään selvittämään, mitä pop-out-ilmiöön liittyvässä virittymisessä oikein tapahtuu.

Tulokset osoittivat, että kun tehtävän kannalta olennainen piirre, eli viivojen suunta, toistui, nopeutui reaktionopeus selvästi. Kiinnostavaa kyllä, myös tehtävän kannalta epäolennaisen piirteen eli värin toistuminen nopeutti reaktioita. Osa virittymisestä tapahtui siis tiedostamattomasti, ilman että niitä käsiteltiin osana tehtävää. Tämä myös tarkoittaa sitä, että näköjärjestelmä ei aktiivisesti karsinut häiriöärsykkeitä pois. Tehtävän kannalta epäolennaisen värin tuottama reaktionopeuden parantuminen oli kuitenkin vähäisempää. Jos toistoja oli usempia kuin yksi, tehtävän kannalta olennaisen ulottuvuuden toistuminen paransi reaktionopeutta entisestään kun taas värillä lisätoistot eivät tuoneet parannusta.

Tulokset viittaavat siihen, että pop-out-virittyminen on enemmänkin sitä, että näköjärjestelmä alkaa ennakoimaan tietyn piirteen prosessointia kuin sitä, että näköjärjestelmä aktiivisesti karsisi häiriöärsykkeet pois.

Lähteet

Michal, A. L., & Beck, D. M. (2014). Relative contributions of task-relevant and task-irrelevant dimensions in priming of pop-out. Journal of Vision, 14, 1–12. doi:10.1167/14.12.14.doi

Kategoriat: tarkkaavaisuus | Avainsanat: , , , | Jätä kommentti

Pistejoukot kävelevät meitä kohti

Onpa ollut pitkä tauko blogauksessa, tutkijan työhän uppoutuu niin helposti, että unohtaa kaiken muun. Nyt alkaa kuitenkin lyhyt syysloma, jonka ajattelin aloittaa pienellä blogauksella. Lomalukemisena menin katsomaan Journal of Vision-lehden uusinta numeroa ja siellä olevaa artikkelia biologisesta liikkeestä. Biologisella liikkeellähän tarkoitetaan ilmiötä, jossa voimme parin valopisteen liikkeen avulla tunnistaa liikkuvan ihmisen. Esimerkki ilmiöstä on alla olevassa videossa.

Hämmästyttävää ilmiössä on se, että teemme tulkinnan liikkuvasta ihmisestä vain muutaman sopivasti liikkuvan pisteen avulla. Biologisen liikkeen keksi Gunnar Johansson Uppsalan yliopistosta. Johanssonin ryhmän työtä esitteleviä 1970-luvulla tehtyjä mahtavia videoita on laitettu YouTubeen. Videossa kiinnittää huomion alkeellinen tekniikka, tuolloin ei ole ollut tietokoneita, joilla näyttää liikkuvia valopisteitä.

Biologista liikettä on tutkittu paljon ja on huomattu, että havaitsija voi tehdä sen avulla monenlaisia päätelmiä liikkuvasta henkilöstä. Sopivasti pisteiden liikeratoja muuttamalla henkilö voi näyttää naiselta tai mieheltä, iloiselta tai surulliselta tai lihavalta tai laihalta. Bio Motion Labilla on verkkosivullaan demo, jossa liikkuvien valopisteiden nopeuksia voi muuttaa siten, että ne näyttävät muuttavan liikkuvan henkilön ominaisuuksia. Demo on todella hauska, kannattaa kokeilla!

Kun kokeilet demoa, niin todennäköisesti automaattisesti oletat, että pisteiden kuvaama henkilö kävelee sinua kohden. Tämä on kuitenkin pelkkä olettamus, mikään pisteissä ei oikeuta tällaista tulkintaa, vaan pistehahmo voisi yhtä lailla kävellä sinusta poispäin. Tätä olettamusta tutkittiin lukemassani Journal of Visionin artikkelissa (Weech et al, 2014). Artikkelissa todetaan, että tulkinta katsojaa lähestyvästä kävelijästä liittyy yleisempään kuperuusolettamukseen, joka meillä on havaintomaailmasta.  Esimerkiksi hienot lohikäärmevideot, joissa kovera pahvinen lohikäärme näyttää kuperalta, ovat esimerkkejä olettamuksesta. Pistejoukko, joka näyttää ihmiseltä on toisella tapaa epäselvä kuin pahvilohikäärme, mutta myös tässä tapauksessa katsoja olettaa, että kävelevä kohde on ulottuvaisempi meidän suuntaamme, eli meitä kohden kohdistuu kävelijän ulkonevat osat, ei loittoneva selkä.

Lähteet

Weech, S., McAdam,M., Kenny, S. & Troje, N.F. (2014) What causes the facing-the-viewer bias in biological motion? J Vis October 13, 2014 14(12): 10; doi:10.1167/14.12.10

Kategoriat: Biologinen liike, Liikkeen havaitseminen | Jätä kommentti

Illusorinen musiikkivideo

Tiukka Suomen Akatemian rahoitushakemuksen kirjoitusrupeama on nyt takana, joten välillä voi rentoutua videoiden parissa: Tässä musiikkivideossa on upea kokoelma erilaisia anamorfisia illuusioita. Lisäksi löytyy aika näppäriä peileillä toteutettuja efektejä. Videon tekemiseen ja efektien yksityiskohtiin voi tutustua verkkosivulla, jossa on interaktiivinen Behind the Scenes-osio.

Kategoriat: havaitseminen, illuusiot | Avainsanat: , | Jätä kommentti

Valokuvien ja piirrosten erot

Meitä ympäröivä maailma ei ole satunnainen paikka, vaan sieltä löytyy monia säännönmukaisuuksia. Esimerkiksi pöytä estää kahvikuppia putoamasta lattialle, mutta pöydän reunan yli työnnetty kuppi putoaa heti. Näitä säännönmukaisuuksia pitää opetella ja siksi lapsi tykkää loputtomasti tuupata esineitä pöydän yli ja katsoa kerta toisensa jälkeen, kuinka esine hämmästyttävästi jälleen kerran sujahtaa lattialle.

Voisi siis kuvitella, että näköjärjestelmämme on erikoistunut käsittelemään luonnollisiin näkymiin liittyvää tietoa. Tämä erikoistuminen tarkoittaa esimerkiksi sitä, että tehdään erilaisia olettamuksia. Aikuisena esimerkiksi oletamme automaattisesti, että pöydän yli töytäisty kuppi putoaa lattialle eikä meidän tarvitse kokeilla asiaa joka aamu uudestaan.

Olettamukset maailman toiminnasta ovat tallentuneina sisäisiin malleihin maailmasta, representaatioihin, joita havaintopsykologia tutkii. Monissa tutkimuksissa on kuitenkin käytetty kuvia, joilla ei ole kovinkaan paljon tekemistä luonnollisen maailman kanssa. Kuvassa 1. on esimerkki vanhemmassa tutkimuksessa käytetystä ärsykkeestä, joka on valkoisella taustalla oleva viivapiirros. Tällaisen yksinkertaisen kuvan käyttämisellä on ollut hyviä perusteluja: se ei sisällä värejä tai muuta häiritsevää, joten voidaan ajatella, että tässä oikeasti mitataan vain kuvassa ääriviivoilla määriteltyjen asioiden havaitsemista.

Biederman

Kuva 1. Kuva havaintokokeesta (Biederman et al, 1982).

Kun käytetään yksinkertaista viivapiirrosta, on hyvä miettiä, miten saatuja tuloksia voidaan soveltaa arkipäiväisessä elämässä tapahtuvaan näkötiedonkäsittelyyn. Kuinka paljon epärealistisilla ärsykekuvilla saadut tulokset kertovat vain näiden ärsykekuvien havaitsemisesta ja kuinka paljon kognitiivisista prosesseista yleisemmin? Tätä ovat miettineet myös Tatler ja Melcher (2007), joiden tutkimusta käyn tässä blogauksessa läpi.

Tatler ja Melcher testasivat, onko kuvassa olevien esineiden ominaisuuksia helpompi muistaa valokuvista kuin piirretyistä kuvista. Koeasetelmassa koehenkilöt katselivat kuvia ja jokaisen kuvan jälkeen heille esitettiin kuvasta kysymyksiä kuvassa olleiden esineiden määrästä, paikasta tai ominaisuuksista. Kuvat olivat joko valokuvia tai piirroksia, jolloin voitiin selvitellä, oliko valokuviin liittyvien piirteiden muistaminen helpompaa verrattuna muihin kuviin. Lisäksi kokeessa muuteltiin kuvien esitysaikaa, toisessa kokeessa kuvat näkyivät sekunnin ajan ja toisessa kokeessa kuvat näkyivät kymmenen sekunnin ajan.

Tulokset osoittivat, että valokuvista muistettiin enemmän yksityiskohtia kuin piirroksista ja maalauksista. Yhden sekunnin esitysajalla koehenkilöt saivat alle 50% vastauksista oikein piirroksilla, mutta valokuvilla oikeita vastauksia tuli yli 60%. Kun kuvaa esitettiin kymmenen sekunnin ajan, ero tasoittui, mutta edelleen piirrosten ja maalausten yksityiskohdista muistettiin noin 75% ja valokuvien yksityiskohdista 85%.

Näköjärjestelmä toimii siis paremmin valokuvissa, jotka muistuttavat enemmän arkipäivän havaintomaailmaa. Tulos on hiukan paradoksaalinen, koska valokuvissa on enemmän tietoa ja yksityiskohtia kuin viivapiirroksissa. Luulisi siis, että ylimääräinen tieto häiritsee tiedon käsittelyä ja muistamista, mutta näin ei selvästikään ole. Tulos on hiukan huolestuttava monien klassisten psykologian tulosten kannalta, mutta onneksi valokuvien käyttäminen on nykytrendi tutkimuksessa, joten tätä virhettä ei ainakaan tehdä uudestaan.

Lähteet

Tatler, B.W. & Melcher, D. (2007) Pictures in mind: Initial encoding of object properties varies with the realisim of the scene stimulus. Perception 36, 1715-1729.

Kategoriat: havaitseminen, näkymien havaitseminen | 2 kommenttia

Kuinka kolmiulotteisia kasvoja katsotaan?

Olemme erikoistuneita kasvojen tunnistamiseen ja tarkkailuun, on nimittäin erittäin tärkeää tunnistaa tutut kasvot vieraiden joukosta ja lukea kasvoista tunnetiloja ja aikeita. Kasvojen avulla voimme tavallaan lukea toisten ajatuksia ja siten varautua paremmin muiden toimintaan. Toisaalta olemme myös aika hyviä peittämään tunteitamme, moni pystyy pitämään naaman peruslukemilla vaikka kuinka harmittaisi.

Millä tavalla kasvot sitten tunnistetaan? Aiheesta on tehty paljon psykologisia kokeita, joissa on mitattu, mihin silmät kohdistuvat kasvoja tarkasteltaessa. Tulosten mukaan katse kohdistuu todella usein silmiin ja nenään, ja jonkin verran suun alueelle. Nämä alueet siis sisältävät olennaista henkilöiden ja ilmeiden tunnistamiseen tarvittavaa tietoa.

Aikaisemmat tutkimukset on tehty näyttämällä kasvovalokuvia tietokoneen ruudulla, mikä ei täysin vastaa arkipäivän katselutilannetta, jossa kasvot ovat kolmiulotteiset. Niinpä Chelnokova ja Laeng (2011) ovat tutkimuksessaan selvittäneet, mitä eroa on silmänliikkeillä kun katsotaan kaksi- ja kolmiulotteisia kuvia.

Kokeita varten otettiin valokuvia neljästä miehestä ja naisesta. Kokeita varten kuvista poistettiin hiukset, jolloin tunnistamiseen voi käyttää vain kasvonpiirteitä. Kustakin kasvosta otettiin kaksi kuvaa, joiden välillä kameraa siirrettiin 6,5 cm vaakasuuntaisesti. Sen jälkeen nämä kaksi kuvaa yhdistettiin anaglyfistereogrammiksi, jossa kuvien välisiä eroja korostetaan eri väreillä. Kun tällaista kuvaa katsotaan laseilla, joissa oikean ja vasemman silmän edessä on eri värinen värikalvo, kuva näyttää kolmiulotteiselta. Alla olevassa kuvassa alemman rivin kuvissa näkyy turkoosin sävyjä, jotka värilaseilla näkyvät vain toiseen silmään ja näin luovat kolmiulotteisuusvaikutelman.

F1.large

Koeasetelmassa katsottiin ensin 1500 millisekuntia kohdistuspistettä (fixation cross), jonka jälkeen ruudulle ilmestyi kahden sekunnin ajaksi kasvokuva. Sen jälkeen tuli 50 millisekunnin harmaa tausta ja lopuksi vastausruutu, jossa koehenkilön piti valita viiden kasvokuvan joukosta ne kasvot, jotka he äsken näkivät.

F2.medium

Ei ole mitenkään yllättävää, että tulokset osoittivat kolmiulotteisten kasvojen tunnistamisen olevan tarkempaa kuin kaksiulotteisten. Tehtävä oli aika helppo, kaksiulotteisessa tilanteessa kasvoja tunnistettiin 88% oikein ja kolmiulotteisessa 92%. Silmänliikkeiden analyysi tehtiin määrittelemällä kuvaan niin kutsuttuja kiinnostavuusaleita (region of interest eli ROI). Käytännössä tämä tarkoittaa sitä, että kasvot jaettiin alueisiin kuten alla olevassa kuvassa: otsa, oikea silmä, vasen silmä jne. Tämän jälkeen laskettiin, kuinka pitkän aikaa katse kohdistui kuhunkin näistä alueista.

 

F5.medium

Tulokset on kuvattu olevassa pylväsdiagrammissa. Ylemmässä kuviossa (A) näkyy katseen kohdistusten suhteelliset ajat. Silmät ovat selvästi kiinnostaneet eniten, 22% katseluajasta on mennyt niiden katsomiseen. Hyvänä kakkosena tulee nenä, joka on ollut lähes yhtä kiinnostava. Suuhun ja poskiin on kiinnitetty selvästi vähemmän huomiota.

Alemmassa kuviossa (B) on samat tulokset esitetty niin, että katseen kohdistukset kaksi- ja kolmiulotteisissa kuvissa on erotelty toisistaan. Erot ovatkin selviä, kolmiulotteisessa kuvassa nenää katsotaan pidempään kuin silmiä. Myös poskia katsotaan kolmiulotteisessa kuvassa enemmän. Tulos tuntuu suhteellisen loogiselta, kolmiulotteiset kuvan osat vetävät katsetta enemmän puoleensa.

F6.medium

Tulosten esittelyn jälkeen alkaa kuitenkin selittelyosio, jossa selvästi puututaan artikkelin arviointiprosessin aikana esille tulleisiin asioihin. Ja ongelmiahan riittää. Ensinnäkin, kolmiulotteista kuvaa on katsottu värilasien läpi, mutta kaksiulotteista kuvaa on katseltu ilman laseja. Kasvoissa on siis ollut paljon muutakin eroa kuin kolmiulotteisuus. Toiseksi, stereokuva oli otettu siirtämällä kameraa vaakasuuntaisesti. Menetelmäosioissa ei ole mitään mainintaa jalustasta tai kuvien kalibroimisesta. Jos kuvat on todella otettu käsivaralla ainoastaan kameraa vaakasuuntaisesti siirtäen, voi stereokuvissa olla todella pahoja virheitä, jotka voivat helposti kiinnittää katsojien huomion. Stereokuvat voivat siis näyttää paitsi kolmiulotteisilta, myös oudoilta tai täysin vääriltä. Nämä ovat aika vakavia ongelmia, joten artikkelin kirjoittajilta on vaadittu toinen koe, jossa virheet on korjattu.

Kakkoskokeessa stereokuvat on otettu Fujifilmin stereokameralla, jossa on kaksi kameraa kiinteällä etäisyydellä toisistaan. Tämä on varmasti parantanut kuvien laatua. Kuvia ei kuitenkaan ole tälläkään kertaa tarkistettu virheiden varalta. Lisäksi toisessa kokeessa on tutkittu anaglyfisten värilasien vaikutusta ilmiöön tekemällä neljä eri koeversiota: kaksiulotteiset kuvat ilman anaglyfilaseja, kaksiulotteiset kuvat anaglyfilasien kanssa, kolmiulotteiset kuvat ilman anaglyfilaseja ja kolmiulotteiset kuvat anaglyfilasien kanssa. Tuossa ”kolmiulotteiset kuvat ilman anaglyfilaseja” -koetilanteessa on kyllä se vika, että kuvat eivät ole näyttäneet kolmiulotteisilta. Anaglyfilasien ja kolmiulotteisuuden vuorovaikutusta tässä ei siis pystytä sulkemaan pois. Jostain syystä myös kasvojen katseluaikaa on pidennetty sekunnilla kolmeen sekuntiin.

Yleiset tulokset (Kuva A alla) ovat aika samanlaisia kuin ykköskokeessa, silmiä ja nenää katsotaan eniten. Kaksi- ja kolmiulotteisten kuvien vertailu (Kuva B alla) paljastuu kuitenkin jotakin outoa. Ensinnäkin, jostain syystä ajat raportoidaan tällä kertaa keskimääräisinä katseenkohdistusaikoina (Mean fixation time), jolloin tuloksia on vaikeampi vertailla edelliseen kokeeseen, jossa raportoitiin suhteelliset kohdistusajat prosentteina. Tämä ei ehkä ole kriittistä, mutta hankaloittaa vertailua.

Mielenkiintoinen juttu on silmiin kohdistuvien kohdistusten erojen väheneminen 2D- ja 3D-tilanteiden välillä. Miksi muutetussa asetelmassa ihmiset katsovat 3D-tilanteessa enemmän silmiin? Eräs selitys saattaisi olla pidentyneessä katseluajassa, ykkös- ja kakkoskokeessahan katseluaika piteni sekunnilla. Lyhyemmällä katseluajalla katse kohdistuu ensimmäisenä kuvan selkeästi erottuviin osiin eli niihin, jossa on paljon syvyyttä. Sen sijaan silmät, jotka ovat taustalla, eivät vedä huomiota aluksi niin paljon puoleensa. Mitä pidempi katseluaika on, sitä todennäköisemmin katselu alkaa muistuttamaan tavallista kasvojen katselua, missä silmät ovat tärkeä vihje siitä, mitä henkilö ajattelee ja aikoo seuraavaksi tehdä.

F12.medium

Kokonaisuuteena artikkeli on ihan mielenkiintoinen ja kertoo siitä, että kaksiulotteisilla kuvilla tehdyt kokeet eivät välttämättä kerro oikein sitä, mihin silmät kohdistuvat kasvoja tarkasteltaessa. Kolmiulotteisissa kasvoissa nenä ja poskipäät vievät huomiota enemmän. Toisaalta kokeessa on myös pahoja ongelmia, joista anaglyfilasien käyttäminen on se selkein. Anaglyfilasien värisuodattimet tuottavat aina erilaisia virheitä kuviin ja laseja käytettäessä näyttö pitäisi kalibroida huolellisesti, jotta näytön värit vastaisivat värisuodatinten väriä riittävän tarkasti. Lisäksi lyhyehkö näyttöaika on ongelmallinen juttu, se voi ylikorostaa syvyydessä erottuvien alueiden merkitystä. Tämä koe pitäisi toistaa hiukan paremmalla koeasetelmalla.

Lähteet

Chelnokova, O., & Laeng, B. (2011). Three-dimensional information in face recognition: An eye-tracking study. Journal of vision, 11, 1–15.

 

Kategoriat: havaitseminen, kasvojen havaitseminen, neurotiede, S3D, silmänliikkeet, stereonäkö, tarkkaavaisuus | Avainsanat: | Jätä kommentti

Kuinka nopeasti kuvan aihe nähdään?

Näköjärjestelmä analysoi näkymän erilaisia piirteitä, kuten värejä ja ääriviivoja, rinnakkaisesti ja hierarkkisesti. Rinnakkaisuus tarkoittaa sitä, että eri näkymän piirteitä käsitellään näön tietojenkäsittelyssä samanaikaisesti eri paikoissa. Hierarkkisuus taas tarkoittaa sitä, että tietojenkäsittely etenee yksinkertaisemmista piirteistä monimutkaisempiin eli ensin kuvasta hahmotetaan ääriviivat ja värit, sitten pinnat, sitten esineet ja lopuksi esineet tunnistetaan tietyksi esineeksi eli niiden merkitys avautuu. Jos vaikka katsomme nurmikolla olevaa jalkapalloa, niin ensiksi se on väin ääriviivojen joukko, joka hahmottuu ympyräksi ja hetken kuluttua pallomaiseksi objektiksi. Pian sen jälkeen havaitsijalle valkenee, että se on jalkapallo ja vielä se, että kyseessä on oma tuttu jalkapallo lapsuudesta. Yksinkertaisista piirteistä abstraktimpiin kuvan ominaisuuksiin etenevä kuvan hahmottaminen on yleisenä taustaolettamuksena havaitsemisen tutkimuksessa. Näkemyksen tunnetuin edustaja on David Marr, jonka vuonna 1982 julkaistu kirja ”Vision” on alan klassikko.

Jo varhain jotkut tutkijat saivat kuitenkin kummallisia tuloksia, jotka poikkesivat tästä ideasta. Jos henkilöille esitetiin kuvia hyvin lyhytaikaisesti, yhden silmäyksen ajan, he pystyivät usein hahmottamaan kuvan idean, siis esimerkiksi sen, että kyseessä on syntymäpäivät tai ruokakauppa (Potter, 1975; Friedman, 1979). Mary Potterin klassikkokokeessa koehenkilöille näytettiin diaprojektorilla kuvia hyvin nopealla tahdilla, kahdeksan kuvaa sekunnissa. Koehenkilöiden tehtävänä oli painaa nappia, kun tietty kohdekuva, vaikkapa kuva rannasta, ilmestyi. Kohdekuvaa ei näytetty ennakolta, vaan koehenkilölle vain kerrottiin sen aihe, esimerkiksi ”lapsi ja perhonen”. Henkilöt suorituivat tehtävästä erittäin hyvin ja pystyivät löytämään suurimman osan kohdekuvista. Näiden tulosten perusteella olisi mahdollista väittää, että ihmiset ymmärtävät kuvan merkityksen ennen kuin he hahmottavat kuvassa olevien kuvioiden ääriviivat ja muut peruspiirteet, mikä vaikuttaa aika omituiselta.

Vaikka Potterin ja myöhempien tutkijoiden tulokset olivat tiedossa, eivät ne saaneet aikaan suurtakaan muutosta tavassa, miten näköjärjestelmän toiminta hahmotettiin. Vasta 1990-luvulla Aude Oliva, Phillippe Schyns ja Michelle Greene ovat tehneet merkittäviä tutkimuksia alalla. Eräs tunnetuimmista artikkeleistä on Psychological Science-lehdessä ilmestynyt ”Briefest of glances”, jossa he selvittivät, kuinka nopeasti kuvan idean (englanniksi ”gist of an image”) pystyy havaitsemaan.

Kuvan semanttisen kategorian hahmottaminen

Aluksi kokeessa haluttiin selvittää, kuinka nopeasti henkilöt hahmottavat valokuvan aiheen eli sen semanttisen kategorian. Kokeessa käytettiin seitsemää eri aihetta: aavikko, pelto, metsä, järvi, vuori, meri ja joki. Jotta kokeeseen saataisiin hyvää kuvamateriaalia, tehtiin esikoe, jossa toinen ryhmä koehenkilöitä sai rauhassa arvioida 500 maisemavalokuvaa. Koehenkilöt katsoivat näitä kuvia yksi kerrallaan ja antoivat kullekin numeroarvon yhden ja viiden välillä riippuen siitä, kuinka tyypillinen kategoriansa edustaja kuva on. Jos kuvassa oli esimerkiksi metsä, koehenkilöt arvioivat, kuinka tyypillinen rantakuvien kategorian edustaja kyseinen kuva on. Varsinaiseen kokeeseen valittiin näistä esikokeen kuvista 25 korkeimman pistemäärän saanutta kuvaa, eli kaikkein tyypillisimmäksi oman kategoriansa kuviksi arvioituja kuvia. Kokeeseen otettiin lisäksi 25 muuta kyseisen kategorian edustajaa, joten kokonaisuudessaan koehenkilöille esitettiin 50 tietyn kategorian kuvaa.

Kokeessa koehenkilöille näytettiin kohdekuva erittäin lyhytaikaisesti, minkä jälkeen tuli ns. dynaaminen maski. Maski tarkoittaa kohdekuvan jälkeen tulevaa kuvaa, jonka tarkoituksena on pyyhkiä lyhytkestoiset muistipuskurit tyhjiksi, jotta koehenkilö ei suorittaisi koetta niihin jäävän tiedon avulla. Tällä tavalla siis varmistutaan siitä, että koehenkilöllä on saatavilla kuvaan liittyvää tietoa ainoastaan kuvan lyhyen esityksen aikana. Greene ja Oliva olivat koeasetelmassaan erityisen huolellisia, koska heillä kohdekuvan jälkeen tuli useita maskikuvia, kukin 20 millisekunnin esitysajalla (ks. kuva alla). Lisäksi maskiärsykkeet oli luotu niin, että ne vastasivat kohdeärsykkeiden tilastollisia ominaisuuksia.

Greenen ja Olivan (2009) koeasetelma.

Greenen ja Olivan (2009) koeasetelma.

Kokeessa koehenkilöiden tehtävänä oli kunkin kohdeärsykkeen kohdalla arvioida, kuuluuko kuva tiettyyn semanttiseen kategoriaan, eli esimerkiksi onko kuva vuoristokuva. Jotta tehtävä ei olisi liian helppo, koekuvien seassa oli 50 kuvaa, jotka olivat peräisin koeasetelman muista kategorioista. Kaiken kaikkiaan koehenkilö siis arvioi 100 kuvan semanttisen kategorian (50 kohdekuvaa ja 50 muuta kuvaa). Kuvasarjan ensimmäistä kuvaa näytettiin 50 millisekuntia, minkä jälkeen esitysaika alkoi muuttumaan vastausten mukaan. Jos vastaus oli oikein, tehtävää vaikeutettiin lyhentämällä esitysaikaa 30 millisekuntia. Jos vastaus oli kolme kertaa peräkkäin väärin, tehtävää helpotettiin pidentämällä esitysaikaa 10 millisekuntia. Tällä tavalla voitiin selvittää, mikä on lyhin esitysaika, jolla koehenkilö voi luotettavasti erottaa kuvan semanttisen kategorian. Kukin koehenkilö teki kokeen kaikilla seitsemällä eri kategorialla, yksi kategoria kerrallaan.

Kuvan globaalien piirteiden hahmottaminen

Kokeessa oli myös toinen osa, jossa koehenkilöiden tehtävänä oli selvittää kuvan globaaleja ominaisuuksia. Globaalit ominaisuudet voivat olla joko näkymän rakennepiirteitä tai näkymän funktionaalisia ominaisuuksia. Se mitä Greene ja Oliva kutsuvat kuvan funktionaalisiksi ominaisuuksiksi, ovat kuvan affordansseja eli tarjoumia. Tarjoumalla viitataan kuvan sisältämään tietoon näkymän tarjoamista toimintamahdollisuuksista, eli tässä tapauksessa kuvan esittämän näkymän helppokulkuisuus ja kuvassa olevien piilopaikkojen määrä.

Kuvan globaalit rakennepiirteet ovat puolestaan kuvaa luonnehtivia yleisiä ominaisuuksia:

  • Luonnollisuus kertoo siitä, onko kuva luontonäkymästä vai kaupunkinäkymästä
  • Etäisyys tarkoittaa sitä, onko kuva lähikuva vai kauempaa otettu kuva
  • Avoimuus viittaa siihen, kuinka avoin tai sulkeutunut näkymä on. Jos näkymä on hyvin avoin, siinä näkyy horisontti eikä peittäviä objekteja. Jos näkymä ei ole avoin, sitä rajaavat esineet ja pinnat
  • Pysyvyys kertoo siitä, kuinka nopeita muutoksia kuvassa olisi mahdollista tapahtua
  • Lämpötila kertoo, onko valokuvan näkymässä kuuma vai kylmä

Globaaleja ominaisuuksia tutkittiin samalla tavalla kuin semanttisia kategorioitakin, eli koehenkilöiden piti päättää lyhyesti esitetystä kuvasta, oliko kuvassa kylmä vai kuuma. Kuvan esitysaikoja muutettiin oikeiden ja väärien vastausten perusteella samalla tavoin kuin edellisessäkin asetelmassa.

Tulokset

Tärkein tulos, joka kokeista saatiin, oli se, että kuvien semanttinen kategoria ja globaalit ominaisuudet hahmotettiin todella nopeasti! Semanttisten kategorioiden keskimääräiset tunnistusajat olivat kaikki alle 70 millisekuntia, mikä on hyvin lyhyt aika:

  • Aavikko: 47 ms
  • Pelto:      55 ms
  • Metsä:     30 ms
  • Järvi:       51 ms
  • Vuori:      46 ms
  • Meri:        55 ms
  • Joki:        67 ms

Jos näitä tunnistusaikoja vertaillaan kuvien globaalien ominaisuuksien tunnistamiseen, paljastuu tuloksista mielenkiintoisia yksityiskohtia. Globaalien ominaisuuksien keskimääräiset tunnistusajat olivat:

  • Piiloutumismahdollisuudet:  35 ms
  • Helppokulkuisuus:                 36 ms
  • Luonnnollisuus:                     19 ms
  • Etäisyys:                                  26 ms
  • Avoimuus:                               47 ms
  • Liike:                                        45 ms
  • Lämpötila:                               29 ms

Jos vertailet, kuinka lyhyellä esitysajalla henkilö pystyy näkemään kuvan semanttisen kategorian verrattuna kuvan globaaliin ominaisuuteen, huomaat, että suurin osa globaaleista ominaisuuksista hahmotetaan aikaisemmin! Eli henkilö pystyy arvioimaan aikaisemmin kuvan tarjoamat piiloutumismahdollisuudet (35 ms) kuin kertomaan, että kyse on vuoristomaisemasta (46 ms). Tai henkilö pystyy sanomaan aikaisemmin, että näkymä on luonnonmaisema (19 ms) kuin sen, että kyse on metsämaisemasta (30 ms).

Nämä ovat aika mielenkiintoisia tuloksia, koska ne viittaavat siihen, että näkymän tarjoumat ja tietyt rakennepiirteet hahmotetaan huippunopeasti ennen kuin muut kuvan ominaisuudet ehtivät selvitä. Selvästikin ominaisuuksien täytyy olla erityisen tärkeitä meille, koska ne priorisoidaan tällä tavalla.

 

Lähteet

Friedman, A. (1979). Framing pictures: the role of knowledge in automatized encoding and memory for gist. Journal of experimental psychology: General, 108, 316–355.

Greene, M. R., & Oliva, A. (2009). The Briefest of Glances: The Time Course of Natural Scene Understanding. Psychological Science, 20(4), 464–472.

Potter, M. C. (1975). Meaning in visual search. Science, 187, 965–966.

Oliva, A., & Schyns, P. G. (2000). Diagnostic colors mediate scene recognition. Cognitive psychology, 41(2), 176–210.

Kategoriat: havaitseminen, neurotiede, tarkkaavaisuus | Avainsanat: , , , , , , | 1 kommentti

Vedenalainen vesiputous

Twitterissä leviää komea kuva Maurituksella sijaitsevasta suurikokoisesta illuusiosta, jossa korallien ja hiekan muodostama hahmo näyttää sopivasta ilmansuunnasta vedenalaiselta vesiputoukselta. Illuusio on luonnon jättimäinen versio anamorfisesta katutaiteesta, joissa katuun piirretään kuvio, joka sopivasta näkökulmasta näyttää kolmiulotteiselta.

Myös tämän videon anamorfiset kuvat ovat todella hienoja:

Kaikissa näissä kuvissa olennaista on se, että niitä katsotaan täsmälleen oikeasta perspektiivistä. Pienikin perspektiivin muutos aiheuttaa kokemuksen siitä, että kuvassa on jotakin kummallista ja pian paljastuu, että kuva on vääristynyt.

Näköjärjestelmän pitää jatkuvasti ratkoa tätä ongelmaa, koska silmän pohjalle, verkkokalvolle, heijastuva kuva on kaksiulotteinen ja näön täytyy siitä yrittää selvittää näkymän kolmiolotteinen rakenne. Stereonäkö, joka perustuu oikean ja vasemman silmän näkymäeroihin, auttaa tässä kolmiulotteisuuden hahmottamisessa, mutta jos kuvaa katsotaan kaukaa, kuten yllä olevan saaren tapauksessa tai videon kautta, kuten katutaidevideossa, ei stereonäkö auta vaan illuusio näkyy voimakkaana.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Kategoriat: havaitseminen, illuusiot | Avainsanat: | 2 kommenttia

Kosketeltavia 3D-näyttöjä

3D-televisioita on viime vuosina markkinoitu paljon ja kolmiulotteisuus on muuttunut televisioiden erityisominaisuudesta niiden perusominaisuudeksi. Myös muissa laitteissa on esiintynyt 3D-näyttöjä, kuten esimerkiksi Nintendo 3DS-pelilaitteessa ja LG Optimus 3D-puhelimessa.

Televisioissa kolmiulotteisuuden havainto mahdollistuu stereoskooppisen näytön avulla, joka näyttää vasempaan ja oikeaan silmään hiukan erilaisen kuvan. Tämä on yleensä toteutettu stereoskooppisen näytön kanssa yhteensopivilla laseilla, jotka ohjaavat eri kuvat oikeaan ja vasempaan silmään. Mukana kannettavassa laitteessa erillisten stereolasien käyttäminen olisi hankalaa, joten niissä käytetään autostereoskooppista näyttöä, joka muodostaa kolmiulotteisen kuvan ilman tarvetta laseille. Autostereoskooppisia näyttöjä on kokeiltu eri laitteissa vuosien ajan, ollessani Nokia Research Centerissä tutkijana testasimme erästä ensimmäisistä 3D-kännyköistä, Sharp mova sh505i:tä. Puhelin oli myynnissä vain Japanin markkinoilla, joten sitä oli vaikea saada, mutta lopulta onnistuimme. Testasimme monia juttuja ja julkasimme aiheesta yhden artikkelinkin.

Vaikka Sharpin kännykässä oli hyviä puolia, oli siinä myös monia ongelmia. Erityisen hankalaa oli pieni katselukulma, mikä tarkoitti sitä, että kännykkää täytyi pitää hyvin tarkasti tietyssä kulmassa, jotta kolmiulotteisuusefekti näkyi. Jos sillä pelasi peliä, joka vaati näppäinten painamista, aiheutti näppäimen painaminen kännykän muutaman millimetrin liikkeen, mikä hävitti 3D-efektin. Ei ihan huippukäytettävyyttä! Toinen ongelma oli sovellusten puute. Puhelimen ensimmäisessä versiossa näppäimistön yhden näppäimen vieressä oli sininen teksti ”3D”. Kun tätä näppäintä painoi muutaman sekunnin ajan, näytölle ilmestyi parin sekunnin 3D-animaatio, jossa kaksi oravaa juoksi puussa. Muita sovelluksia ei ollut!

Erona 2000-luvun alun matkapuhelimiin nykyisin useimpia mobiililaitteita ohjataan kosketusnäytöllä, mikä saattaa stereonäyttöön yhdistettynä tuottaa yllättäviä ongelmia. Tavallisessa kosketusnäytössä kuva ja näytön pinta ovat samassa tasossa, joten jos käyttäjä painaa näytöllä olevaa kohdetta, sormi osuu kuvaan ja näyttöön samanaikaisesti. Stereonäytössä tilanne on toinen, koska stereoskooppinen kuva voi olla näytön fysikaalista pintaa kauempana tai lähempänä. Tämä on pelkkä illuusio, joka on saatu aikaan ohjaamalla eri kuvat vasempaan ja oikeaan silmään. Todellisuudessahan kuva on aina näytön pinnalla.

Kolmiulotteisuuden illuusio voi vaikuttaa merkittävästi laitteen käytettävyyteen. Jos kolmiulotteinen kohde on näytön pintaa kauempana, osuu siihen kurottuva sormi näytön pintaan ennen kuin se ehtii tavoittaa kohteen, ikäänkuin painalluksen kohteen edessä olisi lasipinta. Sormi myös peittää kohdetta, joten kolmiulotteisuuden havaitseminen voi olla vaikeampaa.

Jos kolmiulotteinen kohde taas on näytön pintaa lähempänä, sujahtaa sitä painava sormi kohteen läpi kunnes osuu kauempana olevaan näytön pintaan. Tässä tapauksessa syntyy myös syvyysvihjekonflikti: stereoskooppinen tieto kertoo, että kohde leijuu näytön pintaa lähempänä ja että sormi on sen takana näytön pinnassa. Sen sijaan käyttäjän näkökulmasta peittyneisyysvihje kertoo, että sormi on lähellä olevan kohteen päällä. Konflikti voi vaikeuttaa kolmiulotteisuuden näkemistä.

Stereoskooppisia kosketusnäyttöjä ei ole vielä paljon tutkittu, joten päätin lukea yhden uuden artikkelin aiheesta. Valkov ja kollegat tutkivat artikkelissaan, kuinka tarkasti oikeastaan voimme nähdä syvyystasoja silloin kun sormi on kuvion päällä. Asetelma toteutettiin tavallisella stereonäytöllä ja sormen liikkeitä seurasi näytön sivulle asetettu Microsoft Kinect, joka tarkkaili, koska sormi osuu näyttöön.

Kokeessa koehenkilö painoi sormensa näytöllä olevaan ristiin, jolloin ristin paikalle eli siis sormen alle ilmestyi neliö, jolla oli kolmiulotteinen syvyys, joka oli joko näyttöruutua kauempana tai lähempänä. Koehenkilö arvioi neliön syvyyttä pakkovalintatehtävällä: onko neliö lähempänä vai kauempana kuin ruudun pinta? Kokeessa vaihdeltiin neliön syvyyttä ja kokoa, jotta voitaisiin selvittää näköaistin herkkyys tälle. Koehenkilö näki kaiken kaikkiaan 99 kuvaa kokeen aikana.

Valkov

Koeasetelma Valkovin (212) artikkelista. Kun koehenkilö painoi ruudun keskelle olevaa ristiä, näytölle ilmestyi stereoskooppinen neliö. Stereoefekti näkyy valokuvassa neliön vasemmassa ja oikeassa reunassa olevina tummempina alueina.

Alla olevassa tuloskuvassa kuvassa y-akseli kuvaa vastausten keskiarvoja. Kustakin ”Kauempana”-vastauksesta on tullut arvo -1 ja ”Lähempänä”-vastauksesta arvo 1. Eli mitä korkeammalla ollaan y-akselilla, sitä todennäköisemmin henkilö on vastannut ”Lähempänä” ja mitä matalammalla ollaan, sitä todennäköisemmin henkilö on vastannut ”Kauempana”.

Kuvan x-akselilla ovat neliön erilaiset syvyydet, nolla tarkoittaa näytön pintaa, nollaa pienemmät luvut näyttöä kauempana olevia neliöitä ja nollaa suuremmat luvut näytön pintaa lähempänä olevia kuvioita. Eri väriset tulospisteet taas kuvaavat eri kokoisia neliöitä. Kuvasta nähdään ensinnäkin, että koejärjestely on toiminut ihan ok: kun neliö on ollut näytön pintaa kauempana (kuvion vasen laita), se on todennäköisimmin nähty kaukana (tulospisteet miinuksella). Kun neliö on ollut näytön pintaa lähempänä, on se todennäköisimmin myös nähty lähellä.

Valkov tuloskuva

Mikä sitten on se kriittinen raja-arvo, jolla määritellään, kuinka hyvin henkilö tässä tilanteessa näkee? Se otettiin täydellisen suorituksen (1 tai -1) ja huonoimman suorituksen puolivälistä, eli niistä paikoista, joissa vastausten keskiarvo on ollut 0,5 tai -0,5 y-akselilla. Kun tätä kynnysarvoa tarkastellaan kuvassa, niin suurimmilla neliöillä (5 cm, vihreä käyrä) ihmiset alkavat luotettavasti näkemään neliön lähempänä kun sillä on syvyyttä enemmän kuin 1,67 cm. Näytön takana vihreä käyrä ei koskaan laske -0,5:n alle eli koehenkilöt eivät millään syvyyksillä pystyneet luotettavasti kertomaan neliön syvyyttä.

Jos neliö on pienempi, tulos muuttuu: koehenkilöiden kyky nähdä lähellä olevia neliöitä heikkenee, eli sininen ja punainen käyrä ovat tuloskuvan oikeassa reunassa vihreää alempana. Silti 2 cm:n koolla (punainen käyrä) ihmiset eivät ole suoriutuneet kovin hyvin: kynnys luotettavalla ”kauempana”-havainnolle on nollan positiivisella puolella, eli koehenkilöt ovat alkaneet näkemään kaukosyvyyttä jo silloin kun neliö on ollut hiukan näyttöä lähempänä. Ainoastaan 3,5 cm:n tapauksessa (sininen käyrä) henkilöt ovat huomanneet oikeaissa kohdissa, että neliö on kaukana. Käyriä katsellessa kannattaa huomata, että käyrän sijainti y-akselilla ei ole ainoa kriittinen juttu, vaan myös käyrän muoto ratkaisee, mihin kynnysarvo sijoittuu. Vaikka punainen käyrä on y-akselilla alempana kuin sininen käyrä, käyrien muodosta johtuen ainoastaan sininen käyrä leikkaa y-akselin -0,5:n arvon paikassa, jossa x-akselin arvo on miinuksen puolella, eli arvolla jotka viittaavat kaukosyvyyteen.

Pienemmän neliön tapauksessa tulos saattaisi liittyä syvyysvihjeiden ristiriitaisuuteen: pienempää neliötä on vaikeampi nähdä ruutua lähempänä kun sormi peittää siitä yhä suuremman osan.

Kauempana olevien neliöiden tulokset ovat kummallisia ja niitä on vaikea selittää: miksi suurempien neliöiden kaukosyvyys olisi hankalampaa havaita kuin pienempien? Ja miksi keskikokoisen neliön syvyys näkyy paremmin kuin pienen neliön?

Koeasetelmassa on selvästi jotakin vikaa. Ongelmia voisivat olla esimerkiksi:

1. Iso ongelma on kontrollikokeen puute, eli koetulosta ei vertailla mihinkään. Jos kokeessa olisi vertailukoeastelma, jossa olisi mitattu neliöiden näkyvyyttä ilman sormea, olisi sormen heikentävä vaikutus helpompi arvioida vertailemalla noiden kokeiden tuloksia. Nyt on mahdotonta sanoa, kuinka suuri osa tuloksesta johtuu esimerkiksi näytön laadusta tai koekuvana käytetyn neliön ominaisuuksista.

2. Kynnysarvoissa on tunnetusti paljon yksilöllistä vaihtelua. Koska näissä koetuloksissa oli laskettu kynnysten keskiarvot, voi noiden keskiarvokäyrien alle piiloutua hyvinkin paljon toisistaan poikkeavia tuloksia. Tulosten yksilöllinen vaihtelu voi liittyä moniin asioihin, esimerkiksi henkilön persoonallisuuteen: joku henkilö voi olla todella suurpiirteinen ja vastata esimerkiksi ”Lähempänä” vaikka ei olisikaan kovin varma vastauksestaan. Hyvin pikkutarkka ihminen taas on paljon tarkempi vastauksissaan ja ei vastaa ”Lähempänä” muuta kuin sellaisissa tapauksissa, että on täysin varma vastauksestaan. Jos jompikumpi vaihtoehto tässä kokeessa on ollut toista huomattavasti vaikeampi, saattaa pikkutarkoilla ja suurpiirteisillä vastaajilla tulla hyvin erilaisia käyriä. Yksilöllisten erojen poissulkemiseksi kannattaisi hyödyntää signaalindetektioteoriaa ja laskea tuloksista d’ , jossa oikeat ja väärät vastaukset suhteutetaan toisiinsa ja henkilöiden erilaiset kriteeritasot eivät vaikuta tulokseen.

3. Olen myös ihmeissäni korkeista arvoista, joita stereosyvyyden havaitsemiseksi vaaditaan tässä kokeessa. Koetulokset on hiukan hassusti ilmaistu senttimetreinä, kun yleensä tapana on ilmaista tulokset näkökulman asteina. Jos tulokset muuntaa näkökulman asteiksi, kynnysarvo stereosyvyyden näkemiselle kokeessa on 0,1 – 0,34 näkökulman astetta, mikä on valtavan suuri arvo. Tämä on aika eri arvo kuin tarkimmat mitatut ihmisen stereokynnykset, jotka ovat noin 0,00056 näkökulman astetta!

Ero johtunee ainakin siitä, että koeasetelmassa näytöllä oli ainoastaan yksi kuva. Stereosyvyyden havaitseminen perustuu kuvioiden suhteellisen syvyyden arvioinnille ja yksittäisten, muista erillään olevien kuvioiden arviointi on todella vaikeaa. Sormi on toiminut tässä kokeessa jonkinlaisena vertailukohtana, mutta se ei selvästikään ole riittänyt. Aika harvoin käyttöliittymässäkään on ainoastaan yksi painettava näppäin eikä mitään muuta.

Johtopäätökset

Tässä artikkelissa kysytään oikeita kysymyksiä, mutta toteutus jää hiukan puutteelliseksi. Tuloksia ei voi käyttää ohjeena stereoskooppisten 3D-käyttöliittymien suunnittelussa. Selvästi jonkun pitäisi tehdä tämä koe paremmin, pitää varmaan suunnata labraan.

 

Lähteet

Valkov, D., Giesler, A., & Hinrichs, K. (2012). Evaluation of depth perception for touch interaction with stereoscopic rendered objects. Proceedings of the 2012 ACM International Conference on Interactive Tabletops and Surfacesurfaces, 21–30.

Kategoriat: havaitseminen ja toiminta, HCI, käytettävyys, näyttöteknologiat, S3D, stereonäkö, visuaalinen ergonomia | Avainsanat: , , , , , | Jätä kommentti