keskiviikko 14. lokakuuta 2009

Akustinen paikannus ja adaptiivinen signaalinkäsittely

Ensimmäisellä tunnilla Pasi Pertilä laitokselta esitteli tutkimuskohdettaan: akustista paikannusta. Akustinen paikannus käyttää useaa mikrofonia, ja arvioi eroja näihin saapuvan äänen viiveissä; tästä menetelmästä käytetään englanninkielistä nimeä Time Difference of Arrival (TDOA). Samaa ideaa käyttävät myös ihmiset sekä luultavasti muutkin kaksikorvaiset olennot: alitajuisesti aivosi arvioivat viivettä sekä taajuusvastetta, ja voit päätellä mistä suunnasta ääni tulee vaikka silmät kiinni. Jos puhuja on oikealla puolellasi, kuulet äänen muutaman millisekunnin aikaisemmin oikealla korvallasi. Lisäksi osaat myös silmät kiinni päätellä onko puhuja takanasi vai edessäsi äänen vaimentumien perusteella (keskiäänet läpäisevät korvalehden keskimääräistä paremmin, joten takaa tulevassa äänessä matalat ja korkeat taajuudet ovat vaimentuneet).

Tietokoneella tehtävä ääneen perustuva paikannus perustuu suurelta osin todennäköisyyslaskentaan. Kunkin mikrofonin kohdalta voidaan laskea tiheysfunktio siitä mistä suunnasta ääni sen mielestä tulee. Yhdistämällä eri mikrofonien tiheysfunktiot (todennäköisyyslaskennan kertolaskusäännöllä) saadaan todennäköisin alue mistä ääni tulee. Sen lisäksi voidaan arvioida paikan estimoinniin tarkkuutta ns. Dilution of Precision (DOP) -menetelmällä. Muita esillä olleita matemaattisia termejä olivat mm. tilastollisesta signaalinkäsittelystä tutut pienimmän neliösumman sovitus, Bayesin kaava sekä Cramer-Rao-alaraja. Kaavarykelmän tarkoitus ei ollut pelotella, vaan paremminkin näyttää ettei joissakin sovelluksissa selvitä ilman syvällisempää matematiikkaa. Samoja asioita tutkitaan myös matematiikan laitoksella mutta hieman eri sovelluksen yhteydessä.

(Tästä tuli mieleeni tarina, jonka mukaan teekkarisaunalla fukseilta oli kysytty vuoronperään minkä ovat ajatelleet pääaineekseen. Kun kymmenen ohjelmistofuksin jälkeen yksi oli maininnut signaalinkäsittelyn, oli seurauksena ollut naurunrämäkkä. Signaalinkäsittely on kuulemma niin vaikeaa ja irti tästä maailmasta ettei siellä voi pärjätä. Tästä on jo 10 v aikaa, ja sen jälkeen opetusta on pyritty tekemään ymmärrettävämmäksi ja sovellukset ovat vallanneet tietokoneiden työpöydät ja ihmisten taskut, joten epäilen että ei enää naurata.)

Toisella tunnilla käytiin kappale 4 loppuun. Tarkastelimme vielä LMS-algoritmia ja sen toimintaa. Lisäksi mietittiin mitä tapahtuu jos parametri mu on liian iso: ratkaisu alkaa heittelehtiä kauemmas ja kauemmas optimista, poukkoillen sen molemmin puolin. Tämähän on luonnollinen seuraus kaavasta

w := w - mu * grad (c(w)),

missä grad (c(w)) on kustannusfunktion gradientti. Kustannusfunktio on paraboloidin muotoinen, joten kauempana optimista myös gradientti kasvaa. Näin värähtely optimin molemmin puolin vahvistuu ja vahvistaa itseään. Ensi maanantaina on ensimmäinen välikoe. Ilmoittautuminen tähän päättyi jo, mutta poikkeuksellisesti tällä kertaa jälki-ilmoittautuminen on mahdollista. Syynä että en tarpeeksi mainostanut asiaa, ja POP:in bugi on estänyt ilmoittautumisen joiltakin. Jos et ole ilmoittautunut vielä, lähetä sähköposti otsikolla Jälki-ilmoittautuminen välikokeeseen osoitteeseen heikki.huttunen@tut.fi keskiviikkoiltaan 14.10 klo 21:00 mennessä. Liitä viestiin nimesi ja opiskelijanumerosi. Välikokeen 19.10 koealue on monisteen sivut 1-63. Siis myös kappaleen 4 harjoitustehtäviin (ainakin ei-matlab-tehtäviin) kannattaa perehtyä.

1 kommentti:

  1. Tässä on yksi tapa huoneen impulssivasteen (room impulse response, RIR) simuloimiseen http://www.2pi.us/rir.html. Sivulta löytyy myös matlab-koodi.

    VastaaPoista