Correspondence analysis as a service
Kemppainen, Ville (2017)
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2017091815202
https://urn.fi/URN:NBN:fi:amk-2017091815202
Tiivistelmä
Insinöörityössä tutkittiin korrespondenssianalyysin soveltuvuutta palveluksi analysoimalla kyselydataa. Korrespondenssianalyysi on data-analyysitekniikka, jolla voidaan löytää ja visualisoida toisiaan vastaavia kategorisia muuttujia. Korrespondenssianalyysiprosessin automatisointi datansyöttövaiheesta tulkintavaiheeseen on mahdollista, ja muun muassa markkinointiautomaatio- ja tutkimussovellukset tuottavat kategorista dataa.
Ohjelmistopalvelukokonaisuuden osaksi soveltuva korrespondenssianalyysin toteutus rakennettiin JavaScript-moduuleista. Esimerkkidatana toimi Suomen itsenäisyyden juhlarahasto Sitran tuottaman kyselyn vastausdata. Esimerkkidatan konversioita ja tilastollista varmentamista varten ohjelmoitiin uudet moduulit. Kaikkien monivalintakysymysparien välinen korrespondenssi visualisoitiin.
Selvisi, että 5000 vastaajan tuottama esimerkkidata on hyvälaatuista. 82 kysymyksestä muodostetuista pareista useimmat ovat tilastollisesti merkittäviä ja niiden korrespondenssi on riippumatonta. Korrespondenssianalyysin ominaisuuksien tutkimisesta ja esimerkkitoteutuksen testaustuloksista käy ilmi, että korrespondenssianalyysin tuloksia voi tulkita ilman laajaa data-analyysin erikoisosaamista.
Data-analyysitekniikoiden hyödyntäminen palvelukokonaisuuksina on haastavaa. Korrespondenssianalyysin tapauksessa analyysitekniikan laajentaminen on palvelun toimivuuden kannalta tärkeää. Tulkittavuuden parantamiseksi käyttäjälle tulee antaa sanallista ja kuvallista lisätietoa. Lisätietoa voidaan tuottaa esimerkiksi pääkomponenttianalyysilla, klusterianalyysilla ja luokittelualgoritmeilla.
Ohjelmistopalvelukokonaisuuden osaksi soveltuva korrespondenssianalyysin toteutus rakennettiin JavaScript-moduuleista. Esimerkkidatana toimi Suomen itsenäisyyden juhlarahasto Sitran tuottaman kyselyn vastausdata. Esimerkkidatan konversioita ja tilastollista varmentamista varten ohjelmoitiin uudet moduulit. Kaikkien monivalintakysymysparien välinen korrespondenssi visualisoitiin.
Selvisi, että 5000 vastaajan tuottama esimerkkidata on hyvälaatuista. 82 kysymyksestä muodostetuista pareista useimmat ovat tilastollisesti merkittäviä ja niiden korrespondenssi on riippumatonta. Korrespondenssianalyysin ominaisuuksien tutkimisesta ja esimerkkitoteutuksen testaustuloksista käy ilmi, että korrespondenssianalyysin tuloksia voi tulkita ilman laajaa data-analyysin erikoisosaamista.
Data-analyysitekniikoiden hyödyntäminen palvelukokonaisuuksina on haastavaa. Korrespondenssianalyysin tapauksessa analyysitekniikan laajentaminen on palvelun toimivuuden kannalta tärkeää. Tulkittavuuden parantamiseksi käyttäjälle tulee antaa sanallista ja kuvallista lisätietoa. Lisätietoa voidaan tuottaa esimerkiksi pääkomponenttianalyysilla, klusterianalyysilla ja luokittelualgoritmeilla.