Data-analyysi: golfkentät
Laurila, Outi (2022)
Laurila, Outi
2022
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2022091420169
https://urn.fi/URN:NBN:fi:amk-2022091420169
Tiivistelmä
Opinnäytetyön aiheen valinta perustui kiinnostukseen data-analytiikkaa ja golfia kohtaan. Aineistona käytettiin avointa dataa. Työn tavoite oli selvittää, mitkä tilastotieteen menetelmät sopivat melko suppean golf-aiheisen datan analysointiin ja miten tulokset voidaan visualisoida tarkoituksenmukaisesti. Työn tarkoitus oli johtaa datasta tuloksia ja tuottaa tiivistettyä havainnollista tietoa.
Aineisto hankittiin Golfpiste.comin Kenttäoppaasta, golfseurojen kotisivuilta, Golfliiton materiaalipankista ja Tilastokeskuksen sivuilta. Työssä käytettiin SPSS-, Excel- ja Power BI -ohjelmia sekä Python-ohjelmointikieltä. Aineistoon tutustuminen aloitettiin tekemällä jakaumia ja laskemalla tunnuslukuja golfkenttien ominaisuuksista. Golfkenttien väylien ja tiipaikkojen määrät selvitettiin, samoin kuin väylien ja kenttien lyhimmät ja pisimmät mitat. Jakaumia esitettiin taulukkoina, histogrammeina, laatikko-janakaavioina ja ydinestimointikuviona. Eri kenttätyyppejä tarkasteltiin myös erikseen, ja niitä pyrittiin vertailemaan. 18 väylän kenttien par 3 -, par 4 - ja par 5 -väylien erilaisista yhdistelmistä tehtiin viivakaavio. Golfseurojen jäsenten suhteellisia osuuksia eri kunnissa ja maakunnissa tutkittiin.
Tutkittavien ominaisuuksien välisten yhteyksien voimakkuuksia tutkittiin Pearsonin korrelaatiokertoimen avulla. Kun riittävän voimakas yhteys löytyi, voitiin harkita riippuvuuden tutkimista regressioanalyysillä. Regressioanalyysi suoritettiin lyöntipaikkojen määrän ja kentän lyhimmän ja pisimmän pituuden erotuksen välillä sekä kentän pituuden ja kahden kentän vaikeutta kuvaavan arvon välillä. Erikseen ammattilaistason naisille ja miehille määriteltyjä lyöntimääriä kuvaavia vaikeuslukuja vertailtiin t-testillä.
Työn tuloksena todettiin, että golfkenttädatan käsittelyssä hyviä menetelmiä olivat tunnuslukujen käyttö, Pearsonin korrelaatiokerroin, regressioanalyysi ja t-testi. Visualisoinneissa voitiin käyttää monipuolisesti pylväs-, viiva-, sektori-, alue-, kartta-, laatikko-jana-, sironta- ja viulukaavioita sekä histogrammeja ja ydinestimointikuviota.
Aineisto hankittiin Golfpiste.comin Kenttäoppaasta, golfseurojen kotisivuilta, Golfliiton materiaalipankista ja Tilastokeskuksen sivuilta. Työssä käytettiin SPSS-, Excel- ja Power BI -ohjelmia sekä Python-ohjelmointikieltä. Aineistoon tutustuminen aloitettiin tekemällä jakaumia ja laskemalla tunnuslukuja golfkenttien ominaisuuksista. Golfkenttien väylien ja tiipaikkojen määrät selvitettiin, samoin kuin väylien ja kenttien lyhimmät ja pisimmät mitat. Jakaumia esitettiin taulukkoina, histogrammeina, laatikko-janakaavioina ja ydinestimointikuviona. Eri kenttätyyppejä tarkasteltiin myös erikseen, ja niitä pyrittiin vertailemaan. 18 väylän kenttien par 3 -, par 4 - ja par 5 -väylien erilaisista yhdistelmistä tehtiin viivakaavio. Golfseurojen jäsenten suhteellisia osuuksia eri kunnissa ja maakunnissa tutkittiin.
Tutkittavien ominaisuuksien välisten yhteyksien voimakkuuksia tutkittiin Pearsonin korrelaatiokertoimen avulla. Kun riittävän voimakas yhteys löytyi, voitiin harkita riippuvuuden tutkimista regressioanalyysillä. Regressioanalyysi suoritettiin lyöntipaikkojen määrän ja kentän lyhimmän ja pisimmän pituuden erotuksen välillä sekä kentän pituuden ja kahden kentän vaikeutta kuvaavan arvon välillä. Erikseen ammattilaistason naisille ja miehille määriteltyjä lyöntimääriä kuvaavia vaikeuslukuja vertailtiin t-testillä.
Työn tuloksena todettiin, että golfkenttädatan käsittelyssä hyviä menetelmiä olivat tunnuslukujen käyttö, Pearsonin korrelaatiokerroin, regressioanalyysi ja t-testi. Visualisoinneissa voitiin käyttää monipuolisesti pylväs-, viiva-, sektori-, alue-, kartta-, laatikko-jana-, sironta- ja viulukaavioita sekä histogrammeja ja ydinestimointikuviota.