Rautatieliikenne Datasetti
Boman, Santtu (2022)
Boman, Santtu
2022
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2022060615839
https://urn.fi/URN:NBN:fi:amk-2022060615839
Tiivistelmä
Nykypäivänä teknologian maailmassa kerätään tietoa erittäin paljon erilaisista tapahtumista, klikkauksista, tykkäyksistä, latauksista yms. Näiden avulla monet yritykset ja tahot pyrkivät kehittämään palveluitaan asiakkailleen tai muuten vain ymmärtämään oman palvelunsa toimintaa. Kerätystä datasta luodaan datasettejä, joissa on eri tapahtumista kerätty data koottu yhdeksi kokonaisuudeksi. Tämän myötä on datatiede nostanut päätään yritysten toiminnassa. Data-analyytikot ja datatieteilijät käyttävät datasettejään apuna luodessaan erilaisia taulukoita kerätystä datasta ja näin tulkitsevat dataa. Datatiede onkin nostanut päätään paljon nykymaailmassa, ja sen takia data-analyytikot sekä datatieteilijät ovatkin erittäin haluttuja työntekijöitä nykypäivän yrityksiin.
Jyväskylän ammattikorkeakoulu halusi saada tutkimusdataa omaan coADDVA-hankkeeseensa, Suomen rautatieliikenteestä sekä myös Suomen sekä Norjan erilaisista säätiedoista. Tavoitteena oli luoda toimiva datasetti, josta juna- ja säätietojen haku ja tarkastelu olisi sujuvaa luoden erilaisia aikasarja taulukoita hyödyntäen kerättyä dataa. Datasettiin haluttiin myös varmistaa jatkokehitys mahdollisuus tulevaisuuden varalle, jos Jyväskylän ammattikorkeakoulu haluaisi lisätä datasettiin eri palveluiden dataa.
Toimeksianto toteutettiin käyttäen Python-ohjelmointikieltä, joka on nykypäivänä yksi käytetyin ohjelmointikieli datatieteessä datan tulkitsemiseen. Itse tietokanta luotiin käyttäen apunaan ERD-malleja sekä keskustellen toimeksiantajan kanssa yhdessä luoden mahdollisimman toimivan tietokantarakenteen datasettiä varten.
Aikaansaatiin datasetti, joka sisälsi suurimman osan halutusta datasta, jota toimeksiantaja halusi datasettiinsä. Todettiin, että datasetti oli toimiva toimeksiantajan käyttötarkoituksiin ja siihen mahdollistettu jatkokehitys oli toimiva.
Jyväskylän ammattikorkeakoulu halusi saada tutkimusdataa omaan coADDVA-hankkeeseensa, Suomen rautatieliikenteestä sekä myös Suomen sekä Norjan erilaisista säätiedoista. Tavoitteena oli luoda toimiva datasetti, josta juna- ja säätietojen haku ja tarkastelu olisi sujuvaa luoden erilaisia aikasarja taulukoita hyödyntäen kerättyä dataa. Datasettiin haluttiin myös varmistaa jatkokehitys mahdollisuus tulevaisuuden varalle, jos Jyväskylän ammattikorkeakoulu haluaisi lisätä datasettiin eri palveluiden dataa.
Toimeksianto toteutettiin käyttäen Python-ohjelmointikieltä, joka on nykypäivänä yksi käytetyin ohjelmointikieli datatieteessä datan tulkitsemiseen. Itse tietokanta luotiin käyttäen apunaan ERD-malleja sekä keskustellen toimeksiantajan kanssa yhdessä luoden mahdollisimman toimivan tietokantarakenteen datasettiä varten.
Aikaansaatiin datasetti, joka sisälsi suurimman osan halutusta datasta, jota toimeksiantaja halusi datasettiinsä. Todettiin, että datasetti oli toimiva toimeksiantajan käyttötarkoituksiin ja siihen mahdollistettu jatkokehitys oli toimiva.