Big data nyt ja tulevaisuudessa
Vainio, Miikka (2022)
Vainio, Miikka
2022
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2022052712617
https://urn.fi/URN:NBN:fi:amk-2022052712617
Tiivistelmä
Tämän opinnäytetyön tarkoituksena oli luoda tiivistetty ja helposti ymmärrettävä opas big datasta, eli massadatasta. Työssä tarkasteltiin muun muassa big datan poimintaa, ominaisuuksia, analysointia ja sitä, minkäkaisilla teollisuuden ja liiketalouden osa-alueilla tällaista dataa voidaan tänä päivänä ja lähitulevaisuudessa hyödyntää. Tutkitaan myös pilviympäristöjen tarjoamia mahdollisuuksia big data -infrastuktuurin toiminnalle ja selvitetään, minkä takia sen hyödyntäminen on lähes välttämätöntä nykyaikaisen massadatan käsittelyssä. Pääasiallinen tavoite on vastata kolmeen kysymykseen: mitä big data on? Miten sitä hyödynnetään? Miten se tulee vaikuttamaan meihin tulevaisuudessa?
Big datan roolia eri sektoreillä käytiin läpi esimerkein ja selvitettiin, miten sitä hyödynnettään esimerkiksi riskien tunnistamiseen terveydenhuollossa tai osana älykaupunkikokonaisuutta.
Työn aikana suoritettiin yksinkertainen data-analyysi käyttäen KNIME analytics -ympäristöä ja sen komponentteja. Kahdesta lähteestä haetut datasetit yhdistettiin, puhdistettiin ja valmisteltiin analysointia varten. Projektin ideana on havainnolistaa datan keruun ja puhdistuksen vaiheita tiivistettynä, varsinaista big datan määritelmää pienemmällä määrällä tietoa. Big dataa lähestyttiin työssä siis niin teorian, kuin myös käytännön avulla.
Työn lopputuloksena saatiin luotua tietopaketti, joka selittää lukijalle big datan perusteet ja elinkaaren ratkastavasta ongelmasta visualisoituun dataan. Kerrotaan myös big datan mahdollisuuuksista ja uhista lähitulevaisuudessa, sillä uutena ilmiönä se herättää paljon eettisiä kysymyksiä tulevaisuuden suhteen.
Big datan roolia eri sektoreillä käytiin läpi esimerkein ja selvitettiin, miten sitä hyödynnettään esimerkiksi riskien tunnistamiseen terveydenhuollossa tai osana älykaupunkikokonaisuutta.
Työn aikana suoritettiin yksinkertainen data-analyysi käyttäen KNIME analytics -ympäristöä ja sen komponentteja. Kahdesta lähteestä haetut datasetit yhdistettiin, puhdistettiin ja valmisteltiin analysointia varten. Projektin ideana on havainnolistaa datan keruun ja puhdistuksen vaiheita tiivistettynä, varsinaista big datan määritelmää pienemmällä määrällä tietoa. Big dataa lähestyttiin työssä siis niin teorian, kuin myös käytännön avulla.
Työn lopputuloksena saatiin luotua tietopaketti, joka selittää lukijalle big datan perusteet ja elinkaaren ratkastavasta ongelmasta visualisoituun dataan. Kerrotaan myös big datan mahdollisuuuksista ja uhista lähitulevaisuudessa, sillä uutena ilmiönä se herättää paljon eettisiä kysymyksiä tulevaisuuden suhteen.