Varför är big data svårt att definiera

Om EU går miste om möjligheten att utnyttja big data och dess potential skulle det kunna innebära ett mindre optimalt genomförande av större EU-program, såsom den gröna given och negativa konsekvenser för konsumenter, företag och ekonomi. 1 2 Eftersom data kommer från så många olika källor är det svårt att länka, matcha, rensa och transformera data mellan olika system. Företag måste koppla ihop, hitta korrelationer, identifiera hierarkier och hantera datalänkar. Annars kan de snabbt tappa kontrollen över sin data. 3 4 Big data [1] utgörs av digitalt lagrad information av sådan storlek (vanligen terabyte och petabyte), att det är svårt att bearbeta den med traditionella databasmetoder. Big data innefattar tekniker för very large databases (VLDB), datalager (data warehouse) och informationsutvinning (data mining). Termen big data fick. 5 Eftersom användandet av Big Data skiljer sig mycket åt mellan olika verksamheter kan det vara svårt att definiera vilka kompetenser som behövs. Oftast är de som arbetar med Big Data statistiker som kan programmera (eller tvärtom). 6 ”Bad Data” eller dålig data är egentligen data som är oanvändbar i sitt nuvarande tillstånd. Med dålig data menas data som är ostrukturerad, rå eller inte möter de kvalitetskrav som har ställts upp men också data som är felaktig, saknad, duplicerad eller rentav olaglig. 7 8 Big data utgörs av digitalt lagrad information av sådan storlek (vanligen terabyte och petabyte), att det är svårt att bearbeta den med traditionella. 9 Eftersom användandet av Big Data skiljer sig mycket åt mellan olika verksamheter kan det vara svårt att definiera vilka kompetenser som behövs. 10 11
varför är big data svårt att definiera