“brudna” co rzutuje na wyci ˛
a-gane wnioski
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
Cz ˛esto, aby uj ˛a´c cechy “big data” w bardziej obrazowy sposób
u˙zywa si ˛e notacji XX wielkich literV, gdzie XX jest liczb ˛a od
3 do 8 (lub wi ˛ecej). Poszczególne literyV (w przypadku 4V)
odpowiadaj ˛a:
VOLUME
rozmiar danych - z definicji jest
wielki i ta cecha była na
po-cz ˛atku głównym wyró˙znikiem
VELOCITY
szybko´s´c danych - tempo
na-pływu danych z ró˙znych
plat-form (np. Forex) jest olbrzymie
VARIETY
ró˙znorodno´s´c danych - zbiory
danych dotycz ˛a ró˙znych
proce-sów wi ˛e´c ró˙zne s ˛a zmienne
VERACITY
niepewno´s´c danych - spora
cz ˛e´s´c danych jest bardzo
“brudna” co rzutuje na wyci ˛
a-gane wnioski
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
Cz ˛esto, aby uj ˛a´c cechy “big data” w bardziej obrazowy sposób
u˙zywa si ˛e notacji XX wielkich literV, gdzie XX jest liczb ˛a od
3 do 8 (lub wi ˛ecej). Poszczególne literyV (w przypadku 4V)
odpowiadaj ˛a:
VOLUME
rozmiar danych - z definicji jest
wielki i ta cecha była na
po-cz ˛atku głównym wyró˙znikiem
VELOCITY
szybko´s´c danych - tempo
na-pływu danych z ró˙znych
plat-form (np. Forex) jest olbrzymie
VARIETY
ró˙znorodno´s´c danych - zbiory
danych dotycz ˛a ró˙znych
proce-sów wi ˛e´c ró˙zne s ˛a zmienne
VERACITY
niepewno´s´c danych - spora
cz ˛e´s´c danych jest bardzo
“brudna” co rzutuje na wyci ˛
a-gane wnioski
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
Cz ˛esto, aby uj ˛a´c cechy “big data” w bardziej obrazowy sposób
u˙zywa si ˛e notacji XX wielkich literV, gdzie XX jest liczb ˛a od
3 do 8 (lub wi ˛ecej). Poszczególne literyV (w przypadku 4V)
odpowiadaj ˛a:
VOLUME
rozmiar danych - z definicji jest
wielki i ta cecha była na
po-cz ˛atku głównym wyró˙znikiem
VELOCITY
szybko´s´c danych - tempo
na-pływu danych z ró˙znych
plat-form (np. Forex) jest olbrzymie
VARIETY
ró˙znorodno´s´c danych - zbiory
danych dotycz ˛a ró˙znych
proce-sów wi ˛e´c ró˙zne s ˛a zmienne
VERACITY
niepewno´s´c danych - spora
cz ˛e´s´c danych jest bardzo
“brudna” co rzutuje na wyci ˛
a-gane wnioski
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
Cz ˛esto, aby uj ˛a´c cechy “big data” w bardziej obrazowy sposób
u˙zywa si ˛e notacji XX wielkich literV, gdzie XX jest liczb ˛a od
3 do 8 (lub wi ˛ecej). Poszczególne literyV (w przypadku 4V)
odpowiadaj ˛a:
VOLUME
rozmiar danych - z definicji jest
wielki i ta cecha była na
po-cz ˛atku głównym wyró˙znikiem
VELOCITY
szybko´s´c danych - tempo
na-pływu danych z ró˙znych
plat-form (np. Forex) jest olbrzymie
VARIETY
ró˙znorodno´s´c danych - zbiory
danych dotycz ˛a ró˙znych
proce-sów wi ˛e´c ró˙zne s ˛a zmienne
VERACITY
niepewno´s´c danych - spora
cz ˛e´s´c danych jest bardzo
“brudna” co rzutuje na wyci ˛
a-gane wnioski
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
[Grafika pobrana z: https://www.thinkbiganalytics.com/2016/03/29/ big- data- 3vs- fourth- v- implications- not- embracing/]
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science
Spójrzmy na definicje z Wikipedii [https://en.wikipedia.org/ wiki/Data_science]
Data science, also known as data-driven science, is an interdiscipli-nary field about scientific methods, processes, and systems to extract knowledge or insights from data in various forms, either structured or unstructured similar to data mining.
Data science is a “concept to unify statistics, data analysis and their related methods” in order to “understand and analyze actual pheno-mena” with data. It employs techniques and theories drawn from many fields within the broad areas of mathematics, statistics, information science, and computer science, in particular from the subdomains of machine learning, classification, cluster analysis, data mining, databa-ses, and visualization.
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science
Spójrzmy na definicje z Wikipedii [https://en.wikipedia.org/ wiki/Data_science]
Data science, also known as data-driven science, is an interdiscipli-nary field about scientific methods, processes, and systems to extract knowledge or insights from data in various forms, either structured or unstructured similar to data mining.
Data science is a “concept to unify statistics, data analysis and their related methods” in order to “understand and analyze actual pheno-mena” with data. It employs techniques and theories drawn from many fields within the broad areas of mathematics, statistics, information science, and computer science, in particular from the subdomains of machine learning, classification, cluster analysis, data mining, databa-ses, and visualization.
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science
Spójrzmy na definicje z Wikipedii [https://en.wikipedia.org/ wiki/Data_science]
Data science, also known as data-driven science, is an interdiscipli-nary field about scientific methods, processes, and systems to extract knowledge or insights from data in various forms, either structured or unstructured similar to data mining.
Data science is a “concept to unify statistics, data analysis and their related methods” in order to “understand and analyze actual pheno-mena” with data. It employs techniques and theories drawn from many fields within the broad areas of mathematics, statistics, information science, and computer science, in particular from the subdomains of machine learning, classification, cluster analysis, data mining, databa-ses, and visualization.
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science
Aby odpowiedzie´c, czy jest “data science” cz ˛esto u˙zywa si ˛e umówie ´n:
Mike Driscoll, [Schutt & O’Neil, s. 7]
Data science, as it’s practiced, is a blend of Red-Bull-fueled hacking and espresso-inspired statistics.
But data science is not merely hac-king—because when hackers finish debug-ging their Bash one-liners and Pig scripts, few of them care about non-Euclidean di-stance metrics.
And data science is not merely statistics, because when statisticians finish theorizing the perfect model, few could read a tab-delimited file into R if their job depended on it.
Data science is the civil engineering of data. Its acolytes possess a practical knowledge of tools and materials, coupled with a the-oretical understanding of what’s possible.
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science
Aby odpowiedzie´c, czy jest “data science” cz ˛esto u˙zywa si ˛e umówie ´n:
Mike Driscoll, [Schutt & O’Neil, s. 7]
Data science, as it’s practiced, is a blend of Red-Bull-fueled hacking and espresso-inspired statistics.
But data science is not merely hac-king—because when hackers finish debug-ging their Bash one-liners and Pig scripts, few of them care about non-Euclidean di-stance metrics.
And data science is not merely statistics, because when statisticians finish theorizing the perfect model, few could read a tab-delimited file into R if their job depended on it.
Data science is the civil engineering of data. Its acolytes possess a practical knowledge of tools and materials, coupled with a the-oretical understanding of what’s possible.
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science
Aby odpowiedzie´c, czy jest “data science” cz ˛esto u˙zywa si ˛e umówie ´n:
Mike Driscoll, [Schutt & O’Neil, s. 7]
Data science, as it’s practiced, is a blend of Red-Bull-fueled hacking and espresso-inspired statistics.
But data science is not merely hac-king—because when hackers finish debug-ging their Bash one-liners and Pig scripts, few of them care about non-Euclidean di-stance metrics.
And data science is not merely statistics, because when statisticians finish theorizing the perfect model, few could read a tab-delimited file into R if their job depended on it.
Data science is the civil engineering of data. Its acolytes possess a practical knowledge of tools and materials, coupled with a the-oretical understanding of what’s possible.
Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science