• Nie Znaleziono Wyników

niepewno´s´c danych - spora cz ˛e´s´cdanychjestbardzo

W dokumencie Wykład 1 (Stron 23-44)

“brudna” co rzutuje na wyci ˛

a-gane wnioski

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

Cz ˛esto, aby uj ˛a´c cechy “big data” w bardziej obrazowy sposób

u˙zywa si ˛e notacji XX wielkich literV, gdzie XX jest liczb ˛a od

3 do 8 (lub wi ˛ecej). Poszczególne literyV (w przypadku 4V)

odpowiadaj ˛a:

VOLUME

rozmiar danych - z definicji jest

wielki i ta cecha była na

po-cz ˛atku głównym wyró˙znikiem

VELOCITY

szybko´s´c danych - tempo

na-pływu danych z ró˙znych

plat-form (np. Forex) jest olbrzymie

VARIETY

ró˙znorodno´s´c danych - zbiory

danych dotycz ˛a ró˙znych

proce-sów wi ˛e´c ró˙zne s ˛a zmienne

VERACITY

niepewno´s´c danych - spora

cz ˛e´s´c danych jest bardzo

“brudna” co rzutuje na wyci ˛

a-gane wnioski

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

Cz ˛esto, aby uj ˛a´c cechy “big data” w bardziej obrazowy sposób

u˙zywa si ˛e notacji XX wielkich literV, gdzie XX jest liczb ˛a od

3 do 8 (lub wi ˛ecej). Poszczególne literyV (w przypadku 4V)

odpowiadaj ˛a:

VOLUME

rozmiar danych - z definicji jest

wielki i ta cecha była na

po-cz ˛atku głównym wyró˙znikiem

VELOCITY

szybko´s´c danych - tempo

na-pływu danych z ró˙znych

plat-form (np. Forex) jest olbrzymie

VARIETY

ró˙znorodno´s´c danych - zbiory

danych dotycz ˛a ró˙znych

proce-sów wi ˛e´c ró˙zne s ˛a zmienne

VERACITY

niepewno´s´c danych - spora

cz ˛e´s´c danych jest bardzo

“brudna” co rzutuje na wyci ˛

a-gane wnioski

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

Cz ˛esto, aby uj ˛a´c cechy “big data” w bardziej obrazowy sposób

u˙zywa si ˛e notacji XX wielkich literV, gdzie XX jest liczb ˛a od

3 do 8 (lub wi ˛ecej). Poszczególne literyV (w przypadku 4V)

odpowiadaj ˛a:

VOLUME

rozmiar danych - z definicji jest

wielki i ta cecha była na

po-cz ˛atku głównym wyró˙znikiem

VELOCITY

szybko´s´c danych - tempo

na-pływu danych z ró˙znych

plat-form (np. Forex) jest olbrzymie

VARIETY

ró˙znorodno´s´c danych - zbiory

danych dotycz ˛a ró˙znych

proce-sów wi ˛e´c ró˙zne s ˛a zmienne

VERACITY

niepewno´s´c danych - spora

cz ˛e´s´c danych jest bardzo

“brudna” co rzutuje na wyci ˛

a-gane wnioski

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

Cz ˛esto, aby uj ˛a´c cechy “big data” w bardziej obrazowy sposób

u˙zywa si ˛e notacji XX wielkich literV, gdzie XX jest liczb ˛a od

3 do 8 (lub wi ˛ecej). Poszczególne literyV (w przypadku 4V)

odpowiadaj ˛a:

VOLUME

rozmiar danych - z definicji jest

wielki i ta cecha była na

po-cz ˛atku głównym wyró˙znikiem

VELOCITY

szybko´s´c danych - tempo

na-pływu danych z ró˙znych

plat-form (np. Forex) jest olbrzymie

VARIETY

ró˙znorodno´s´c danych - zbiory

danych dotycz ˛a ró˙znych

proce-sów wi ˛e´c ró˙zne s ˛a zmienne

VERACITY

niepewno´s´c danych - spora

cz ˛e´s´c danych jest bardzo

“brudna” co rzutuje na wyci ˛

a-gane wnioski

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

[Grafika pobrana z: https://www.thinkbiganalytics.com/2016/03/29/ big- data- 3vs- fourth- v- implications- not- embracing/]

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Big data

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science

Spójrzmy na definicje z Wikipedii [https://en.wikipedia.org/ wiki/Data_science]

Data science, also known as data-driven science, is an interdiscipli-nary field about scientific methods, processes, and systems to extract knowledge or insights from data in various forms, either structured or unstructured similar to data mining.

Data science is a “concept to unify statistics, data analysis and their related methods” in order to “understand and analyze actual pheno-mena” with data. It employs techniques and theories drawn from many fields within the broad areas of mathematics, statistics, information science, and computer science, in particular from the subdomains of machine learning, classification, cluster analysis, data mining, databa-ses, and visualization.

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science

Spójrzmy na definicje z Wikipedii [https://en.wikipedia.org/ wiki/Data_science]

Data science, also known as data-driven science, is an interdiscipli-nary field about scientific methods, processes, and systems to extract knowledge or insights from data in various forms, either structured or unstructured similar to data mining.

Data science is a “concept to unify statistics, data analysis and their related methods” in order to “understand and analyze actual pheno-mena” with data. It employs techniques and theories drawn from many fields within the broad areas of mathematics, statistics, information science, and computer science, in particular from the subdomains of machine learning, classification, cluster analysis, data mining, databa-ses, and visualization.

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science

Spójrzmy na definicje z Wikipedii [https://en.wikipedia.org/ wiki/Data_science]

Data science, also known as data-driven science, is an interdiscipli-nary field about scientific methods, processes, and systems to extract knowledge or insights from data in various forms, either structured or unstructured similar to data mining.

Data science is a “concept to unify statistics, data analysis and their related methods” in order to “understand and analyze actual pheno-mena” with data. It employs techniques and theories drawn from many fields within the broad areas of mathematics, statistics, information science, and computer science, in particular from the subdomains of machine learning, classification, cluster analysis, data mining, databa-ses, and visualization.

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science

Aby odpowiedzie´c, czy jest “data science” cz ˛esto u˙zywa si ˛e umówie ´n:

Mike Driscoll, [Schutt & O’Neil, s. 7]

Data science, as it’s practiced, is a blend of Red-Bull-fueled hacking and espresso-inspired statistics.

But data science is not merely hac-king—because when hackers finish debug-ging their Bash one-liners and Pig scripts, few of them care about non-Euclidean di-stance metrics.

And data science is not merely statistics, because when statisticians finish theorizing the perfect model, few could read a tab-delimited file into R if their job depended on it.

Data science is the civil engineering of data. Its acolytes possess a practical knowledge of tools and materials, coupled with a the-oretical understanding of what’s possible.

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science

Aby odpowiedzie´c, czy jest “data science” cz ˛esto u˙zywa si ˛e umówie ´n:

Mike Driscoll, [Schutt & O’Neil, s. 7]

Data science, as it’s practiced, is a blend of Red-Bull-fueled hacking and espresso-inspired statistics.

But data science is not merely hac-king—because when hackers finish debug-ging their Bash one-liners and Pig scripts, few of them care about non-Euclidean di-stance metrics.

And data science is not merely statistics, because when statisticians finish theorizing the perfect model, few could read a tab-delimited file into R if their job depended on it.

Data science is the civil engineering of data. Its acolytes possess a practical knowledge of tools and materials, coupled with a the-oretical understanding of what’s possible.

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science

Aby odpowiedzie´c, czy jest “data science” cz ˛esto u˙zywa si ˛e umówie ´n:

Mike Driscoll, [Schutt & O’Neil, s. 7]

Data science, as it’s practiced, is a blend of Red-Bull-fueled hacking and espresso-inspired statistics.

But data science is not merely hac-king—because when hackers finish debug-ging their Bash one-liners and Pig scripts, few of them care about non-Euclidean di-stance metrics.

And data science is not merely statistics, because when statisticians finish theorizing the perfect model, few could read a tab-delimited file into R if their job depended on it.

Data science is the civil engineering of data. Its acolytes possess a practical knowledge of tools and materials, coupled with a the-oretical understanding of what’s possible.

Sprawy organizacyjne Ramowy program wykładu Wst ˛ep Data science

Wygodnym sposobem jest te˙z u˙zycie schematu przepływu

W dokumencie Wykład 1 (Stron 23-44)

Powiązane dokumenty