• Nie Znaleziono Wyników

Widok Internetowe predykcje notowań spółek giełdowych

N/A
N/A
Protected

Academic year: 2021

Share "Widok Internetowe predykcje notowań spółek giełdowych"

Copied!
10
0
0

Pełen tekst

(1)

1 The Internet in real time, http://pennystocks.la/internet-in-real-time/ [dostĊp: 25.04.15].

2 The digital universe of opportunities: Rich Data and the inreasing value of the Internet of things, http://www. emc.com/leadership/digital-universe/2014iview/executive-summary.htm [dostĊp: 25.04.15].

3 Big Data, bigger digital shadows, and biggest growth in the Far East, https://www.emc.com/collateral/ analyst-reports/idc-digital-universe-united-states.pdf [dostĊp: 25.04.15].

4 Y. Liu, Big Data and predictive business analytics, http://eds.b.ebscohost.com.atoz.han.buw.uw.edu.pl/ eds/pdfviewer/pdfviewer?sid=3149252a-86a3-462d-87c0-690b06fda804%40sessionmgr110&vid=6&hid=112 [dostĊp: 09.05.15].

5 M. Tabakow, J. Korczak, B. Franczyk, Big Data – deÞ nicje, wyzwania i technologie informatyczne, „Infor-matyka Ekonomiczna” 2014, nr 1 (31).

6 W. Gogoáek, P. Kuczma, RaÞ nacja informacji sieciowych na przykáadzie wyborów parlamentarnych, „Studia Medioznawcze” 2013, nr 2 (53).

W

ciągu kaĪdej sekundy przez internet transferuje siĊ 22574 GB danych, po-wstaje 5700 tweetów, 55 tysiĊcy postów na Facebooku, a na portal YouTube dodawane są dwie godziny materiaáu1. Ten „cyfrowy wszech-Ğwiat” co dwa lata podwaja swoje rozmiary. W 2020 r. liczba bitów informacji wygenerowa-nych przez ludzkoĞü przekroczy liczbĊ gwiazd we WszechĞwiecie2. Obecnie skutecznie anali-zuje siĊ tylko 0,5 proc. danych zgromadzonych w postaci cyfrowej3.

Jednym ze sposobów badania interneto-wych treĞci jest raÞ nacja informacji, które po-chodzą z zasobów Big Data. Wedáug deÞ nicji McKinsey Global Institute pod pojĊciem Big Data rozumiemy „duĪe zbiory danych, które z powodu swojej wielkoĞci nie są moĪliwe do przechwycenia, przechowywania, zarządzania i analizowania przy uĪyciu typowych narzĊ-dzi programowania”4. Charakteryzuje ją kilka cech: objĊtoĞü (volume), polegająca na „znaczą-cej dynamice wzrostu danych”; róĪnorodnoĞü

(variety), cechująca siĊ tym, Īe analizowane dane pochodzą z róĪnych Ĩródeá, wystĊpują w róĪnej postaci; strumieĔ (velocity), oznacza-jący fakt, Īe informacje napáywają strumienio-wo, niezwykle szybko, co wymaga dodatko-wych mocy obliczeniododatko-wych. Ponadto Big Data odznacza siĊ záoĪonoĞcią (complexity) – dane są ustrukturyzowane w róĪnoraki sposób lub nie są uporządkowane w ogóle, naleĪy poznaü áączące je relacje i poddaü je zintegrowaniu; zmienno-Ğcią (variability) – ich natĊĪenie jest zmienne w czasie – i wartoĞcią (value), indywidualną jakoĞcią informacyjną pozwalającą na wycią-ganie wniosków ze zbiorów danych5.

RaÞ nacja zasobów sieciowych umoĪliwia pozyskiwanie informacji wtórnych z analizy zbiorów informacji pierwotnych (Big Data)6. MoĪe sáuĪyü jako niezwykle przydatne narzĊ-dzie dla narzĊ-dziennikarstwa – dziĊki niej pracow-nicy mediów mają dostĊp do niedocenianych i niepoznanych wczeĞniej treĞci. Wykorzystuje siĊ ją takĪe w róĪnych gaáĊziach gospodarki,

Internetowe predykcje notowa

ñ

spó

ïek gieïdowych

(2)

7 K. Smith, Big Data discoveries, „Best’s Review” 2015, nr 7.

8 H. Chen, R. Chiang, V. Storey, Business intelligence and analytics: From Big Data to big impact, „MIS Quarterly” 2012, s. 1165–1188.

9 V. Dhar, Can Big Data machines analyze stock market sentiment?, „Big Data” 2014, nr 4, s. 178.

10 C. Curme i in., Quantifying the semantics of search behavior before stock market moves, „PNAS” 2014, nr 32. począwszy od ekonomii, przez reklamĊ,

medy-cynĊ, ubezpieczenia, aĪ do nauki7. Jako przy-káad jej zastosowania moĪe posáuĪyü dziaáal-noĞü Þ rm Brand24 i SentiOne zajmujących siĊ pozyskiwaniem informacji z zasobów Big Data. SáuĪą one do Ğledzenia sentymentów wpáywa-jących na pozycjĊ danej marki. RaÞ nacja in-formacji moĪe znaleĨü zastosowanie równieĪ w monitoringu mediów, ocenie skutecznoĞci kampanii marketingowych oraz poznawaniu proÞ li reklamobiorców8.

Badania w zakresie wspóázaleĪnoĞci pomiĊ-dzy zasobami Big Data a notowaniami gie ádo-wymi dopiero zaczynają stawaü siĊ obiektem zainteresowania naukowców. Dotychczasowe analizy zaleĪnoĞci pomiĊdzy opiniami uĪytkow-ników internetu a zmianami cen akcji nie przy-niosáy jednoznacznych wniosków w zakresie tworzenia modeli predykcyjnych z wykorzysta-niem zasobów Big Data. Tym zagadniewykorzysta-niem za-jąá siĊ w swojej pracy Vasant Dhar9. Po analizie porównawczej sentymentów zawartych w po-nad 13 tysiącach artykuáów o tematyce bizne-sowej publikowanych przez Reutersa i notowaĔ spóáek gieádowych z indeksu S&P500 postawiá kilka tez. Po pierwsze, zmniejszenie siĊ liczby wypowiedzi o charakterze pozytywnym (po-zytywne sentymenty), równowaĪącym zwykle stale pojawiające siĊ w dyskusji nastroje pesy-mistyczne, moĪe byü zapowiedzią zbliĪających siĊ spadków na gieádzie. Z drugiej strony niski poziom pozytywnych sentymentów przy nor-malnym, nieodbiegającym od normy poziomie pejoratywnych komentarzy moĪe Ğwiadczyü o tym, Īe inwestorzy sprzedali juĪ swoje udzia-áy, moĪe wiĊc byü to przedsmak nadchodzących wzrostów – pieniądze pochodzące z owych

transakcji bĊdą prawdopodobnie niedáugo po-nownie wáączone do obiegu. Ta hipoteza moĪe takĪe zakáadaü, Īe przy wysokim poziomie sen-tymentów pozytywnych i maáej liczbie wypo-wiedzi negatywnych istnieje rosnące ryzyko spadku na gieádzie. W przypadku pojawienia siĊ niepokojącej informacji (sentymenty nega-tywne) o danej spóáce inwestujące w nią osoby mogą zacząü zbiorowo sprzedawaü jej udzia-áy, co spowoduje gwaátowny spadek jej war-toĞci. Analiza haseá z wyszukiwarki Google, przeprowadzona w Warwick Business School przez Chestera Curme’a, Tobiasa Preisa, Har-ry’ego Eugene’a Stanleya i Helen Susannah Moat, dowiodáa natomiast, Īe kryzys gieádowy moĪe byü poprzedzony wzmoĪonym wyszu-kiwaniem informacji związanych z polityką i biznesem.

Wyszukiwarka Google’a, podobnie jak inne tego typu narzĊdzia, przechowuje informacje o zachowaniach swoich uĪytkowników, niektó-re z nich są publicznie dostĊpne dziĊki Google Trends, z którego korzystano podczas prezen-towanych tu badaĔ. Okazaáo siĊ, Īe wzmoĪone wyszukiwanie haseá związanych z tematami politycznymi i ekonomicznymi áączy siĊ z nie-pokojem zarówno indywidualnych inwestorów, jak i ogóáu spoáeczeĔstwa. Ten stan rzeczy ma odzwierciedlenie w spadkach na gieádzie, któ-re są rezultatem zwątpienia w wysoką wartoĞü akcji i przeprowadzania transakcji na mniejsze kwoty. Ta zaleĪnoĞü zmniejsza siĊ w ostatnich latach, prawdopodobnie z powodu wáączenia internetowych danych do zautomatyzowanych strategii inwestowania10.

Badania Eduarda Jose Ruiza, Vagelisa Hristidisa, Carlosa Castilla, Aristidesa Gionisa

(3)

11 M. Rechenthin, W.N. Street, P. Srinivasan, Stock chatter: Using stock sentiment to predict price direction, „Algorithmic Finance” 2013, nr 3–4, s. 170.

12 J. Smailoviü i in., Predictive sentiment analysis of Tweets: A stock market application, „Human-computer interaction and knowledge discovery in complex, unstructured, Big Data” 2013, s. 77–88.

13 J. Bollen, H. Mao, X. Zeng, Twitter mood predicts the stock market, „Journal of Computational Science” 2011, Vol. 2, wyd. 1.

14 M. Rechenthin, W.N. Street, P. Srinivasan, Stock chatter…, dz. cyt., s. 169–196.

15 S. Martínez Bustos i in., Pricing stocks with yardsticks and sentiments, „Algorithmic Finance” 2011, nr 1. i Alejandra Jaimesa wykazaáy, Īe nierealna

jest predykcja notowaĔ danej spóáki gieádowej na podstawie wyników uzyskanych z Twitte-ra. Analiza sentymentów jego uĪytkowników okazaáa siĊ niewystarczająca – brak staáoĞci w hashtagach i zbyt wiele nieuĪytecznych da-nych w wynikach, takich jak niepowiązane, niedotyczące spóáki informacje, odwoáujące siĊ do wieloznacznoĞci jej nazwy, uniemoĪli-wiáy osiągniĊcie zadowalających rezultatów. Badacze zaznaczyli, Īe niewykluczone jest, Īe analiza Twittera pod kątem caáego rynku gieá-dowego moĪe przynieĞü rezultaty11. W innych badaniach, przeprowadzonych przez JasminĊ Smailoviü, MihĊ Grþara, NadĊ Lavraþ i Marti-na Žnidaršiþa, okazaáo siĊ jednak, Īe moĪliwe jest przewidywanie zmian wartoĞci spóáek gieá-dowych. Naukowcy zastosowali mechanizm klasyÞ kujący maszyny wektorów noĞnych do analizy tweetów – podzielili je na trzy grupy pod wzglĊdem ich zabarwienia (pozytywne, ne-gatywne, neutralne). Predykcja notowaĔ spóáek gieádowych byáa moĪliwa przy analizie zmian liczby wypowiedzi o zabarwieniu pozytyw-nym – zapowiadaáy one analogiczne zmiany wartoĞci akcji poszczególnych spóáek12. Johan Bollen, Huina Mao i Xiao-Jun Zeng dowiedli natomiast, Īe moĪliwa jest predykcja notowaĔ spóáki za pomocą analizy sentymentów uĪyt-kowników Twittera nieodnoszących siĊ bez-poĞrednio do rynku gieádowego. Okazaáo siĊ, Īe dziĊki tej metodzie udaáo siĊ w 86,7 proc. przewidzieü dzienną wartoĞü akcji Dow Jones Industrial Average – spóáki notowanej na nowo-jorskiej Gieádzie Papierów WartoĞciowych13.

Oczekiwanych rezultatów nie przyniosáy natomiast predykcje notowaĔ na podstawie da-nych zawartych na forum Yahoo, które zostaáy przebadane przez Michaela Rechenthina, Nicka Streeta i Padmini Srinivasan – analiza pokry-waáa siĊ tylko w ok. 50 proc. z wartoĞcią akcji. Badacze sprawdzili, czy wpáyw na zdolnoĞü przewidywania wahaĔ notowaĔ ma uczciwoĞü treĞci publikowanych przez graczy gieádowych. Autorzy pracy zaáoĪyli, Īe mogą oni osáabiaü wyniki analizy sentymentów przez stawianie nieprawdziwych tez, wprowadzanie innych uĪytkowników w báąd przez granie w inny niĪ opisany przez siebie sposób – wszystko po to, by zmanipulowaü ich dziaáania i spowodowaü, by ci grali zgodnie z ich planem. Z badaĔ wy-nika jednak, Īe osoby próbujące wpáynąü na rynkowe dziaáania innych graczy nie oddziaáują znacząco na ruchy innych inwestorów, a wiĊc takĪe na rezultaty badania sentymentów14. Fo-rum Yahoo! Finance and Raging Bull zostaáo takĪe przebadane przez Wernera Antweilera i Murraya Franka – ich analiza dowiodáa, Īe tre-Ğci zawarte na portalu wykazują nieduĪe moĪli-woĞci predykcji póĨniejszych notowaĔ15.

Metodologia

Dowodząc potencjaáu informacyjnego duĪych zasobów sieciowych, podjĊto pracĊ badawczą mającą na celu potwierdzenie lub wykluczenie wspóázaleĪnoĞci pomiĊdzy wydĨwiĊkiem opi-nii zawartych w zasobach sieciowych a noto-waniami wybranych spóáek. PrzyjĊto hipotezĊ, Īe moĪliwe jest wykazanie zaleĪnoĞci miĊdzy treĞciami publikowanymi w internecie przez

(4)

16 WartoĞü R2 waha siĊ od -1 do 1. Im jest ona wyĪsza, tym wiĊkszą analogią wykazują siĊ oba czynniki. Ujem-na wartoĞü oznacza związek ujemny – zmienne charakteryzują siĊ odwrotnie proporcjonalną zaleĪnoĞcią, jedna z nich (X) roĞnie, podczas gdy druga (Y) maleje.

jego uĪytkowników a zmianą wartoĞci akcji po-szczególnych spóáek.

ZaáoĪono, Īe treĞci o zabarwieniu pozytyw-nym, a zatem informacje o sukcesach Þ rmy, opinie o wzrostach cen spóáki i rekomendacje kupna akcji spóáki bĊdą poprzedzaü trend ro-snący akcji, zaĞ negatywne komentarze, odno-szące siĊ do wiadomoĞci o poraĪkach spóáki, spadkach jej wartoĞci lub rekomendacji sprze-daĪy bĊdą przewidywaü tendencjĊ spadkową. Do udowodnienia owej tezy zostaáy uĪyte dane czterech spóáek gieádowych, których no-towania porównano z wynikami analizy zbio-rów danych z róĪnych Ĩródeá internetowych: portali spoáecznoĞciowych, forów interneto-wych, stron i blogów. Pod uwagĊ wziĊto spóá-ki notowane na WIG20: KGHM, Tauron, Enea i Synthos. Zakres czasowy badania wyniósá trzy tygodnie w styczniu i marcu 2015 r. Do-bór terminu analizy miaá na celu sprawdzenie skutecznoĞci badania w dwóch odmiennych okresach.

NarzĊdzia potrzebne do realizacji badaĔ, w zakresie „wyáuskania” informacji z zasobów sieciowych zostaáy udostĊpnione dziĊki uprzej-moĞci Þ rmy SentiOne, której naleĪą siĊ szcze-gólne podziĊkowania.

Analiza wydĨwiĊku (sentymentu) polega na identyÞ kacji áadunku emocjonalnego wypowie-dzi i zaszeregowaniu go do jednej z trzech kate-gorii – wypowiedĨ moĪe byü pozytywna, nega-tywna lub neutralna. SkutecznoĞü istniejących narzĊdzi analizy sentymentów nie wystarcza, ze wzglĊdu na trudnoĞci páynące ze záoĪonoĞci jĊzyka i kontekstu. Z tego powodu w badaniu przeprowadzono analizĊ wypowiedzi, która w związku z brakiem odpowiednich narzĊdzi badawczych (dotyczących sentymentów) zosta-áa oparta na opinii ekspertów.

Pojawiające siĊ trudnoĞci polegaáy na prawi-dáowym rozpoznaniu ironii i sarkazmu, a takĪe na poprawnym rozszyfrowaniu róĪnych odmian jĊzyka, np. slangu i Īargonu. Kolejną komplika-cją okazaáa siĊ klasyÞ kacja wpisów – powstaáo pytanie, czy kaĪda wypowiedĨ na temat spóá-ki jest znacząca dla analizy, czy teĪ naleĪaáoby ograniczyü siĊ do informacji dotyczących wy-áącznie jej notowaĔ. Zwrócono takĪe uwagĊ na problem komentarzy wirusowych, rozumianych jako wypowiedzi powielane przez internautów.

W analizie zostaá uĪyty wspóáczynnik ko-relacji Pearsona okreĞlający siáĊ liniowej za-leĪnoĞci miĊdzy dwiema zmiennymi – liczbą negatywnych i pozytywnych wypowiedzi w in-ternecie i notowaniami spóáki. DziĊki wielkoĞci korelacji moĪna oceniü podobieĔstwo zmian miĊdzy dwoma cechami16.

Przebieg bada

Ĕ

W badaniu przeanalizowano wszystkie wy-powiedzi na temat uwzglĊdnianych spóáek, które zostaáy zebrane za pomocą narzĊdzia SentiOne. Program agreguje zawĊĪoną liczbĊ treĞci po-chodzących z ogólnodostĊpnych Ĩródeá, dla-tego liczba wzmianek wyniosáa 6318. NajczĊ-Ğciej pojawiające siĊ sáowa kluczowe oscylo-waáy wokóá inwestycji spóáek, ich pozycji na gieádzie, decyzji podejmowanych przez ich wáadze oraz jakoĞci Ğwiadczonych przez nie usáug.

Za wyrazy o zabarwieniu pozytywnym – wyróĪnione na podstawie opinii eksperckich – uznano: sukces, najlepszy interes, korzyĞci, dobra jakoĞü, poprawa, odbicie, wzrost, zyski, spore inwestycje. Wpisy o charakterze nega-tywnym zawieraáy czĊsto wyraĪenia: oszustwo, záodziejstwo, brak profesjonalizmu, trudna sytuacja, spadek, strata, sáabe wyniki, chude

(5)

lata, patologia, choroba, upadek, wygaszanie zakáadów, podatek, nierentownoĞü. Neutral-ne komentarze okazaáy siĊ najtrudniejsze do usystematyzowania – wiele z nich charaktery-zowaáo siĊ treĞciami trudno klasyÞ kowalnymi, w duĪym stopniu nieistotnymi dla analizy (co widaü po wskaĨnikach korelacji). NajczĊĞciej pojawiającymi siĊ sáowami kluczowymi w tej kategorii byáy zwroty: zainteresowanie oraz in-westycje.

KGHM

W okresie od 1 stycznia 2015 do 21 stycznia 2015 uzyskano 2377 wyników dotyczących spóáki akcyjnej KGHM, z czego 19,44 proc. sta-nowiáy wypowiedzi o zabarwieniu pozytywnym – odnotowano 462 tego typu wzmianki. Komen-tarze o nacechowaniu pejoratywnym, których zliczono 698, stanowiáy 29,36 proc. ogóáu tre-Ğci. Przeprowadzona analiza wskazuje na to, Īe istnieje zaleĪnoĞü miĊdzy zabarwieniem wypo-wiedzi internautów dotyczących spóáki KGHM a zmianami wartoĞci jej akcji. W pierwszym

ba-daniu, w czasie którego wziĊto pod uwagĊ wpisy wirusowe, wskaĨnik korelacji Pearsona dla sen-tymentów pozytywnych wyniósá -0,41, dla nega-tywnych: 0, a dla neutralnych: -0,65. W tej pró-bie wyeliminowano informacje na temat sponso-rowania przez Þ rmĊ druĪyn sportowych, a takĪe komentarze uznane za nieistotne dla analizy (wpisy wirusowe). W drugim badaniu postano-wiono sprawdziü, jak wpisy wirusowe wpáywają na korelacje miĊdzy zmiennymi. PodjĊto próbĊ odrzucenia trzech tego typu wypowiedzi, a tak-Īe, podobnie jak wczeĞniej, informacji o sponso-rowaniu druĪyn. Zachowano jednak inne wpisy, uznawane wczeĞniej za nieistotne. Okazaáo siĊ, Īe najsilniejszy związek miĊdzy notowaniami KGHM-u a sentymentami uĪytkowników inter-netu wykazano w momencie eliminacji jednego komentarza wirusowego dotyczącego zarzą-dzania polskim górnictwem. W tym przypadku osiągniĊto duĪo lepsze wyniki niĪ przy pierwszej analizie – korelacja dla sentymentów pozytyw-nych wyniosáa -0,45, negatywnych -0,65, a neu-tralnych -0,78. 100 102 104 106 108 110 112 114 116 0 50 100 150 200 250 300 350 400 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 C en a ak cj i L ic zb a w zm ia n ek Dni badania Pozytywne Neutralne Negatywne Notowania

Wykres 1. Porównanie notowaĔ spóáki KGHM i dotyczących jej sentymentów z caáego badanego okresu (1 stycznia–25 stycznia 2015)

(6)

Tauron

W badanym okresie pojawiáo siĊ 2148 wypo-wiedzi na temat spóáki Tauron. NajwiĊcej ko-mentarzy miaáo charakter neutralny – stanowi-áy aĪ 78,12 proc. wszystkich opinii. Negatywne sentymenty wyraĪaáo 14,80 proc. wszystkich wpisów, zaĞ pozytywne – 7,08 proc. Bada-nie wskazuje, Īe w przypadku spóáki Tauron nie zaszáa tak wysoka korelacja miĊdzy jej notowaniami a wypowiedziami na jej temat, jak w przypadku KGHM. Korelacja dla sen-tymentów pozytywnych wyniosáa -0,31, dla negatywnych -0,41, zaĞ dla neutralnych -0,11. Prawdopodobnie byáo to spowodowane nie-zwykle duĪą liczbą danych nieodnoszących siĊ bezpoĞrednio do sytuacji Þ nansowej Þ rmy czy jej pozycji na gieádzie. Bardzo wysoki odsetek wpisów odnosiá siĊ do kondycji Þ rmy i jakoĞci usáug Ğwiadczonych przez przedsiĊbiorstwo – okazaáo siĊ, Īe nie wywierają one zbyt duĪego wpáywu na wartoĞü akcji Tauronu, zaburzają wrĊcz moĪliwoĞü ich predykcji. Szczególnie neutralne komentarze, których odnotowano

najwiĊcej, zawierające w wiĊkszoĞci infor-macje wáaĞnie na temat poziomu satysfakcji z oferowanych usáug, nie wykazują znaczącej korelacji z cenami udziaáów spóáki. W bada-nym okresie nie pojawiáo siĊ takĪe zbyt wiele opinii inwestorów na temat przedsiĊbiorstwa, co równieĪ mogáo znacząco wpáynąü na wynik badania.

Wykresy sentymentów negatywnych i pozy-tywnych pokazują, Īe w niemal caáym badanym okresie ich liczby byáy na podobnym poziomie, dopiero 10 stycznia wypowiedzi o charakterze negatywnym zaczĊáy liczbowo przewyĪszaü te pozytywne. Ich gwaátowny wzrost odnotowa-no 17 stycznia, kiedy nastąpiá spadek wartoĞci akcji Tauronu. Tendencja spadkowa zaczĊáa siĊ w tym przypadku 13 stycznia, nie moĪna wiĊc mówiü o predykcji tego trendu, chyba Īe uzna siĊ za sáuszną interpretacjĊ Dhara, Īe negatyw-ne komentarze inwestorów są poprzedzone przez sprzedawanie przez nich akcji, przez co stają siĊ zapowiedzią odbicia – niskie ceny ak-cji mobilizują inwestorów do ich kupna.

4,8 4,85 4,9 4,95 5 5,05 5,1 5,15 5,2 5,25 5,3 0 50 100 150 200 250 300 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 C en a ak cj i Dni badania Pozytywne Neutralne Negatywne Notowania L ic zb a w zm ia n ek

Wykres 2. Porównanie notowaĔ spóáki Tauron i dotyczących jej sentymentów z caáego badanego okresu (1 stycznia–25 stycznia 2015)

(7)

Enea

W celu ustalenia sentymentu wypowiedzi doty-czących spóáki Enea poddano analizie 1483 wy-powiedzi. Badanie przeprowadzono w dniach 4 marca–25 marca 2015. Podsumowując, ba-danie porównawcze analizy sentymentu oraz notowaĔ spóáki Enea, pozwoliáo zaobserwowaü pewne przesáanki, które mogą Ğwiadczyü o pre-dykcyjnym charakterze komentarzy inwesto-rów. Wzrost liczby pozytywnych komentarzy w dniach 7–8 marca poprzedziá lekki wzrost ak-cji 9 marca. Gwaátowny spadek pozytywnych wypowiedzi (z 46 do 15) i wzrost negatywnych (z 1 do 22) w dniu 9 marca, kiedy akcje osi ągnĊ-áy maksymalną wycenĊ, mógá sugerowaü zmia-nĊ nastawienia inwestorów spodziewających siĊ spadków. RzeczywiĞcie, 10 marca nastąpiáo zaáamanie cen akcji, które trwaáo do 16 mar-ca, kiedy akcje osiągnĊáy najniĪszy objĊty ba-daniem poziom 15,44 zá. Jednak w niedzielĊ

15 marca w internecie znalazáo siĊ 16 pozytyw-nych komentarzy, co mogáo sugerowaü zmianĊ trendu. Od 17 marca kurs spóáki zacząá nieprze-rwanie rosnąü, aĪ do koĔca badania, osiągając 25 marca poziom 16,82 zá. Temu wzrostowi to-warzyszyá stale pozytywny wydĨwiĊk komen-tarzy inwestorów.

Wspóáczynnik korelacji Pearsona dla caáe-go badanecaáe-go okresu wyniósá odpowiednio: 0,54 dla komentarzy pozytywnych, 0,54 dla komen-tarzy neutralnych oraz -0,45 dla komenkomen-tarzy negatywnych.

WartoĞü wspóáczynnika Pearsona okazaáa siĊ znacznie wyĪsza dla caáego badanego okre-su niĪ dla poszczególnych jego czĊĞci. MoĪe to Ğwiadczyü o wiĊkszej skutecznoĞci analizy sentymentu dla dáuĪszego okresu. Inną moĪli-wą przyczyną byáa wiĊksza liczba komentarzy, co pozwoliáo na precyzyjniejszą predykcjĊ no-towaĔ spóáki. 14,5 15 15,5 16 16,5 17 0 20 40 60 80 100 120 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 C en a ak cj i Dni badania Pozytywne Neutralne Negatywne Notowania L ic zb a w zm ia n ek

Wykres 3. WspóázaleĪnoĞü pomiĊdzy sentymentem wypowiedzi a notowaniami spóáki Enea SA w okresie 4 marca– 25 marca 2015

ħródáo: badanie wáasne Synthos

Badanie przeprowadzono w dniach 4 marca– 25 marca 2015. W celu ustalenia sentymentu wypowiedzi dotyczących spóáki Synthos

ana-lizie poddano 310 wypowiedzi. Odnotowano 41 komentarzy o wydĨwiĊku pozytywnym, 122 – o wydĨwiĊku negatywnym oraz 147 neu-tralnych.

(8)

DynamikĊ wydĨwiĊku sentymentu anali-zowanych wypowiedzi przedstawia wykres 4. Widoczny byá niewielki wzrost liczby pozy-tywnych komentarzy w dniach 6, 15 i 17 marca. W Ğlad za nim podąĪaá wzrost cen akcji spóáki w dniach 6 i 16 marca. Jednak bardzo wyra Ĩ-ne zwiĊkszenie liczby komentarzy neutralnych oraz negatywnych zaobserwowano w dniach 15–17 marca. Wiązaáo siĊ to z faktem ujawnie-nia nagraĔ z tzw. „afery podsáuchowej”. Infor-macje zawarte w tych materiaáach zawieraáy nazwisko jednego z czáonków zarządu spóáki. Gieáda zareagowaáa na te informacje gwaátow-nym spadkiem wyceny akcji Synthos z pozio-mu 4,49 zá w dniu 16 marca do poziomu 4,36 zá w dniu 19 marca.

Wspóáczynnik korelacji Pearsona wyniósá odpowiednio: 0,51 dla wypowiedzi

pozytyw-nych, 0,58 dla wypowiedzi neutralnych oraz 0,49 dla wypowiedzi negatywnych. Podsu-mowując przeprowadzone badanie, na pod-stawie wartoĞci wspóáczynnika liczby Pear-sona moĪna uznaü, Īe zaszáa silna korelacja pomiĊdzy liczbą komentarzy a notowaniami spóáki. Najsilniejsza zaleĪnoĞü wystąpiáa po-miĊdzy liczbą komentarzy neutralnych a no-towaniami – wspóáczynnik Pearsona wyniósá 0,58. Dla wypowiedzi pozytywnych byáo to 0,51, dla wypowiedzi negatywnych – 0,49. UwzglĊdniając niewielką liczbĊ materiaáów wykorzystanych do analizy, jej krótki prze-bieg oraz eksperymentalną wersjĊ narzĊdzi badawczych, moĪna uznaü, Īe korelacja na tym poziomie sugeruje istnienie relacji po-miĊdzy charakterem sentymentów a notowa-niami gieádowymi spóáki.

4,25 4,3 4,35 4,4 4,45 4,5 4,55 0 10 20 30 40 50 60 70 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 C en a ak cj i L ic zb a w zm ia n ek Dni badania Pozytywne Neutralne Negatywne Notowania

Wykres 4. WspóázaleĪnoĞü pomiĊdzy sentymentem wypowiedzi a notowaniami spóáki Synthos SA w okresie 4 marca– 25 marca 2015

ħródáo: badanie wáasne

Podsumowanie

Przeprowadzone badanie wykazaáo, Īe zauwa-Īalna jest wspóázaleĪnoĞü pomiĊdzy liczbą komentarzy w sieci o nacechowaniu emocjo-nalnym a notowaniami spóáek. Dowodem na wystĊpowanie takiej zaleĪnoĞci jest

wzglĊd-nie wysoka wartoĞü wspóáczynnika Pearsona. Jego Ğrednia wartoĞü wyniosáa 0,49. NaleĪy uwzglĊdniü czynniki wpáywające negatywnie na wiarygodnoĞü badania: krótki czas analizy, brak dostĊpu do wypowiedzi umieszczonych na zamkniĊtych forach dla inwestorów i

(9)

wynikają-ca z tego stosunkowo niewielka liczba komen-tarzy.

Przeprowadzone badania dowodzą, Īe báąd predykcji zmian wartoĞci akcji jest moĪliwy na-wet w przypadku odpowiedniej interpretacji zbio-rów Big Data. Niekiedy moĪe ona stwarzaü duĪe problemy przy analizie, szczególnie w przypadku prób automatycznego badania emocjonalnego za-barwienia wpisów. Przed tym dylematem badacz staje przy klasyÞ kacji sentymentów do poszcze-gólnych grup (negatywne, pozytywne, neutralne). Okazuje siĊ, Īe tylko niewielka czĊĞü sentymen-tów dotyczących danego przedsiĊbiorstwa ma związek z wahaniami cen jego udziaáów. Podczas identyÞ kacji sentymentów noszących znamio-na wirusowej promocji znamio-naleĪy odrzuciü wątki na temat sponsorowania przez przedsiĊbiorstwo druĪyn sportowych lub festiwali. Istotne wydają siĊ byü dane informujące o kondycji spóáek, ich sukcesach i poraĪkach lub wspominające o zwią-zanych z nimi wydarzeniach. Pod uwagĊ naleĪy braü takĪe sentymenty inwestorów gieádowych – ich rekomendacje czy komentarze na temat bie Īą-cych notowaĔ i stanu konsorcjum.

Oddzielnym problemem okazaáy siĊ wpisy wirusowe, które odnotowano w analizie sen-tymentów dotyczących spóáki KGHM. Zbada-no, Īe mają one znaczący wpáyw na zaleĪnoĞü miĊdzy notowaniami spóáki i sentymentami. Niektóre wpisy, Ĩródáa zliczanych sentymen-tów stanowiących podstawĊ predykcji, moĪ-na uzmoĪ-naü za spam – po ich wyeliminowaniu odnotowano o wiele wyĪszą korelacjĊ niĪ wczeĞniej. Stanowi to o problemie dobo-ru sentymentów związanych z notowaniami spóáki.

Na podstawie przeprowadzonego badania oraz aktualnej wiedzy teoretycznej moĪna przypuszczaü, Īe w przyszáoĞci moĪliwoĞci predykcji notowaĔ gieádowych na podsta-wie analizy sentymentu bĊdą coraz wiĊksze. Wzrost ogólnej liczby biznesowych komenta-rzy w sieci, wynikający z przenoszenia coraz wiĊkszej czĊĞci aktywnoĞci inwestorów do internetu, oraz doskonalsze algorytmy sáuĪące ocenie i klasyÞ kacji wypowiedzi umoĪliwią tworzenie precyzyjniejszych modeli notowaĔ gieádowych.

BibliograÞ a

Big Data, bigger digital shadows, and biggest growth in the Far East,

https://www.emc.com/collateral/ana-lyst-reports/idc-digital-universe-united-states.pdf [dostĊp: 25.04.15].

Bollen J., Mao H., Zeng X., Twitter mood predicts the stock market, „Journal of Computational Science” 2011, Vol. 2, wyd. 1.

Carr N., Páytki umysá. Jak Internet wpáywa na nasz mózg, Gliwice 2013.

Chen H., Chiang R., Storey V., Business intelligence and analytics: From Big Data to big impact, „MIS Quarterly” 2012, s. 1165–1188.

Cukier K., Mayer-Schonberger V., Big Data. Rewolucja, która zmieni nasze myĞlenie, Warszawa 2014. Curme C. i in., Quantifying the semantics of search behavior before stock market moves, „PNAS” 2014, nr 32. Dhar V., Can Big Data machines analyze stock market sentiment?, „Big Data” 2014, nr 4, s. 178.

Drzewiecki R., System wyceny czáowieka. Oto jak Big Data rządzi Ğwiatem, „Forsal.pl” 2014, http://forsal.pl/ artykuly/785494,system-wyceny-czlowieka-oto-jak-big-data-rzadzi-swiatem.html [dostĊp: 3.05.2015]. Ferguson G.A., Takane Y., Analiza statystyczna w psychologii i pedagogice, Warszawa 2009.

Gogoáek W., Kuczma P., RaÞ nacja informacji sieciowych na przykáadzie wyborów parlamentarnych, „Studia Medioznawcze” 2013, nr 2 (53).

(10)

Liu Y., Big Data and predictive business analytics, http://eds.b.ebscohost.com.atoz.han.buw.uw.edu.pl/eds/ pdfviewer/pdfviewer?sid=3149252a-86a3-462d-87c0-690b06fda804%40sessionmgr110&vid=6&hid=11 2 [dostĊp: 09.05.15].

Martin J., The „Big Data” solution for Wall Street, http://iknowÞ rst.com/the-big-data-solution-for-wall-street [dostĊp: 24.04.2015].

Martínez Bustos S. i in., Pricing stocks with yardsticks and sentiments, „Algorithmic Finance” 2011, nr 1. Pisarek W., Polskie sáowa sztandarowe i ich publicznoĞü, Kraków 2002.

Rechenthin M., Street W.N., Srinivasan P., Stock chatter: Using stock sentiment to predict price direction, „Algorithmic Finance” 2013, nr 3-4s. 169-196.

Smailoviü J. i in., Predictive sentiment analysis of Tweets: A stock market application, „Human-computer in-teraction and knowledge discovery in complex, unstructured, Big Data” 2013, s. 77–88.

Smith K., Big Data discoveries, „Best’s Review” 2015, nr 7.

Tabakow M., Korczak J., Franczyk B., Big Data – deÞ nicje, wyzwania i technologie informatyczne, „Informa-tyka Ekonomiczna” 2014, nr 1 (31).

The digital universe of opportunities: Rich Data and the inreasing value of the Internet of things, http://www.

emc.com/leadership/digital-universe/2014iview/executive-summary.htm [dostĊp: 25.04.15].

Cytaty

Powiązane dokumenty

Informacje dotyczące obszarów geograficznych przedstawia tylko 42% ba- danych spółek, zaś te, które przedstawiają te informacje, nie zawsze wykazują wszystkie wymagane

To, że teczka się nie otworzyła, a „Ali” nie otrzymał Krzyża Walecznych”, a „tylko” srebrny Krzyż Zasługi z Mieczami, nie oznacza, że jego udział w przygotowaniu

Pomimo ubóstwa ziemi, świadczenia jej do skarbu publi­ cznego, jakoteż wydatki na wojsko, były nie małe. Niemamy oczy­ wiście cyfr pełnych, musimy się zadowolnić

Ze wzglądów historycznych, a także ze względu na zawartość witamin często o kilka rzędów większą niż przeciętna oraz wysoką w porównaniu do zapotrzebowania,

Przedmiotem zainteresowania w tym opracowaniu nie s¹ wszelkie problemy, jakie mog¹ pojawiæ siê w spó³ce komandytowej z udzia³em osób prawnych i u³omnych osób prawnych

On the other hand, when the inhabitants of these secondary worlds witness various manifestations of uncontrollable wild magic, including different supernatural

Jednostka jednak nie przeżywa wtedy nadmiernych stresów związanych ze spełnianiem własnych ambicji, jak jest w kulturach zachodnich, w których obserwuje się często