• Nie Znaleziono Wyników

, Grzegorz Król

N/A
N/A
Protected

Academic year: 2021

Share ", Grzegorz Król"

Copied!
11
0
0

Pełen tekst

(1)

* Graĝyna Wieczorkowska – prof. zw. dr hab., Katedra Psychologii ibSocjologii ZarzÈdzania, Wydziaï ZarzÈdzania, Uniwersytet Warszawski.

Adres do korespondencji: Katedra Psychologii ib Socjologii ZarzÈdzania, Wydziaï ZarzÈdzania, Uniwersytet Warszawski, ul. Szturmowa 1/3, 02-678 Warszawa; e-mail: gw@uw.edu.pl.

** Grzegorz Król – dr, Katedra Psychologii ibSocjologii ZarzÈdzania, Wydziaï ZarzÈdzania, Uniwersytet Warszawski.

Adres do korespondencji: Katedra Psychologii ib Socjologii ZarzÈdzania, Wydziaï ZarzÈdzania, Uniwersytet Warszawski, ul. Szturmowa 1/3, 02-678 Warszawa; e-mail: grzegorz.krol@uw.edu.pl.

*** Jerzy Wierzbiñski – prof. dr hab., Samodzielny Zakïad Metod Matematycznych ib Statystycznych ZarzÈdzania, Wydziaï ZarzÈdzania, Uniwersytet Warszawski.

Adres do korespondencji: Samodzielny Zakïad Metod Matematycznych ibStatystycznych ZarzÈdzania, Wydziaï ZarzÈdzania, Uniwersytet Warszawski, ul. Szturmowa 1/3, 02-678 Warszawa; e-mail: wierz- binski@wz.uw.edu.pl.

Cztery metodologiczne zagro ĝenia w bnaukachbobzarzÈdzaniu 1

Gra ĝyna Wieczorkowska

*

, Grzegorz Król

**

, Jerzy Wierzbi ñski

***

W tekĂcie omówiono cztery metodologiczne zagroĝenia pojawiajÈce siÚ wbbadaniach iloĂcio- wych zbzakresu nauk obzarzÈdzaniu: (1) Zbyt maïa liczba eksperymentów; (2) SïaboĂÊ modeli teoretycznych; (3) SïaboĂÊ pomiaru; (4) SïaboĂÊ analiz. WiÚkszoĂÊ tych zagroĝeñ dotyczy takĝe badañ psychologicznych ibsocjologicznych. W podsumowanie znajdujÈ siÚ odpowiedzi na potencjalnie nieuzasadnione zarzuty recenzentów dotyczÈce próby ibbraku hipotez.

Sïowa kluczowe: metody iloĂciowe, zagroĝenia metodologiczne.

Nadesïany: 20.11.2016 | Zaakceptowany do druku: 28.12.2016

Four Methodological Threats in Management Science

The text discusses four threats in the analysis of data in management science: (1) Too small number of experimental studies; (2) Weakness of theoretical models; (3) Weakness of measu- rement; (4) Weakness of analysis. Most of these pitfalls apply also to psychological and socio- logical research. The summary covers answers to reviewers’ potentially unjustified objections concerning samples and lack of hypotheses.

Keywords: quantitative methods, methodological threats.

Submitted: 20.11.2016 | Accepted: 28.12.2016

JEL: C18

Studia i Materiaïy, 2/2016 (22), cz. 2: 146– 156 ISSN 1733-9758, © Wydziaï ZarzÈdzania UW DOI 10.7172/1733-9758.2016.22.11

(2)

1. WstÚp

Od lat spÚdzamy wiele godzin tygo- dniowo, analizujÈc dane zbbadañ, nadzoru- jÈc analizy wykonywane przez studentów, doktorantów, czy piszÈc recenzje prac dok- torskich, habilitacyjnych ibartykuïów nauko- wych zb psychologii, socjologii ib zarzÈdza- nia. KiedyĂ analizy statystyczne wykonywali specjaliĂci; rozwój pakietów statystycznych ib ïatwoĂÊ ich obsïugi powoduje, ĝe teraz nawet skomplikowane analizy moĝna wykli- kaÊ wbciÈgu paru minut. ’atwoĂÊ wykony- wania zaawansowanych analiz nie idzie jednak wbparze zbodpowiednim poziomem refleksji. Dlatego postanowiliĂmy zwróciÊ uwagÚ na cztery czÚsto pojawiajÈce siÚ sïa- boĂci analiz, które spotykamy wbrecenzowa- nych przez nas pracach.

2. Typ badañ: za maïo eksperymentowania

W naukach obzarzÈdzaniu najczÚstszym typem badañ iloĂciowych sÈ badania kore- lacyjne. Przykïadowo, jeĂli chcemy zbadaÊ zwiÈzek satysfakcji pracowników (Y – zmienna zaleĝna/objaĂniana) zb czÚstoĂciÈ uzyskiwania przez nich pochwaï od bez- poĂredniego przeïoĝonego (X – zmienna niezaleĝna/objaĂniajÈca), to wb badaniach korelacyjnych mierzymy zarówno X (pochwaïy), jak ib Y (satysfakcja). Badacz jednak nie ma wpïywu na wystÈpienie zmiennej niezaleĝnej (pochwaïa), co ozna- cza, ĝe nie jest wbstanie wykluczyÊ wpïywu

„trzecich” zmiennych (np. kto pochwaliï, kiedy, za co, wbjakich warunkach). Z tego wzglÚdu immanentnÈ cechÈ badañ korela- cyjnych jest ich niska trafnoĂÊ wewnÚtrzna.

Wbbadaniach eksperymentalnych manipu- lujemy pochwaïÈ (wprowadzamy jÈ wb Ăci- Ăle okreĂlonych warunkach, wb odmienny sposób wb róĝnych grupach) – dlatego trafnoĂÊ wewnÚtrzna badania moĝe byÊ bardzo wysoka. W jÚzyku potocznym pojÚ- cie manipulacji ma negatywnÈ konotacjÚ, poniewaĝ wiÈĝe siÚ zb ukrytym sposobem wywierania na nas wpïywu – wbrew naszej woli i/lub interesowi. W metodologii moĝli- woĂÊ manipulowania wartoĂciami zmiennej niezaleĝnej jest bardzo pozytywnÈ cechÈ badania. JeĂli potrafimy manipulowaÊ danÈ zmiennÈ, nie musimy czekaÊ, aĝ dana war- toĂÊ zmiennej wystÈpi wbsposób naturalny, ale wprowadzamy jÈ sami ib sprawdzamy, jakie sÈ tego skutki. W badaniach mani-

pulujemy zmiennymi, ab nie luděmi, choÊ efekty tego zbdefinicji powinny wpïywaÊ na zachowanie osób uczestniczÈcych wbbada- niach. Reakcja na pochwaïÚ moĝe zaleĝeÊ od wielu zmiennych – samooceny, poziomu aspiracji, neurotyzmu, doĂwiadczeñ prze- szïoĂci itd. Ludzie róĝniÈ siÚ miÚdzy sobÈ na wielu wymiarach mogÈcych mieÊ wpïyw na naszÈ zmiennÈ zaleĝnÈ (satysfakcja), niezaleĝnie od wartoĂci zmiennej niezaleĝ- nej (pochwaïa), ale jeĂli losowo podzielimy badanÈ próbÚ na 2 grupy, to Ăredni poziom samooceny, neurotyzmu itd. bÚdzie wbobu grupach taki sam. Losowy przydziaï do grup eksperymentalnych to metoda tworze- nia „zbiorowych klonów”, która chroni nas przed zakïócajÈcym wyniki wpïywem innych zmiennych. Losowy przydziaï do grup eks- perymentalnych moĝna wyobraziÊ sobie jako wielki „wyrównywacz”, dziÚki któremu wiemy, ĝe wartoĂci zmiennej niezaleĝnej sÈ jedynÈ nielosowÈ róĝnicÈ odpowiedzialnÈ za zróĝnicowanie zmiennej zaleĝnej (kanon jedynej róĝnicy Milla). Eksperyment róĝni siÚ od innych typów naukowych dociekañ tym, ĝe zamiast czekaÊ na zaistnienie inte- resujÈcych nas wydarzeñ naturalnych, eks- perymentator kreuje warunki potrzebne do obserwacji (Aronson ibWieczorkowska, 2001).

Przyrost naszej wiedzy budujÈ przede wszystkim wyniki badañ eksperymental- nych, ab nie korelacyjnych. CiÈgle jednak ten fakt nie moĝe siÚ przebiÊ wb naukach ob zarzÈdzaniu, choÊ rozwój ekonomii behawioralnej ib Nagroda Nobla wb ekono- mii wb 2002 roku dla Vernona Smitha za ustanowienie eksperymentów laborato- ryjnych narzÚdziem empirycznej analizy oraz Daniela Kahnemana za zastosowanie narzÚdzi psychologicznych wb badaniach ekonomicznych, ze szczególnym uwzglÚd- nieniem teorii perspektywy, juĝ dawno powinny zmieniÊ nastawienie badaczy.

Krytycy badañ eksperymentalnych mówiÈ, ĝe gromadzimy wiedzÚ ob studentach, bo to oni najczÚĂciej biorÈ udziaï wb naszych badaniach. O ile badanie ankietowe moĝna przeprowadziÊ na wielu tysiÈcach osób, eksperymenty prowadzi siÚ na maïych gru- pach, bo ich przygotowanie wymaga wielu godzin pracy ib wiÚkszej inwestycji czaso- wej ze strony badanych. Pojawia siÚ wiÚc pytanie, na ile moĝna uogólniÊ wyniki uzyskane np. wb badaniu 30 studentów – innymi sïowy, jaka jest trafnoĂÊ zewnÚtrzna takiego badania. Przecieĝ nie interesujÈ nas

(3)

jedynie reakcje uczestników, chcemy orze- kaÊ ob populacji, zb której ta próba zostaïa wybrana. JeĂli interesujÈ nas preferencje wyborcze Polaków, to wylosowana do badañ próba powinna byÊ reprezentatywna dla dorosïych Polaków. Próby reprezentatywne sÈ niesïychanie waĝne, jeĝeli naszym celem jest poznanie rozkïadu zmiennej wb popu- lacji. Jednak ze wzglÚdu na duĝÈ liczbÚ zmiennych zakïócajÈcych, czÚsto obbardzo skoĂnych rozkïadach (np. wyksztaïcenie), sÈ one duĝo mniej przydatne, gdy chcemy testowaÊ zaleĝnoĂci miÚdzy zmiennymi.

Skuteczna statystyczna kontrola waĝnych zmiennych (choÊ nieistotnych ze wzglÚdu na cel badania) jest bardzo trudna do osiÈgniÚcia – dlatego zamiana zmiennych towarzyszÈcych (zakïócajÈcych) wb staïe daje duĝo lepsze efekty. Podstawowym celem badañ eksperymentalnych nie jest okreĂlenie rozkïadu zmiennej zaleĝnej, np. poziomu satysfakcji, ale stwierdzenie czy róĝnica wb poziomie satysfakcji miÚ- dzy badanymi grupami jest istotna staty- stycznie. Do tego nie potrzebujemy próby reprezentatywnej. Od badania prób repre- zentatywnych duĝo lepszÈ strategiÈ maksy- malizacji trafnoĂci zewnÚtrznej jest repliko- wanie badañ na próbach homogenicznych – osobno badamy rolników, osobno pra- cowników naukowych, osobno studentów itd. Wyniki badañ trzydziestu osób losowo podzielonych na warunki eksperymentalne majÈ wiÚkszÈ wartoĂÊ poznawczÈ niĝ trzech tysiÚcy uczestniczÈcych wbbadaniach kore- lacyjnych. Randomizacja drugiego stopnia (losowy przydziaï do grup eksperymen- talnych) zapewnia nam wysokÈ trafnoĂÊ wewnÚtrznÈ, jakiej nigdy nie osiÈgniemy wb badaniach korelacyjnych. Problemem jest to, ĝe ludzie niechÚtnie biorÈ udziaï wbbadaniach eksperymentalnych, co powaĝ- nie utrudnia rozwój nauk spoïecznych.

Nadal moĝna teĝ usïyszeÊ, ĝe ekspery- menty laboratoryjne sÈ nierealistycznymi ib„wymyĂlonymi” imitacjami ludzkich inte- rakcji, nieodzwierciedlajÈcymi wb ogóle

„rzeczywistego Ăwiata”. TwierdzÈcy tak zapominajÈ, ĝe eksperyment moĝe byÊ realistyczny wb dwojaki sposób (Aronson ibWieczorkowska, 2001). O realizmie sytu- acyjnym mówimy, jeĂli sytuacja wb labo- ratorium jest podobna do zdarzeñ, które czÚsto spotykajÈ ludzi wbĂwiecie zewnÚtrz- nym. Jednak obwiele waĝniejsze jest to, czy stworzona przez badacza sytuacja anga- ĝuje badanego, skïania go do traktowania

powaĝnie tego, co siÚ dzieje. TÚ wïasnoĂÊ sytuacji okreĂla siÚ jako realizm psycholo- giczny. Dobre sytuacje eksperymentalne, gdy np. uczestnicy grajÈ wbangaĝujÈcÈ grÚ, powodujÈ, ĝe po pewnym czasie sytuacja staje siÚ bardzo realna. OsiÈgniÚte wyniki, pochwaïy, które uzyskujÈ, majÈ realnÈ war- toĂÊ. Badani sÈ ob wiele bardziej zaanga- ĝowani niĝ przy wypeïnianiu ankiet. Nie- chÚÊ wobec eksperymentów budzi fakt, ĝe czÚsto jego prawdziwy cel musi pozostaÊ ukryty na czas trwania badania. Gdyby badani wiedzÈcy, ĝe interesuje nas np. ich ulegïoĂÊ wobec autorytetu, byli poproszeni ob opisanie, jak zachowaliby siÚ pod naci- skiem autorytetu, dowiedzielibyĂmy siÚ, jacy chcieliby byÊ, abnie jacy byliby faktycz- nie. W jednym zbbadañ (Zimbardo ibGer- rig, 2012) przeprowadzonych wbwarunkach naturalnych pielÚgniarki otrzymywaïy od nieznanego im lekarza, prowadzÈcego pacjenta przebywajÈcego wbszpitalu na ich oddziale, telefoniczne polecenie: „Przy- jadÚ za godzinÚ, ale proszÚ juĝ teraz podaÊ pacjentowi 20b mg estrogenu”. Na opako- waniu zawarta byïa informacja, ĝe mak- symalna dawka wynosi 10 mg, typowa zaĂ 5b mg. Polecenie dotyczyïo wiÚc dwukrot- nego przekroczenia maksymalnej dawki.

Gdy poproszono grupÚ pielÚgniarek obprze- widywanie, jak zachowaïyby siÚ wb takiej sytuacji, mniej niĝ 20% stwierdziïo, ĝe pew- nie wykonaïyby takie polecenie. W sytuacji szpitalnej aĝ 21 zb22 pielÚgniarek, które nie wiedziaïy, ĝe uczestniczÈ wbbadaniu, podaïo lek. Nie doceniamy wpïywu, jaki ma na nas sytuacja, wiÚc nasze wyobraĝenia na temat naszych zachowañ nie majÈ duĝej wartoĂci ba dawczej.

3. SïaboĂÊ modeli teoretycznych SïaboĂciÈ nauk spoïecznych jest brak systematyzacji pojÚÊ. Nawet publikujÈc wbfachowych czasopismach, unikamy czÚsto uĝywania „ĝargonu” naukowego, co byïo przez lata wzmacniane obowiÈzkiem publi- kacji prac habilitacyjnych wbformie ksiÈĝki dostÚpnej dla szerszej klasy czytelników.

PrawdÈ jest, ĝe posïugujemy siÚ pojÚciami naturalnymi, wiÚc ich definiowanie wbspo- sób klasyczny nie jest moĝliwe ibna szczÚĂcie prace przeglÈdowe róĝnych definicji znik- nÚïy zb pola naszych zainteresowañ, choÊ moĝna spotkaÊ przeglÈdy zawierajÈce kilka- dziesiÈt definicji danego pojÚcia, np.bzaufa- nia (Grudzewski ibHejduk, 2004).

(4)

Porównania wniosków muszÈ byÊ jednak prowadzone na poziomie operacjonaliza- cji, których niestety wystandaryzowaÊ siÚ nie da. Manipulacja zagroĝeniem musi byÊ inna, gdy jest stosowana wbgrupie studen- tów, niĝ wbgrupie pracowników firmy. Takĝe rozkïady wyników uzyskiwane za pomocÈ standardowych technik pomiaru zaleĝÈ od próby. Przykïadem moĝe byÊ pozycja zbkwe- stionariusza przedziaïowoĂci „Jestem non- szalancki wbtraktowaniu szczegóïów”, która zmieniïa diametralnie swojÈ korelacjÚ ze skalÈ wbgrupie pracowników Wydziaïu Far- macji. Nonszalancja wb traktowaniu szcze- góïów dla farmaceuty ma zupeïnie inne znaczenie niĝ dla studenta.

TworzÈc modele teoretyczne, ciÈ- gle zapominamy, ĝe nauki spoïeczne sÈ wysokokontekstowe. ZaleĝnoĂci uzyski- wane wb modelu ceteris paribus sÈ bardzo podatne na efekt „trzeciej zmiennej”. Dla- tego powinniĂmy zdecydowanie zmniejszyÊ poziom ogólnoĂci naszych teorii. Zazdro- Ăcimy fizykom ib chcielibyĂmy opracowaÊ tak proste reguïy jak trzy zasady dynamiki Newtona, ignorujÈc wb ten sposób fakt, ĝe nasz umysï rozwija siÚ wb odpowiedzi na pojawiajÈce siÚ wbotoczeniu wyzwania – jest wiÚc raczej zbiorem moduïów wyuczonych reakcji na róĝne klasy(!) boděców. Powaĝ- nym problemem jest teĝ rozziew miÚdzy badaniami naukowymi stosujÈcymi gïów- nie podejĂcie nomotetyczne ib praktykÈ, która wymaga wiedzy idiograficznej. Duĝe przyrosty naszej wiedzy nie majÈ jak dotÈd przeïoĝenia na zwiÚkszenie skutecznoĂci oddziaïywañ praktycznych. Duĝo wiÚcej wiemy, ale nadal niewiele wiÚcej potrafimy.

I tu znów czekamy na rozwój technologii, która umoĝliwi wielokrotny pomiar tej samej osoby (iloĂciowe porównawcze stu- dia przypadków – Siarkiewicz, 2007) bez wywoïywania jej irytacji.

W sporze jednoteoretycznych zbeklekty- kami uwaĝamy, ĝe najwaĝniejsze jest otrzy- manie interesujÈcych poznawczo wyników, wiÚc nie mamy nic przeciwko ïÈczeniu róĝnych szkóï teoretycznych. CzterdzieĂci lat temu mówienie obprocesach nieĂwiado- mych byïo totalnie odrzucane przez naukÚ zdominowanÈ przez podejĂcie poznawcze, dziĂ nikt nie ma wÈtpliwoĂci, ĝe przetwarza- nie informacji odbywa siÚ wbprzewaĝajÈcej czÚĂci poza ĂwiadomoĂciÈ.

Za duĝo mamy wb naukach spoïecz- nych twórczoĂci (ciÈgïego wprowadzania nowych pojÚÊ), za maïo rzemiosïa. Nie jest

tajemnicÈ, ĝe najïatwiej osiÈgnÈÊ „sukces”, wprowadzajÈc nowe pojÚcie ib publikujÈc narzÚdzie pomiaru. Jeĝeli mamy szczÚĂcie, wiele osób zacznie korelowaÊ nowe narzÚ- dzie zbistniejÈcymi, aĝ fala zainteresowania opadnie, bo wynik tych usiïowañ moĝna ïatwo przewidzieÊ. Na wykïadach zb meto- dologii powtarzam do znudzenia: repliko- waÊ, replikowaÊ ibjeszcze raz replikowaÊ, bo prawie ĝadna udana replikacja wbnaukach spoïecznych nie jest banalna (Aronson ibWieczorkowska, 2001). Studenci najpierw powinni nauczyÊ siÚ uzyskiwaÊ przewidy- walne na podstawie innych badañ wyniki, ab dopiero potem samodzielnie wychodziÊ dalej. W ostatnich latach mamy do czynie- nia zbkryzysem replikowalnoĂci (a crisis in science in general with the question of repli- cability). Pokazuje on, zb jak wielozmien- nowÈ mamy do czynienia materiÈ (por. np.

Van Bavel i in., 2016). Takie replikacyjne poraĝki powinny byÊ impulsem do poszuki- wania warunków brzegowych dla opisanych wczeĂniej zaleĝnoĂci. Informacje na temat:

„Kiedy to nie dziaïa” mogÈ budowaÊ naszÈ wiedzÚ.

4. SïaboĂÊ pomiaru

Nie moĝemy zapominaÊ, ĝe obiekt naszych badañ jest duĝo bardziej skom- plikowany ib reaktywny niĝ np. wb naukach biologicznych czy fizycznych, na których wzorujemy naszÈ metodologiÚ. Taleb (2012) porównuje nauki spoïeczne, usi- ïujÈce stosowaÊ metodologiÚ wykorzysty- wanÈ przez fizyków do krów, które usiïujÈ lataÊ. Aby zilustrowaÊ to studentom, na wykïadzie zb medycyny psychosomatycznej przeprowadziïam (GW) „trening relak- sacyjny”. Prawie 300 osób siedzÈcych na sali proszono obpodÈĝanie za instrukcjami podawanymi wb tle relaksujÈcej muzyki.

Nie tylko obserwowaïam reakcjÚ, ale takĝe poprosiïam ich ob ocenÚ swojego stanu za pomocÈ wyboru jednej zb 6 odpowiedzi.

Oprócz opcji oznaczajÈcych caïkowity lub czÚĂciowy sukces wbwykonaniu tego zada- nia – zgodnie zbmoim oczekiwaniami – 8%

wybraïo odpowiedě „nie miaïem ochoty siÚ relaksowaÊ, wiÚc nie próbowaïem”, ab 9%

wykazaïo efekt kontrastu stwierdzajÈc:

„próba relaksacji wywoïaïa mojÈ irytacjÚ”.

Wariancja odpowiedzi umysïu jest duĝo wiÚksza niĝ wariancja biologicznej odpo- wiedzi organizmu (podanie leków usypia- jÈcych nie wywoïaïoby efektu kontrastu).

(5)

Oznacza to, ĝe modele nieuwzglÚdniajÈce róĝnic indywidualnych ibkontekstu sytuacyj- nego nie mogÈ wyjaĂniaÊ wiele wariancji analizowanych zmiennych. KoncentrujÈc siÚ wb naszych analizach statystycznych na miarach tendencji centralnej, nie dostrze- gamy czÚsto efektów kontrastu.

Nasze osoby badane sÈ zdolne nie tylko do odmowy uczestniczenia wbbadaniu, ale – co zdarza siÚ czÚsto – mogÈ staraÊ siÚ wpïy- nÈÊ na wyniki pomiaru. W przeciwieñstwie do obiektów badañ fizyków czy chemików sÈ teĝ obdarzone, niestety, pamiÚciÈ.

Zadawanie tego samego pytania wielo- krotnie jest ěródïem problemów interpre- tacyjnych, poniewaĝ kolejne pomiary nie sÈ od siebie niezaleĝne. Z tego powodu przewaĝajÈca wiÚkszoĂÊ badañ ekspery- mentalnych ib korelacyjnych koncentruje siÚ na pojedynczym punkcie czasowym.

Uniemoĝliwia to uchwycenie dynamiki zjawisk. Nawet jeĂli wykaĝemy pozytywny wpïyw wypicia filiĝanki kawy na wynik testu, nie bÚdziemy wiedzieÊ, co zdarzy siÚ kilka godzin póěniej, kiedy osoby badane opuszczÈ juĝ laboratorium. Jeĝeli nawet warunki Ărodowiskowe pozostanÈ bez zmian, samo powtórzenie dziaïania boděca moĝe zmieniÊ reakcjÚ badanego. Zmiany tego typu sÈ opisywane wbkontekĂcie trzech efektów: ekspozycji, habituacji ib przesytu.

Efekt ekspozycji polega na tym, ĝe obiekty poczÈtkowo neutralne sÈ lepiej oceniane po wiÚkszej liczbie ekspozycji. StÈd bierze siÚ dÈĝenie polityków do czÚstego wystÚ- powania wb mediach. ZapominajÈ jednak przy tym, ĝe jeĝeli poczÈtkowa reakcja byïa negatywna, kolejne ekspozycje jedynie wzmocniÈ siïÚ negatywnej reakcji. Jeĝeli zapytamy drugi czy trzeci raz, co respondent sÈdzi obtatuaĝach, ryzykujemy, iĝ nawet jeĂli poczÈtkowa ocena byïa neutralna, moĝemy otrzymywaÊ coraz bardziej pozytywne oceny przy kolejnych pomiarach. Jeĝeli eks- perymentalnie zbadamy wpïyw pochwaï od przeïoĝonych na motywacjÚ do pracy, nie uda nam siÚ uchwyciÊ wpïywu drugiej, trze- ciej czy piÚtnastej pochwaïy. Psychologia pokazuje, ĝe kaĝda nastÚpna pochwaïa ma niĝszÈ wartoĂÊ nagradzajÈcÈ – przy zacho- waniu innych staïych warunków. Emocje pozytywne zwykle blednÈ przy czÚstym kontakcie zbobiektem, który je wywoïuje – szybko przyzwyczajamy siÚ do dobrego. To zjawisko nazywane jest habituacjÈ hedo- nistycznÈ. Nawet najcenniejsza pochwaïa traci swojÈ wartoĂÊ, kiedy sïyszymy jÈ zbyt

czÚsto. W pewnym momencie nastÚpuje nasycenie, ab nastÚpnie przesyt. To, co na poczÈtku nas fascynowaïo, zaczyna iryto- waÊ. Chociaĝ wiadomo, ĝe wiele interesu- jÈcych zjawisk, jak motywacja czy szczÚĂcie, ma dynamikÚ podobnÈ do fal, nie jeste- Ămy wb stanie mierzyÊ tej dynamiki, ob ile nie potrafimy utrzymywaÊ naszych bada- nych wb nieĂwiadomoĂci procesu pomiaru.

Na szczÚĂcie, rozwój technologii przynosi powoli zmiany wbtym obszarze ibumoĝliwia nowe sposoby pomiaru.

W naukach fizycznych czy ekonomicz- nych przedmiotem pomiaru sÈ byty realne (rzeczywiste wielkoĂci, np. dïugoĂÊ poïo- ĝonych linii Ăwiatïowodu). Jest ustalony wzorzec, np. metra, ib moĝemy obliczyÊ, jak dobrze nasz pomiar odpowiada wzor- cowi. W naukach spoïecznych przedmio- tem pomiaru sÈ byty wirtualne (konstrukty teoretyczne, np. reprezentacje poznawcze, postawy, cechy, stany afektywne). Istnieje podstawowa róĝnica miÚdzy pomiarem wielkoĂci fizycznych abpomiarem konstruk- tów teoretycznych. Modele pomiarowe wypracowane wb naukach fizycznych nie przystajÈ wb peïni do pomiaru wb naukach spoïecznych. Nie mamy wzorca postawy, inteligencji…, zbktórym moglibyĂmy wyniki naszego pomiaru porównaÊ. Ekonomi- sta jest zainteresowany iloĂciÈ pieniÚdzy dostÚpnych na rynku – wiÚc bÚdzie staraï siÚ mierzyÊ obiektywnÈ wielkoĂÊ zarobków.

Wbbadaniach spoïecznych, nawet jeĂli pro- simy obpodanie wielkoĂci zarobków wbzïo- tych, to tak naprawdÚ interesujemy siÚ reprezentacjÈ poznawczÈ zarobków wbumy- Ăle respondenta. Dlatego nie traktujemy tak powaĝnie, jak wbnaukach fizycznych, orygi- nalnej jednostki pomiaru, dokonujÈc czÚsto przeksztaïceñ powodujÈcych jej zmianÚ, np.

logarytmizowanie zarobków na skali ilora- zowej dla zmniejszenia skoĂnoĂci rozkïadu.

RygoryĂci metodologiczni twierdzÈ teĝ, ĝe skale szacunkowe (ang. rating scales), np.

wbpytaniu obpoczucie szczÚĂcia, nie sÈ ska- lami iloĂciowymi, poniewaĝ nie majÈ staïej jednostki pomiaru: np. odlegïoĂÊ odpowie- dzi 3 = raczej szczÚĂliwy od 4 = szczÚĂliwy ib od 2 = raczej nieszczÚĂliwy nie jest taka sama, choÊ wynosi 1 punkt na skali. Ci sami badacze zapominajÈ jednak obwymaganiach staïoĂci jednostki pomiaru, liczÈc ĂredniÈ zbocen szkolnych. Nie ma ĝadnego dowodu na to, ĝe róĝnice miÚdzy ocenÈ dobrÈ ib bardzo dobrÈ oraz dostatecznÈ sÈ takie same. Niedoskonaïe narzÚdzia, jakimi sÈ

(6)

skale szacunkowe, sprawiajÈ nam kïopot, ale sÈ lepsze niĝ brak narzÚdzi, tak jak kiepska maszyna do szycia jest lepsza niĝ szycie garnituru rÚcznie (Gilbert, 2007).

JeĂli zdajemy sobie sprawÚ zb niedoskona- ïoĂci naszego pomiaru, to moĝemy doko- nywaÊ odpowiednich korekt. Wyniki analiz mogÈ byÊ znieksztaïcone, jeĂli zb powodu braku speïnienia zaïoĝeñ nie moĝemy byÊ pewni, ĝe wyliczona przez nas statystyka ma wymagany rozkïad. Waĝniejsze jest, aby we wszystkich porównywanych badaniach znieksztaïcenie zwiÈzane np. zbtypem skali byïo takie samo. JeĂli wszyscy stosujÈ testy parametryczne, to uĝycie przez nas testu nieparametrycznego – choÊ zgodne zbzasa- dami – uniemoĝliwi porównanie wyników uzyskiwanych wb róĝnych laboratoriach.

Abjuĝ kuriozalne wydaje nam siÚ uĝywanie nieparametrycznych testów istotnoĂci róĝ- nicy Ărednich, wbsytuacji, gdy te same dane chwilÚ póěniej wykorzystujemy do modelo- wania strukturalnego.

Dobrze znane powiedzenie Gordona Allporta: „Jeĝeli chcemy wiedzieÊ, jak ludzie siÚ czujÈ – dlaczego ich ob to nie zapytamy?” zapoczÈtkowaïo wysyp samo- opisowych technik pomiaru najróĝniejszych cech. TworzÈc róĝne narzÚdzia bazujÈce na samoopisie, zapominamy, ĝe wbseriach badañ pokazano (por. przykïady wb Aron- son ibWieczorkowska, 2001), ĝe czÚsto jeste- Ămy nieĂwiadomi wpïywów, jakim podle- gamy, co jednak nie powstrzymuje nas od przekonania, ĝe potrafimy trafnie wskazaÊ przyczyny naszych myĂli, uczuÊ ibzachowañ.

Samoopisy odwoïujÈ siÚ do wiedzy ob Ja.

Dla niektórych osób odpowiedzi na pytania kwestionariuszy sÈ wynikiem przemyĂleñ, inni nigdy na ten temat nie myĂleli, wiÚc ich odpowiedzi powstajÈ online. Jeden zbmoich znajomych ma wpisany wb dowodzie kolor oczu: piwny. Gdy wyraziïam (GW) zdzi- wienie (ma oczy szaro-niebieskie) odpo- wiedziaï – „kazali wpisaÊ, spojrzaïem do lustra ibpomyĂlaïem, ĝe sÈ piwne”. Róĝnimy siÚ zarówno zdolnoĂciÈ, jak ib skïonnoĂciÈ (chÚciÈ wykorzystania tej zdolnoĂci) do autorefleksji (uczynienia siebie obiektem poznania) ib te róĝnice wpïywajÈ na traf- noĂÊ pomiaru. Moĝemy przeĝyÊ caïe ĝycie bez wglÈdu wb mechanizmy leĝÈce u pod- staw naszych zachowañ. PrzyglÈdanie siÚ sobie zb punktu widzenia niezaangaĝowa- nego obserwatora dla wielu zb nas wydaje siÚ, niestety, zadaniem sztucznym ibzupeï- nie niepotrzebnym. W efekcie nie jeste-

Ămy Ăwiadomi mechanizmów obronnych, jakie znieksztaïcajÈ nasz obraz Ja. Innych spostrzegamy duĝo trafniej (por. Wie- czorkowska-Wierzbiñska, 2011). Poĝytek zbanalizy samoopisów zaleĝy od wielu czyn- ników. Odpowiedzi mogÈ byÊ relatywnie bardziej wiarygodne, jeĂli pytania odwoïujÈ siÚ do postaw jawnych2, ab diagnozowana osoba nie jest zainteresowana robieniem dobrego wraĝenia, jest zmotywowana do uzyskania wglÈdu wb swoje predyspozycje ibma skïonnoĂÊ do samoobserwacji ibauto- refleksji. Osoby poddajÈce siÚ diagnozie – dokonujÈc czÚsto kreacji swojego wize- runku – prezentujÈ siÚ wbtaki sposób, aby chroniÊ samoocenÚ ibspeïniÊ spostrzegane oczekiwania pracodawcy. Jeden zb moich znajomych aplikujÈcych ob stanowisko dyrektora chwaliï siÚ tym, jak dobre uzy- skaï wyniki wbzakresie odpornoĂci na stres (konkurs wygraï, wiÚc uzyskaï swobodny dostÚp do materiaïów rekrutacyjnych).

Obydwoje wiedzieliĂmy, ĝe ze stresem radzi sobie kiepsko, ale jako inteligentny czïo- wiek wiedziaï, jak odpowiadaÊ na pytania kwestionariusza.

Odpowiedě na pojedyncze pytanie ma duĝy bïÈd pomiaru – dlatego wbfizyce, che- mii czy biologii dokonuje siÚ wielu powtó- rzeñ pomiaru. Niestety, jest to zabieg moĝliwy wb badaniu bytów nieoĝywionych – abdokïadniej – dowolnych pozbawionych pamiÚci ibwolnej woli. Ludzie pamiÚtajÈ, ĝe przed chwilÈ byli obcoĂ pytani ibpowtarza- nie pytañ wywoïa ich irytacjÚ. Od ankie- tera zadajÈcego pytania oczekujemy prze- strzegania opisanych przez Paula Grice’a (1977) zasad komunikacji kooperatywnej.

Dlatego zamiast zadawaÊ wielokrotnie to samo pytanie, pytamy ob róĝne powiÈzane kwestie. Nawet przy wypeïnianiu doku- mentów czy podañ wburzÚdach pada czÚsto pytanie obwiek lub datÚ urodzenia, abzaraz potem ob numer PESEL – który przecieĝ zawiera juĝ te dane. Przy tworzeniu wskaě- nika syntetycznego, np. poprzez sumowanie lub uĂrednianie odpowiedzi na kilka–kilka- naĂcie pytañ dotyczÈcych pewnego zjawiska lub cechy, najczÚĂciej dokonujemy dodat- kowo weryfikacji jakoĂci takiego wskaěnika, poprzez policzenie alfy Cronbacha. Jest to najpopularniejsza miara rzetelnoĂci (jedno- rodnoĂci) wskaěnika syntetycznego, która pozwala na okreĂlenie spójnoĂci pozycji wchodzÈcych wbjego skïad.

Przykïadem moĝe byÊ bardzo popu- larny kwestionariusz oparty na PiÚcio-

(7)

czynnikowym Modelu OsobowoĂci (Costa ibMcCrae, za: Siuta, 2006), który powstaï na bazie badañ leksykalnych. Skrócona wersja NEO_FFI (NEO-Five Factor Inventory) skïada siÚ zb60 pytañ3, pozwalajÈcych opisaÊ respondenta na 5 wymiarach: neurotyczno- Ăci, ekstrawersji, otwartoĂci na doĂwiadcze- nie, ugodowoĂci ibsumiennoĂci, dla których alfa Cronbacha dla ponad 1000-osobowej grupy studentów wyniosïa odpowiednio 0,842; 0,704; 0,69; 0,807; 0,712. ¿adna zb tych 12-itemowych skal nie jest jedno- czynnikowa. Ekstrawersja, otwartoĂÊ na doĂwiadczenie wykazujÈ aĝ 4 czynniki. Nie dziwi to, gdy przyjrzymy siÚ treĂci pytañ.

Przykïadowo, aby uzyskaÊ maksymalny wynik, np. wb skali otwartoĂci na doĂwiad- czenie, trzeba siÚ zgodziÊ zb5 itemami ibnie zgodziÊ zbpozostaïymi.

Tabela 1. Pytania zbkwestionariusza NEO_FFI Pytania wbskali otwartoĂci na

doĂwiadczenie NEO_FFI 1. Rzadko dostrzegam nastroje lub uczucia

pïynÈce zbotoczenia

2. Uwaĝam, ĝe pozwalanie uczniom na sïu- chanie kontrowersyjnych poglÈdów moĝe im zamieszaÊ wb gïowach ib wprowadziÊ wbbïÈd

3. SÈdzÚ, ĝe powinniĂmy siÚ odwoïywaÊ do autorytetów religijnych przy podejmowa- niu decyzji wbsprawach moralnoĂci 4. Maïo interesuje mnie dociekanie natury

wszechĂwiata ibnatury ludzkiej 5. Mam duĝe potrzeby intelektualne 6. CzÚsto sprawia mi duĝÈ przyjemnoĂÊ zaj-

mowanie siÚ teoretycznymi rozwaĝaniami lub abstrakcyjnymi problemami

7. IntrygujÈ mnie formy, które odkrywam wbsztuce ibnaturze

8. Poezja dziaïa na mnie sïabo albo wcale 9. Czasami, gdy czytam poezjÚ lub dzieïo

sztuki, czujÚ „dreszczyk emocji” ib falÚ podniecenia

10. Gdy raz znajdÚ wïaĂciwy sposób na robie- nie czegoĂ, trzymam siÚ go

11. Nie lubiÚ traciÊ czasu na marzenia 12. CzÚsto próbujÚ nowych ib egzotycznych

potraw

Odmienne procesy poznawcze urucha- miane przy zgodzie ibzaprzeczaniu (por. np.

badania nad asymetriÈ Wanke ib Schwarz, 1995) bardzo czÚsto powodujÈ, ĝe itemy pozytywne (wymagajÈce zgody) ib nega- tywne (wymagajÈce zaprzeczenia) wb ana- lizie czynnikowej sÈ separowane wbosobne czynniki. NajwiÚkszym problemem jest jednak niejednorodnoĂÊ konstruktów teo- retycznych. W otwartoĂci na doĂwiadczenie (zob. tabela 1) aĝ ¼ pytañ dotyczy zain- teresowania sztukÈ/poezjÈ. W sumiennoĂci zawarta jest zarówno potrzeba osiÈgniÚÊ, odpowiedzialnoĂÊ, jak ib pedantycznoĂÊ.

Ta niejednorodnoĂÊ utrudnia wyobraĝenie sobie osoby, która uzyskaïa wysoki/niski wynik na skali. Na ten problem zwracaï juĝ uwagÚ Allport (1937 za: Szarota, 2008), twierdzÈc, ĝe uzyskane wb analizie czyn- niki stanowiÈ wymiary osobowoĂci uĂred- nionej, która jest caïkowitÈ abstrakcjÈ, nieprzydatnÈ dla psychologa pragnÈcego badaÊ osobowoĂci konkretnych osób. Na pewno warto podkreĂliÊ, ĝe mierzÈc wbten sposób wïasnoĂci osoby rozrywamy zwiÈ- zek zb poziomem obserwacji zachowañ, analizujÈc statystyczne abstrakty. Fetyszy- zacja alfy Cronbacha jako miary wartoĂci psychometrycznej wskaěnika sprawiïa, ĝe zapominamy, iĝ bardzo ïatwym sposo- bem uzyskania wysoce jednorodnej skali, obwysokim wspóïczynniku rzetelnoĂci alfa, jest zadanie kilku pytañ ob to samo, sfor- muïowanych wbróĝny sposób. Nie gwaran- tuje to jednak wb ĝaden sposób trafnoĂci takiego wskaěnika. Czasami powinniĂmy zoperacjonalizowaÊ konstrukt teoretyczny za pomocÈ pytañ ob szereg niezaleĝnych przejawów interesujÈcej nas zmiennej. Szu- kajÈc wskaěnika ryzyka nadwagi, moĝemy pytaÊ ob czÚstoĂÊ jedzenia sïodyczy, picia piwa, jedzenie wbnocy. Wszystkie te aktyw- noĂci mogÈ prowadziÊ do nadwagi, wystÚ- pujÈc samodzielnie. Elementy wskaěnika syntetycznego nie muszÈ byÊ skorelowane, abyĂmy mogli je zliczaÊ lub uĂredniaÊ, gdy pytania dotyczyïy czÚstoĂci. Podobnie zbu- dowany zostaï przez Janusza Czapiñskiego (1996) syntetyczny wskaěnik aktywnoĂci ekonomicznej. Pytaï on respondentów ob8 moĝliwych przejawów zmiennej latentnej, m.in. ob to, czy inwestujÈ wb usïugi, han- del, akcje, podnoszÈ swoje kwalifikacje, wykazujÈ aktywnoĂÊ pozazawodowÈ, majÈ plany na przyszïoĂÊ itd. Jeĝeli respondent odpowiedziaï twierdzÈco na co najmniej dwa pytania zboĂmiu, byï przypisywany do

(8)

kategorii aktywnych ekonomicznie „lisów”.

Pozostali respondenci uznani zostali za bierne ekonomicznie „jeĝe”. Poszczególne pytania lub pozycje takiej szczególnej skali sÈ przejawami tej samej zmiennej latentnej, ale mogÈ wystÚpowaÊ zupeïnie niezaleĝnie od siebie. Na tych przykïadach widzimy, ĝe dla czÚĂci wskaěników syntetycznych ich elementy nie muszÈ byÊ ze sobÈ wysoko skorelowane, ab wb efekcie alfa Cronbacha dla takiego wskaěnika syntetycznego moĝe byÊ niska.

Nie naleĝy wiÚc – choÊ to siÚ powszech- nie czyni – utoĝsamiaÊ wielkoĂci alfy Cron- bacha zbjakoĂciÈ wskaěnika syntetycznego.

Nie sposób odpowiedzieÊ, jaka musi byÊ wartoĂÊ alfy Cronbacha, poniewaĝ nawet bardzo wysoka alfa nie gwarantuje ani jednowymiarowoĂci konstruktu, ani wyso- kiej trafnoĂci. Niestety przy ocenie jako- Ăci wskaěników syntetycznych zïoĝonych zbwielu pytañ zbyt czÚsto ograniczamy siÚ do walidacji rzetelnoĂci, nie zastanawiajÈc siÚ nad trafnoĂciÈ pomiaru.

Niestety moĝna sÈdziÊ, ĝe narzÚdzia psychometryczne oparte na samoopisie okazaïy siÚ wb nauce ĂlepÈ uliczkÈ, czego dowodem jest brak postÚpu wbpsychometrii wb ciÈgu ostatnich kilkudziesiÚciu lat, ale moĝemy powtórzyÊ po raz kolejny: niedo- skonaïe narzÚdzie pomiaru jest jednak lep- sze niĝ brak narzÚdzi (Gilbert, 2007). Nie- doskonaïoĂci pomiaru to problem, który dyskwalifikuje nasze wyniki tylko wówczas, kiedy ich nie dostrzegamy. Jeĝeli zdajemy sobie sprawÚ zbnieuniknionych znieksztaï- ceñ, którym podlegajÈ nasze samoopisy, moĝemy staraÊ siÚ obdokonanie odpowied- nich korekt.

5. SïaboĂÊ analiz

O ile badania eksperymentalne majÈ dobre iboczywiste standardy analizy, obtyle wbbadaniach korelacyjnych, jak to zauwaĝa coraz wiÚcej osób (np. Brzeziñski, 2012), publikujemy sporo wyników ob wÈtpliwej wartoĂci. Wybitny psycholog prof. Ro bert Nisbett ogïasza nawet The Crusade Against Multiple Regression Analysis (2016). Pro- blem wynika przede wszystkim zb niskiej trafnoĂci wewnÚtrznej bÚdÈcej immanentnÈ wïasnoĂciÈ badañ korelacyjnych ib przeja- wiajÈcej siÚ wbsplÈtaniu (confounding) wpïy- wów róĝnych zmiennych (por. przykïady wbtekĂcie Kuěmiñskiej, 2016). Wielozmien- nowe analizy danych korelacyjnych sÈ

koniecznoĂciÈ, bo wszystkiego eksperymen- talnie zbadaÊ siÚ nie da. Problem jednak tkwi wbich wraĝliwoĂci na trafnoĂÊ modelu.

Jak to powtarzamy do znudzenia studen- tom: „wspóïczynniki regresji zaleĝÈ od towarzystwa”. Tylko nierozumiejÈcy istoty tych analiz mogÈ stosowaÊ krokowÈ ana- lizÚ regresji (pozostawiajÈc decyzje mery- toryczne algorytmom statystycznym), pisaÊ zbpeïnym przekonaniem, ĝe analiza czynni- kowa, analiza skupieñ dowiodïa istnienia k czynników czy skupieñ. Zbyt czÚsto usu- niÚcie jednej zmiennej zmienia strukturÚ macierzy korelacji. Na studentach wielkie wraĝenie robi analiza przykïadu (Wieczor- kowska i Wierzbiñski, 2011), wb którym stwierdzajÈ na tych samych danych róĝne zaleĝnoĂci miÚdzy X ab Y wb zaleĝnoĂci od tego, które zmienne dodatkowe zostaïy kontrolowane. OczywiĂcie tam, gdzie jest jasna teoria, lista zmiennych jest wyzna- czona jednoznacznie. W analizach danych sondaĝowych na próbach reprezentatyw- nych, gdy kontrolowanie zmiennych socjo- demograficznych jest koniecznoĂciÈ czÚsto zapomina siÚ obwprowadzaniu do modelu efektów interakcyjnych. Przykïadowo, sprawdzajÈc socjodemograficzne predyk- tory poziomu wyksztaïcenia (operacjona- lizowanego przez lata nauki) stwierdzimy brak istotnego zwiÈzku zbpïciÈ, bo istotnym predyktorem jest interakcja wieku ib pïci.

Przewaga edukacyjna starszych mÚĝczyzn zamienia siÚ wbprzewagÚ mïodszych kobiet, dlatego efekt gïówny pïci nie jest istotny.

PodobnÈ zaleĝnoĂÊ stwierdzono wb14 zbana- lizowanych 33 krajów (Wierzbiñski, 2009).

Ale to wymagaïo wprowadzenia do modelu regresyjnego efektów interakcyjnych, czego czÚsto badacze nie robiÈ.

PrawdÈ jest jednak, ĝe wielu zagad- nieñ nie da siÚ zbadaÊ eksperymentalnie ibpowinniĂmy bardzo intensywnie pracowaÊ nad nowym modelem analizy badañ kore- lacyjnych. Zadanie jest to tym waĝniejsze, ĝe istniejÈ ogromne zbiory ogólnodostÚp- nych badañ prób reprezentatywnych zgro- madzonych olbrzymim nakïadem kosztów ib wb niewielkim stopniu wykorzystywanych poznawczo.

O ile testy istotnoĂci (oparte przecieĝ na przedziaïach ufnoĂci) biorÈ poprawkÚ na wielkoĂÊ próby, o tyle sama wartoĂÊ wspóïczynnika determinacji wielkoĂci próby nie uwzglÚdnia. Dla ilustracji pro- simy studentów, aby losowali zbcaïej próby PGSS (N = 15776) podpróby ob wielkoĂci

(9)

1% (okoïo 150 osób), 2% itd. MogÈ siÚ wtedy przekonaÊ, ĝe wbmaïych 150-osobo- wych próbach moĝna uzyskaÊ duĝo wiÚk- sze (ale takĝe ib mniejsze) wspóïczynniki determinacji, niĝ by to wynikaïo zb zaleĝ- noĂci wb„populacji”. Pokazuje to, ĝe nasze zaufanie do statystyki zwiÚksza siÚ wraz ze wzrostem liczebnoĂci próby, wiÚc próba nie moĝe byÊ zbyt duĝa, choÊ sÈdzimy, ĝe duĝe próby najlepiej wykorzystywaÊ do boot- strapowej (np. Davison i Hinkley, 1997) metody analizy, abnie testowania prostych zaleĝnoĂci. Nie wiemy, dlaczego nie jest stosowane zalecenie, aby równanie regre- sji ustalaÊ na poïowie dostÚpnych danych, abtestowaÊ je na reszcie (Pedhazur, 1997).

Potrzebujemy nowych modeli testowania wielkich zbiorów danych. W naszej ocenie moda na modelowanie strukturalne przy- nosi jak dotÈd wiÚcej szkody niĝ poĝytku, poniewaĝ owocuje wieloma publikacjami niewiele wnoszÈcymi do naszej wiedzy:

zawsze moĝna jakiĂ model do danych dopasowaÊ, abumysï badacza zawsze potrafi dopasowaÊ do danych nowÈ teoriÚ. Rygory- sta metodologiczny Wiliam Starbuck (2016, s. 171) wbswoim bardzo interesujÈcym eseju (choÊ nie ze wszystkimi jego postulatami siÚ zgadzamy) piÚtnuje dwie powszechnie wystÚpujÈce (niestety) praktyki zwiÚksza- jÈce szansÚ powodzenia wbbadaniach:

• HARKersi (Hypothesizing After Results are Known) najpierw zbierajÈ dane, wykonujÈ analizy statystyczne, potem formuïujÈ hipotezy, abna koniec wyszu- kujÈ teorie ibwczeĂniejsze badania, które wspierajÈ lub przeczÈ nowo wymyĂlonym hipotezom.

• P-hakerzy wykorzystujÈ wiele obliczeñ ib manipulacji danymi wb poszukiwaniu równania lub systemu klasyfikacji, który uchwyci silne wzorce.

Innym problemem jest bezrefleksyjne porównywanie procentu wyjaĂnionej zmiennoĂci wb analizach wskaěników jed- nostkowych (opisujÈcych respondenta) ib grupowych (opisujÈcych obiekty zïoĝone np. kraj). Przykïad: wb miÚdzynarodowym sondaĝu European Social Survey respon- denci na pytanie „How happy are you?”

odpowiadajÈ na 11-stopniowej skali. O ile rozkïad wskaěnika jednostkowego szczÚĂcia jest zbliĝony do normalnego, o tyle roz- kïad wskaěnika grupowego (Ărednia dla kraju) jest jednostajny – nie ma dwóch kra- jów ob tej samej Ăredniej (Wieczorkowska, Wierzbiñski i Król, 2015). O ile wskaěnik

jednostkowy moĝna uznaÊ za zmiennÈ dyskretnÈ, o tyle wskaěnik grupowy jest zmiennÈ ciÈgïÈ. W konsekwencji inne wyniki uzyskamy, testujÈc tÚ samÈ hipotezÚ dotyczÈcÈ np. zwiÈzku stopnia prawicowo- Ăci–lewicowoĂci poglÈdów politycznych zbpoczuciem szczÚĂcia (Napier ibJost, 2008) za pomocÈ grupowych vs jednostkowych wskaěników szczÚĂcia. Procent wyjaĂnionej wariancji jest nieporównanie mniejszy, gdy analizujemy wskaěniki jednostkowe niĝ gru- powe. Nie moĝe wiÚc dziwiÊ, ĝe ekonomi- Ăci, analizujÈc gïównie wskaěniki grupowe, uzyskujÈ wyĝsze procenty dopasowania swoich modeli niĝ analizujÈcy wskaěniki jednostkowe badacze spoïeczni.

6. Podsumowanie: nieuzasadnione zarzuty recenzentów

Stosowanie metod iloĂciowych wb na - ukach ob zarzÈdzaniu wiÈĝe siÚ czÚsto zb przyjmowaniem szkodliwych zaïoĝeñ, które owocujÈ czÚsto bezzasadnymi zarzu- tami metodologicznymi dotyczÈcymi naj- czÚĂciej: (1) braku reprezentatywnoĂci próby, (2) braku hipotez. Zapomina siÚ przy tym, ĝe próby reprezentatywne sÈ konieczne, jeĝeli celem badacza jest esty- macja rozkïadów zmiennych wb popula- cji – np. gdy chcemy przewidzieÊ wyniki wyborów (ale ibtu powinniĂmy szukaÊ próby reprezentatywnej dla tych, którzy „chodzÈ”

gïosowaÊ, abnie tych, którzy sÈ uprawnieni do gïosowania). ’atwo jest zbadaÊ próbÚ reprezentatywnÈ przedmiotów nieoĝywio- nych, np. wyprodukowanych ĂrubokrÚtów, bo one nie mogÈ odmówiÊ udziaïu wbbada- niach. Gdy obiektem sÈ ludzie, moĝemy wylosowaÊ próbÚ speïniajÈcÈ kryteria, ale nie moĝemy zagwarantowaÊ, ĝe wyloso- wane osoby zechcÈ wziÈÊ udziaï wb bada- niu. Stopieñ realizacji próby wb badaniach sondaĝowych spadï wbciÈgu ostatnich dzie- siÚcioleci dwukrotnie. Co gorsza, mamy do czynienia ze zjawiskiem faïszywych respondentów – którzy godzÈc siÚ na udziaï wb badaniach, udzielajÈ odpowiedzi loso- wych. Dlatego nie ma nic zïego wbtym, ĝe do testowania hipotez wbwiÚkszoĂci badañ uĝywa siÚ prób ïatwo dostÚpnych (conve- nience). Miïo byïoby móc wykazaÊ trafnoĂÊ zewnÚtrznÈ (moĝliwoĂÊ generalizacji na populacjÚ) uzyskanych wyników, ale duĝo waĝniejsza jest trafnoĂÊ wewnÚtrzna (naj- pierw trzeba mieÊ co generalizowaÊ), którÈ moĝna zwiÚkszaÊ za pomocÈ randomizacji

(10)

II stopnia prób ïatwo dostÚpnych. Drugi zarzut bierze siÚ zbfaïszywego przekonania, ĝe praca naukowa musi byÊ zawsze prowa- dzona wbmodelu dedukcyjnym, co wbszcze- gólnoĂci wb zarzÈdzaniu nie jest prawdÈ.

Niektóre prace wb naukach ob zarzÈdzaniu stanowiÈ próbÚ syntezy wiedzy, tworzenie modelu, który nie jest poddawany testom empirycznym. Dopisywanie wtedy hipotez nie ma ĝadnego uzasadnienia (dopisy- wane na „siïÚ” czÚsto majÈ postaÊ kaba- retowÈ). Warto jednak pamiÚtaÊ, ĝe jeĂli nie testujemy eksperymentalnie zestawu hipotez, tylko zbieramy dane wb celach eksploracyjnych, to naleĝy „mÚczyÊ je tak dïugo, aĝ zacznÈ zeznawaÊ”. Inaczej szkoda nakïadów poniesionych na prowadzenie badañ.

Przypisy

1 Artykuï jest efektem wielogodzinnych dyskusji trójki autorów, której podsumowanie wbangiel- skiej wersji zostaïo opublikowane przez dwójkÚ pierwszych autorów wbProblemach ZarzÈdzania, 2016, tom 2.

2 Na nasze odpowiedzi wpïywajÈ takĝe poza- werbalne zapisy doĂwiadczenia (poïÈczenia tworzone wbwyniku rejestracji czÚstoĂci wspóï- wystÚpowanie boděców wb otoczeniu). Do tych zapisów nasza ĂwiadomoĂÊ mam duĝo gorszy dostÚp niĝ do zapisów informacji werbalnych (w tym naszych przemyĂleñ). Te drugie sÈ podïo- ĝem do tworzenia siÚ postaw jawnych, te pierw- sze postaw ukrytych.

3 Oryginalna wersja zawierajÈca 240 pytañ skïa- daïa siÚ zb trzydziestu czynników pierwszego rzÚdu, pogrupowanych po 6 wb5 czynników dru- giego rzÚdu. Powszechnie uĝywana jest jednak jej skrócona wersja.

Bibliografia

Allport, G.W. (1937). Personality: A psychological interpretation. New York: Holt.

Aronson, E. ibWieczorkowska, G. (2001). Kontrola naszych myĂli ibuczuÊ. Rozdziaï 4. Jak moĝemy zdo- byÊ odpowiedě na nurtujÈce nas pytania? Warszawa:

Santorski.

Brzeziñski, J.M. (2012). Co to znaczy, ĝe wyniki przeprowadzonych przez psychologów badañ naukowych poddawane sÈ analizie statystycznej?

Roczniki Psychologiczne, 15(3), 7–40.

Costa, P.T., McCrae, R.R. (1992). Revised NEO Personality Inventory (NEO-PI-R) and NEO Five- -Factor Inventory (NEO-FFI) professional manual.

Odessa, FL: Psychological Assessment Resourses.

Czapiñski, J. (1996). Uziemienie polskiej duszy.

W: M. Marody i E. Gucwa-LeĂny (red.), Podstawy ĝycia spoïecznego wbPolsce (s. 252–275). Warszawa:

Wydawnictwo Instytutu Studiów Spoïecznych Uni- wersytetu Warszawskiego.

Davison, A.C. ib Hinkley, D.V. (1997). Bootstrap methods and their application. Cambridge Series in Statistical and Probabilistic Mathematics. New York:

Cambridge University Press.

ESS Round 7: European Social Survey Round 7 Data (2014). Data file edition 2.0. NSD – Norwe- gian Centre for Research Data, Norway – Data Archive and distributor of ESS data for ESS ERIC.

Gilbert, D.T., Tafarodi, R.W. ibMalone, P.S. (1993).

You can’t not believe everything you read. Journal of Personality and Social Psychology, 65, 221–233.

Gilbert, D. (2007). Stumbling on Happiness. New York, NY: Vintage Books.

Grice, P. (1977). Logika ib konwersacja. PrzeglÈd Humanistyczny, 6.

Grudzewski, W.M. i Hejduk, I.K. (2004). ZarzÈ- dzanie wiedzÈ wb przedsiÚbiorstwach. Warszawa:

DifinbS.A.

Milgram, S. (1963).b Behavioral study of obedi- ence. Journal of Abnormal and Social Psychology, 67, 371–378.

Napier, J.L. ibJost, J.T. (2008). Why are conserva- tives happier than liberals? Psychological Science, 19(6), 565–572.

Nisbett, R. (2016). The Crusade Against Multiple Regression Analysis. Pobrano zb https://www.edge.

org/conversation/richard_nisbett-the-crusade- against-multiple-regression-analysis

Pedhazur, E.J. (1997). Multiple regression in behav- ioral research. Belmont: Wadsworth Publishing.

Piliavin, I.M., Rodin, J. ibPiliavin, J. (1969). Good Samaritanism: an underground phenomenon?

Journal of Personality and Social Psychology, 13(4), 289–299.

Siarkiewicz, M. (2007). Zastosowanie metody analizy szeregów czasowych do badania zaleĝno- Ăci pomiÚdzy skïadem posiïków ab subiektywnie odczuwanym poziomem energii. W: K. Winkow- ska-Nowak, A. Nowak i A. Rychwalska (red.), Modelowanie matematyczne ib symulacje kompute- rowe wbnaukach spoïecznych (s. 15–20). Warszawa:

Wydawnictwo Academica SWPS.

Siuta, J. (2006). Inwentarz Osobowo ci NEO-PI- R Paula T. Costy ib Roberta R. McCrae. Adaptacja polska. PodrÚcznik. Warszawa: Pracownia Testów Psychologicznych.

Starbuck, W.H. (2016). 60th Anniversary Essay:

How Journals Could Improve Research Practices in Social Science. Administrative Science Quarterly, 2, 165–183, http://10.1177/0001839216629644 asq.

sagepub.com

(11)

Szarota, P. (2008).b Wielka PiÈtka – stare pro- blemy, nowe wÈtpliwoĂci.bRoczniki Psychologiczne, 11(1),b127–138.

Taleb, N. (2012). Antifragile: Things That Gain from Disorder. New York: Random House.

Thorngate, W. ibChunyun, M. (2016). Wiggles and curves: The analysis of ordinal patterns. Problemy ZarzÈdzania, 2.

Turska, E. (2014). Kapitaï kariery ludzi mïodych.

Uwarunkowania ibkonsekwencje. Katowice: Wydaw- nictwo Uniwersytetu ¥lÈskiego.

Van Bavel, J.J., Mende-Siedlecki, P., Brady, W.J ib Reinero, D.A. (2016). Contextual sensitivity in sci- entific reproducibility. Proceedings of the National Academy of Sciences. Social Sciences – PNAS, 23 6454–6459, http//:dx.doi.org/10.1073/pnas.1521897113 Wänke, M., Schwarz, N. ib Noelle-Neumann, E.

(1995). Asking comparative questions: The impact of the direction of comparison. Public Opinion Quarterly, 59, 347–372.

Wierzbiñski, J. (2009). Badanie zaufania do orga- nizacji: problemy metodologiczne. Warszawa:

Wydawnictwo Naukowe Wydziaïu ZarzÈdza- nia UW.

Wieczorkowska-Wierzbiñska, G. (2011). Psycho- logiczne ograniczenia. Warszawa: Wydawnictwo Naukowe Wydziaïu ZarzÈdzania UW.

Wieczorkowska-Wierzbiñska, G. (2012). ZrozumieÊ dane ibstaraÊ siÚ rozwiÈzaÊ problem. Roczniki Psy- chologiczne, 3.

Wieczorkowska, G. ibWierzbiñski, J. (2011). Staty- styka: od teorii do praktyki. Warszawa: Wydawnictwo Naukowe Scholar.

Wieczorkowska, G., Wierzbiñski, J. ib Król, G.

(2015). Metody iloĂciowe. W: Metody badawcze wbzarzÈdzaniu humanistycznym. Warszawa: Wydaw- nictwo Akademickie Sedno.

Wieczorkowska-Wierzbiñska, G., Król, G. ibWierz- biñski, J. (2015). PrzeszïoĂÊ, teraěniejszoĂÊ ibprzy- szïoĂÊ edukacji akademickiej. W: Gospodarka na rozdroĝu – XXI wiek. Warszawa: Wyd. Naukowe Wydziaïu ZarzÈdzania UW.

Zimbardo, P.G. ib Gerrig, R.J. (2012). Psychologia ibĝycie. Warszawa: Wydawnictwo Naukowe PWN.

Cytaty

Powiązane dokumenty

Jakiś zdesperowany lekarz z końca łańcucha pokarmowego (bo w złym łóżku się urodził bądź do złego łóżka się położył), nie widząc możliwości rozwoju i godnego

Metodologicznie chybiony jest pogląd, jakoby nauka powstawała tak, iż najpierw wskazuje się przedmiot zamie- rzonego badania, niczym pole do uprawy; potem szuka się stosownej

Pierwsze stress testy zostaáy przeprowadzone w bankach amerykaĔskich oraz europejskich w 2010 r. W USA wyniki testów zostaáy podane do publicznej wiadomo- Ğci i uznano to za

VIII Oddziaływania bardzo wielu ciał Elementy fizyki statystycznej..

Z wczeĂniejszych badañ przeprowadzonych przez autora wynika jednak, ĝe dzielnica ta odznacza siÚ pewnÈ specyfikÈ, która sprawia, ĝe zb punktu widzenia analiz

Istotnie, gdyby dla którejś z nich istniał taki dowód (powiedzmy dla X), to po wykonaniu Y Aldona nie mogłaby udawać przed Bogumiłem, że uczyniła X (gdyż wówczas Bogumił wie,

- dopóki nie mamy właściwej skali trudno jest usunać obserwacje odstające - może we właściwej skali te dane się symetryzują. - do chunka można dodać opcję warning=FALSE

Tolerancja jest logicznym następstwem przyjętego stanowiska normatywnego, jeśli to stanowisko obejmuje jedno z poniższych przekonań: (1) co najmniej dwa systemy wartości