Pomiar umiejętności z wykorzystaniem rankingu szachowego uzyskanego w trakcie

Rozdział IV Metoda pomiaru umiejętności w kontekście oceny stanu kapitału intelektualnego

4.2 Pomiar umiejętności z wykorzystaniem rankingu szachowego uzyskanego w trakcie

W wielu grach logicznych z udziałem dwóch przeciwników stosowane są rankingi umożliwiające ocenę ich siły gry. W szachach ranking taki stworzył amerykański fizyk węgierskiego pochodzenia Arpad Elo.¹²¹ Próba oceny siły gry szachisty jest trudna, gdyż gra w szachy nie została, jak dotąd, złamana, tzn. nie wiadomo, jak mogłaby wyglądać doskonała partia.

W związku z czym nie istnieją metody bezwzględnej oceny wartości poszczególnych posunięć.

Możliwe jest porównanie poziomu dwóch szachistów uwzględniając wynik partii jaki zostanie uzyskany w ich bezpośrednim pojedynku. Arpad Elo zaproponował model, w którym zmiana rankingu szachisty zależy od rankingu przeciwników i rezultatów partii z nimi rozegranych.

Szukany ranking turniejowy Ru= 1n+1

∑

i= 1 n+ 1

Ri+400n+1( W −P)

(4.1)

gdzie:

Ru – szukany ranking turniejowy n – liczba przeciwników

W – wygrane partie zawodnika P – przegrane partie zawodnika

∑

_{i =1}

n+1Ri

- średni ranking przeciwników + własny ranking

Źródło: http://pliki.pzszach.pl/komisje/ewidencji_klasyfikacji_i_rankingu/2017/regulamin_klasyfikacyjny.pdf

Na przykład w turnieju składającym się z dziewięciu partii przy wyniku 4,5 czyli (9/2), uzyskany ranking wynosi dokładnie średnią arytmetyczną z rankingów przeciwników i własnego.

Za każdy kolejny punkt dopisywane jest do uzyskanego rankingu 40 pkt. rankingowych (400/9+1) i odwrotnie w przypadku uzyskania wyniku gorszego niż 4,5 pkt.

120 Straffin P.D., Teoria gier, wyd. Scholar, Warszawa 2004, s. 48-63

121 Litmanowicz W., Giżycki J., Szachy od A do Z, tom I, wyd. Sport i Turystyka Warszawa 1986, str. 227

110 Porównanie przed turniejem rankingu zawodników pozwala prognozować ostateczny rezultat. W sytuacji, gdy zawodnik uzyska wynik lepszy od oczekiwanego, jego ranking powinien wzrosnąć i odwrotnie, w wypadku gorszego wyniku.

Takie podejście do problemu pozwala na ocenę siły gry zawodników grających obecnie, jednak postęp jaki nastąpił w ostatnich latach w tworzeniu programów szachowych pozwala na ocenę siły gry zawodników dawno już nieżyjących. Jednym z fenomenalnych atrybutów gry w szachy jest notacja, dzięki której do dzisiaj istnieją zapisy gier nawet sprzed 500 lat. Na ich podstawie bardzo mocne programy mogą ocenić błędy jakie popełniali ówcześni gracze i z dość dużą precyzją określić ich obecny ranking ELO. Rezultaty takich badań można przeanalizować na stronie www.chessmetrics.com. Analizy tam zawarte opracowane zostały przez Jeffa Sonasa, data ostatniej aktualizacji to 26 marca 2005 r.¹²²

Dzięki powyższym analizom można zbadać wyniki historyczne i sprawdzić kto w danym roku był najlepszy na świecie. Możliwe są również zestawienia wszystkich zawodników, w tym grających obecnie. Zestawienie tych wyników inspiruje do analiz. Okazuje się, że w przeciągu dwudziestu lat gry najwyższy średni ranking uzyskali Garri Kasparow 2856 ELO, Anatoly Karpow 2818 ELO oraz nieżyjący od 1941 roku Emanuel Lasker 2809 ELO.¹²³ Ten ostatni, z racji udziału w rozgrywkach na przełomie XIX i XX w. nie miał dostępu do wielu opracowań teoretycznych i programów komputerowych jakie pozwalają dziś analizować szereg rozegranych partii i podnosić poziom gry. Wynik uzyskany w chessmetrics uzmysławia jakim genialnym był on graczem.

Najwyższy ranking uzyskany w najlepszym dla gracza roku gry osiągnął Robert „Bobby”

Fischer (rys.15) i wynosił on według chessmetrics 2881 ELO, wynik ten poprawił Magnus Carlsen w maju 2014 r. osiągając 2882 ELO.¹²⁴

122 http://www.chessmetrics.com/cm/ stan na 10.07.2018 r.

123 http://www.chessmetrics.com/cm/CM2/PeakList.asp?Params=199510SSSSSWS0000000000001110000000000000 10100

124 https://ratings.fide.com/id.phtml?event=1503014 stan na 02.08.2018 r.

111 Rys. 15 Średni ranking ELO uzyskany w najlepszym roku w karierze gracza

Źródło:

http://www.chessmetrics.com/cm/CM2/PeakList.asp?Params=199510SSSSS1S0000000000001110 00000000000010100 Stan na 03.07.2018

Ranking ELO można wykorzystać nie tylko do oceny siły gry poszczególnych zawodników, ale również do oceny siły gry programów komputerowych. Do roku 1997 w rywalizacji najlepszy człowiek – najlepsza maszyna, górą był człowiek. Wtedy to komputer Deep Blue¹²⁵ skonstruowany przez IBM specjalnie do gry w szachy wygrał mecz z Garri Kasparowem 3,5 do 2,5. Od tego czasu siła gry programów komputerowych znacznie wzrosła i można powiedzieć, że obecnie żaden człowiek nie jest w stanie skutecznie im się przeciwstawić. Z obecnie grających zawodników (stan na lipiec 2018 r.) najwyższy ranking ELO posiada Norweg Magnus Carlsen 2842 (rys.15), najwyżej obecnie notowanym Polakiem jest Jan Krzysztof Duda z wynikiem 2737 ELO, tuż za nim plasuje się Radosław Wojtaszek 2733 ELO. Ranking ELO pozwala na porównanie współczesnych szachistów z tymi grającymi przed laty i porównać ich siłę. Najmocniejszym polskim szachistą według chessmetrics był Akiba Rubinstein z rankingiem 2787 ELO (1913 r.), zaraz za nim plasował się Mieczysław Najdorf z wynikiem 2783 ELO (2783 r.). Po II wojnie światowej najwyższy ranking osiągnął Radosław Wojtaszek 2750 ELO (2017 r.).

125 https://chessprogramming.wikispaces.com/Deep+Blue Stan na 11.07.2018 r.

112 Rys. 16 Ranking najmocniejszych szachistów na świecie w lipcu 2018 r

Źródło: www.ratings.fide.com/top.phtml?list=men Stan na 03.07.2018 r.

Ranking ELO pozwala zobaczyć, jak współcześnie wygląda siła najmocniejszych graczy (rys.16) w porównaniu z najmocniejszymi programami szachowymi (rys.16). Gra w szachy nadal jest grą niezłamaną, tzn. co roku powstają nowe programy szachowe, które wygrywają z dotychczasowymi. Co ciekawe gra w warcaby klasyczne również nie została jeszcze złamana. W 2007 roku powstał program, który złamał jej angielską wersję Checkers.¹²⁶ Jest to dość prymitywna odmiana gry w warcaby i rzeczywiście z tym programem można obecnie tylko przegrać lub zremisować. Gry logiczne stanowią obecnie poligon doświadczalny dla programistów, tak jak wcześniej, w ujęciu historycznym, ćwiczyły w myśleniu strategicznym władców i wodzów.

126

http://science.sciencemag.org/content/early/2007/07/19/science.1144079?maxtoshow=&HITS=10&hits=10&RESULTF ORMAT=&fulltext=Jonathan%20Schaeffer&searchid=1&FIRSTINDEX=0&resourcetype=HWCIT Stan na 10.07.2018

113 Rys. 17 Najmocniejsze programy szachowe w rywalizacji TCEC

Źródło: http://tcec.chessdom.com/archive.php Stan na 10.07.2018 r

Wyniki programów przedstawione na rysunku 17 są rezultatem rywalizacji, która jest prowadzona na stronie tcec.chessdom.com. Pierwszy sezon rywalizacji silników został rozegrany w 2010 r. Zwycięzcą został wtedy program Houdini w wersji 1.5a.¹²⁷ W pierwszej rundzie rozgrywany jest turniej kołowy, w którym każdy z programów gra z pozostałymi. Po tym turnieju dwa najlepsze programy grają mecz składający się ze 100 partii z 50 zdefiniowanymi wcześniej debiutami, który musi być rozegrany przez każdy program zarówno białymi jak i czarnymi figurami.

127 https://en.wikipedia.org/wiki/Top_Chess_Engine_Championship Stan na 10.07.2018 r.

114 Rys. 18 Zwycięzcy wszystkich sezonów TCEC

Źródło: https://en.wikipedia.org/wiki/Top_Chess_Engine_Championship Stan na 10.07.2018

Na rysunku 18 można zobaczyć jaki wysiłek wkładają programiści w celu poprawienia gry swoich programów. W sezonie czwartym i piątym widać, że różnica pomiędzy pierwszym i drugim programem wynosiła zaledwie dwa punkty. Sezon 12 pokazał dominację programu Stockfish¹²⁸, który wygrał z programem Komodo¹²⁹ w stosunku 29 do 9 przy 62 remisach. Jest to niesamowity wynik ponieważ wielu komentatorów uważało, że zbliżamy się już do końca tej gry.

Rywalizacja w TCEC, jest transparentna, tzn. programy grają zawsze na tej samej platformie sprzętowej. Dzięki temu możemy porównać jakość pracy wniesionej przez programistów. W grudniu 2017 r. firma Google zaprezentowała program Alphazero¹³⁰, który działa inaczej niż dotychczas tworzone programy. Nie korzysta z baz danych, teorii debiutów, czy teorii końcówek.

128 https://stockfishchess.org/about/ Stan na 10.07.2018 r.

129 https://komodochess.com/store/pages.php?cmsid=13 Stan na 10.07.2018 r.

130 https://en.wikipedia.org/wiki/AlphaGo_Zero Stan na 10.07.2018 r.

115 Alphazero na początku „dowiaduje się” jakie są reguły gry, a następnie gra sam ze sobą. Program może być wykorzystywany do rozmaitych gier dwuosobowych. W przypadku gry w szachy Alphazero grała sama ze sobą przez 4 godziny (tyle trwał cały proces nauki gry w szachy), co pozwoliło jej na wygranie pojedynku z programem Stocfish 8 w stosunku 28 zwycięstw, 52 remisy i 0 porażek.¹³¹

Tutaj pojawia się jednak pewna kontrowersja, partie nie zostały rozegrane w transparentnych warunkach, Alphazero korzystała z dedykowanych superkomputerów Googla, poza tym został postawiony warunek 1 min na ruch, co według twórcy Stockfisha, Norwega Torda Romstada miało duży wpływ na uzyskany wynik.¹³²

Idea Alphazero jest bardzo szczytna, wykorzystanie uczenia maszynowego przez specjalnie skonstruowane do tego programy pozwoli w przyszłości rozwiązywać seryjnie problemy z wielu dziedzin życia. W przypadku rywalizacji sztucznej inteligencji z innymi programami szachowymi uczciwym byłoby wystawienie przez inżynierów Googla ich Alphazero do turnieju organizowanego przez TCEC. Po dwóch latach oczekiwań Alphazero wystartowała w 14 edycji TCEC i toczy wyrównany pojedynek w finale przeciwko programowi Stockfish 10.

Różnica między graczami w rankingu ELO wynosząca 200 punktów, przekłada się na rezultat ok. 3 do 1 w meczu. Różnica pomiędzy Magnusem Carlsenem a programem Stockfish 9 wynosi ponad 700 pkt., więc w 2018 r. szanse człowieka na wygranie z programem komputerowym są bliskie zera.

W dokumencie ROZPRAWA DOKTORSKA (Stron 109-115)