• Nie Znaleziono Wyników

POLITECHNIKA WARSZAWSKA. WYDZIAŁ CHEMICZNY Kierunek: TECHNOLOGIA CHEMICZNA. Marcin Hubert Durski

N/A
N/A
Protected

Academic year: 2022

Share "POLITECHNIKA WARSZAWSKA. WYDZIAŁ CHEMICZNY Kierunek: TECHNOLOGIA CHEMICZNA. Marcin Hubert Durski"

Copied!
73
0
0

Pełen tekst

(1)

POLITECHNIKA WARSZAWSKA WYDZIAŁ CHEMICZNY

Kierunek: TECHNOLOGIA CHEMICZNA

Marcin Hubert Durski

Współczynniki aktywno´sci zwi ˛ azków molekularnych w niesko ´nczenie rozcie ´nczonych mieszaninach z cieczami

jonowymi – baza danych oraz nowa metoda udziałów grupowych

Praca dyplomowa na stopie´n in˙zyniera

wykonana na Zakładzie Chemii Fizycznej Kieruj ˛acy prac ˛a: dr in˙z. Kamil Paduszy´nski

Warszawa 2015

(2)
(3)

Chciałbym zło˙zy´c szczere i serdeczne podzi˛ekowania Panu dr in˙z. Kamilowi Paduszy ´nskiemu za stworzenie miłej atmosfery, wyrozumiało´s´c i pomoc, któr ˛a ofiarował mi podczas tworzenia tej pracy.

(4)

O´swiadczenie autora pracy

´Swiadom odpowiedzialno´sci prawnej o´swiadczam, ˙ze praca dyplomowa o w/w tytule nie zawiera tre´sci uzyskanych w sposób niezgodny z obowi ˛azuj ˛acymi przepisami. O´swiad- czam równie˙z, ˙ze przedstawiona praca nie była wcze´sniej przedmiotem procedur zwi ˛azanych z uzyskaniem tytułu zawodowego w wy˙zszej uczelni.

O´swiadczam, ˙ze wyniki zamieszczone w mojej pracy dyplomowej zostały sfinansowane i wykonane z wykorzystaniem aparatury i urz ˛adze´n b˛ed ˛acych własno´sci ˛a Wydziału Che- micznego Politechniki Warszawskiej. Niniejsza praca dyplomowa jest utworem zbiorowym i jest własno´sci ˛a intelektualn ˛a Kieruj ˛acego prac ˛a, opiekuna naukowego oraz moj ˛a.

Zobowi ˛azuj˛e si˛e, ˙ze nie wykorzystam ani nie opublikuj˛e wyników pracy bez zgody Kie- ruj ˛acego prac ˛a i Kierownika Jednostki Wydziału Chemicznego Politechniki Warszawskiej w której wykonano prac˛e.

Jednocze´snie udzielam Politechnice Warszawskiej nieodpłatnej licencji niewył ˛acznej na umieszczenie wersji elektronicznej w/w pracy w Bazie Wiedzy Politechniki Warszawskiej i do korzystania z utworu przez jego udost˛epnienie on-line.

4

(5)

Streszczenie

Niniejsza praca opisuje nowy model słu˙z ˛acy do przewidywania współczynników aktywno´sci w rozcie´nczeniu niesko´nczenie wielkim (γ12) dla mieszanin cieczy jonowych ze zwi ˛azkami molekularnymi (niejonowymi).

W cz˛e´sci wst˛epnej omówiono pokrótce czym s ˛a ciecze jonowe, jakie wykazuj ˛a wła-

´sciwo´sci oraz do czego s ˛a wykorzystywane. Nast˛epnie omówiono znaczenie γ12w chemii fizycznej, a tak˙ze uzasadniono próby tworzenia modeli maj ˛acych przewidywa´c warto´sci współczynników aktywno´sci za pomoc ˛aprzykładów. Ma to na celu podkre´slenie w jak wielu dziedzinach technologii chemicznej, in˙zynierii chemicznej i biochemii współczynnik ten ma zastosowanie. Ponadto ukazano w skrócie wcze´sniejsze próby stworzenia za pomoc ˛amodelu QSPR korelacji maj ˛acych przewidywa´c warto´sci γ12. Nie w pełni zadowalaj ˛ace wyniki tych korelacji były główn ˛a motywacj ˛a do opracowania dokładniejszego modelu opisanego w tej pracy.

W dalszej cz˛e´sci omówiono proces tworzenia nowego modelu, pocz ˛awszy od opisu i ewaluacji bazy danych zawieraj ˛acej zgromadzone warto´sci eksperymentalne współczynni- ków aktywno´sci γ12w funkcji temperatury. Nast˛epnie opisano sposób tworzenia nowej me- tody udziałów grupowych, zdefiniowano grupy b˛ed ˛ace wynikiem podziału kationów i anio- nów, a tak˙ze uzasadniono sens takiego podziału. Kolejnym elementem pracy jest opis sub- stancji rozpuszczanych, którego dokonano za pomoc ˛a podej´scia LSER i deskryptorów opu- blikowanych w 1993r. przez Abrahama. Rozdział ten zako´nczono szczegółowym omówie- niem sposobu działania dwuwarstwowych jednokierunkowych sztucznych sieci neurono- wych u˙zytych do opracowania nowego modelu.

Kolejnym punktem pracy była szczegółowa analiza statystyczna wyników uzyskanych za pomoc ˛a nowego modelu stworzonego na podstawie sieci neuronowych oraz porównanie ich z omówionym w pracy, konkurencyjnym modelem opublikowanym w 2011 roku przez F. Muteleta.

W ostatniej cz˛e´sci znajduje si˛e podsumowanie i wnioski wyci ˛agni˛ete podczas tworzenia nowego modelu, a tak˙ze zał ˛acznik zawieraj ˛acy kompletny spis zdefiniowanych grup słu˙z ˛a- cych do opisu cieczy jonowych.

(6)

Abstract

This work describes new predictive model of activity coefficients at infinite dilution (γ12for bi- nary mixtures of ionic liquids and molecular (non-ionic) compounds.

The introductory part briefly describes what are the ionic liquids, what characteristics they have and what they are used for. Then the importance of γ12in physical chemistry, as well as justified attempts to creation of models that may predict the activity coefficients at infinite dilution were discussed, to show in how many areas of chemical technology, che- mical engineering and biochemistry this coefficient is applicable. Moreover, earlier attempts of creation of QSPR correlations to predict γ12values were reviewed. Unsatisfactory results of these correlations were the main motivation for the development of more accurate the model.

The main part of the thesis describes the process of estblishing a new model, starting from the description and evaluation of collected experimental activity coefficients γ12values as a function of temperature. Then the proces of creating a new method of group contribution is demonstrated the functional groups for the distribution of cations and anions are defined, and the sence of this division is explained. The next element of the work was the description of solutes, which was made using the LSER approach and descriptors published in 1993 by Abraham. This section was ended by detailed discussion of the operation of feedforward artificial neural networks used to develop the new model.

The next part of the work was concerned with a detailed statistical analysis of results ob- tained by using novel model. Then the results comparison with competitive model, published in 2011 by F. Mutelet was presented.

The last part of this work contains summary and conclusions drawn during creation of the model were placed. This part also contains appendix with complete list of defined groups, that describes ionic liquids composition.

6

(7)

Spis tre´sci

1. Wprowadzenie 9

1.1. Ciecze jonowe . . . 9

1.2. Współczynniki aktywno´sci w rozcie´nczeniu niesko´nczenie wielkim . . . . 11

1.3. Modelowanie danych γ12– przegl ˛ad literatury . . . 14

1.4. Cel pracy . . . 19

2. Model 21 2.1. Baza danych . . . 21

2.1.1. Informacje ogólne . . . 21

2.1.2. Format danych . . . 23

2.1.3. Przegl ˛ad i ewaluacja danych . . . 23

2.2. Opis układu {ciecz jonowa + solut} . . . 24

2.2.1. Ciecze jonowe . . . 24

2.2.2. Soluty . . . 26

2.3. Sztuczne sieci neuronowe . . . 28

2.3.1. Informacje ogólne . . . 28

2.3.2. Implementacja . . . 31

3. Wyniki i dyskusja 35 3.1. Optymalna topologia sieci . . . 35

3.2. Podsumowanie wyników: uczenie, walidacja, testowanie . . . 36

3.3. Porównanie z modelem TDGC-LSER . . . 45

4. Podsumowanie i wnioski 47

Bibliografia 47

A. Grupy funkcyjne 67

(8)

8

(9)

Rozdział 1

Wprowadzenie

W ramach wprowadzenia do niniejszej pracy, w sposób zwarty przedstawiono obiekt ba- da´n, tj. ciecze jonowe oraz współczynnik aktywno´sci w rozcie´nczeniu niesko´nczenie wiel- kim składnika molekularnego (okre´slanego w dalszej cz˛e´sci pracy mianem „solutu”) w cie- czy jonowej (γ12; indeksy 1 i 2 odnosz ˛a si˛e odpowiednio do cieczy jonowej i solutu) – klu- czow ˛a wła´sciwo´s´c termodynamiczn ˛a. Nast˛epnie przedstawiono zwi˛ezły przegl ˛ad opisanych w literaturze metod umo˙zliwiaj ˛acych obliczanie (korelacj˛e lub przewidywanie) danych γ12, na podstawie którego sformułowano cel pracy.

1.1. Ciecze jonowe

Intensywny rozwój cywilizacji XXI wieku skłania badaczy i naukowców do poszukiwa- nia nowych rozwi ˛aza´n dla wielu dziedzin, m.in. in˙zynierii i technologii chemicznej. Je´sli chodzi o ten obszar wiedzy, w ostatnich latach wiele uwagi po´swi˛eca si˛e podej´sciu okre-

´slanym mianem „zielonej” chemii (ang. green chemistry) [1]. Zielona chemia podsumowuje najwa˙zniejsze zasady i kierunki bada´n nad nowymi materiałami i procesami, przy czym sto- sowanie tych zasad ma prowadzi´c do technologii, których wpływ na ´srodowisko naturalne jest tak niewielki, jak to tylko mo˙zliwe. Szczególnie wa˙zna jest zasada nr 5 mówi ˛aca o roz- puszczalnikach – proces „zielony” to taki, w którym zastosowanie rozpuszczalników nie jest konieczne. Oczywi´scie w praktyce trudno sobie taki proces wyobrazi´c. Znakomita wi˛ek- szo´s´c reakcji chemicznych (zarówno w chemii organicznej jak i nieorganicznej) przebiega w ´srodowisku rozpuszczalnika. To samo dotyczy ró˙znego rodzaju metod oczyszczania czy te˙z rozdzielania, na przykład ekstrakcji. Faktycznym kierunkiem rozwoju „zielonej chemii”

powinno by´c zatem poszukiwanie nowych rozpuszczalników.

Ciecze jonowe (ang. ionic liquids) od pocz ˛atku lat 90. ubiegłego wieku rozwa˙zane s ˛a ja-

(10)

N N

+ R

R

N

+

R

N+ R

O N+ R R

N+ R R

N+ R R

N+

R R

R

R P+

R R

R

R S+

R

R R

1 2 3

4 5 6

7 8 9

Rysunek 1.1: Struktury kationów typowych cieczy jonowych. 1 - imidazoliowy, 2 - piry- dyniowy, 3 - chinoliniowy, 4 - morfoliniowy, 5 - piperydyniowy, 6 - pyrolidyniowy, 7 - amoniowy, 8 - fosfoniowy, 9 - sulfoniowy

ko potencjalne rozpuszczalniki „zielonej chemii” [2]. Z chemicznego punktu widzenia, cie- cze jonowe to sole organiczne maj ˛ace w swojej strukturze du˙zy organiczny kation. Przykłady struktur kationów przedstawia Rysunek 1.1. Jak nietrudno zauwa˙zy´c, kationy te stanowi ˛apo- chodne czwartorz˛edowych zasad organicznych takich jak imidazole, pirydyny, piperydyny, aminy, czy fosfiny. Aniony (Rysunek 1.2) wchodz ˛ace w skład cieczy jonowych, s ˛a z reguły mniejsze. Cz˛esto posiadaj ˛a równie˙z osie lub płaszczyzny symetrii.

Znacz ˛ace ró˙znice w rozmiarze i symetrii przeciwjonów prowadz ˛a do istotnego obni˙zenia energii sieci krystalicznej soli, co w efekcie pozwala na uzyskanie fazy ciekłej w tempera- turze znacznie ni˙zszej ni˙z ma to miejsce w przypadku typowych soli nieorganicznych [3].

Istotnie, w przypadku cieczy jonowych, temperatura topnienia jest znacznie ni˙zsza. Umow- nie przyjmuje si˛e, ˙ze ciecz ˛a jonow ˛a nazywa si˛e sól organiczn ˛a, której temperatura przej´scia fazowego ciało stałe-ciecz jest ni˙zsza ni˙z normalna temperatura wrzenia wody, tj. 100C.

Z licznych doniesie´n literaturowych wynika, ˙ze ciecze jonowe cechuj ˛a si˛e wieloma intere- suj ˛acymi wła´sciwo´sciami, ciekawymi zarówno dla chemii laboratoryjnej (syntezy, chemia analityczna) [4], jak i stosowanej (procesy rozdzielania) [5]. Szczególnie wa˙zna z punk-

10

(11)

Cl

Br

F B

F F F

N S

S

O O

O O

C

C

F F F

F F

F P

F

F F

F F F

B

O O

O O

C C

O O

C C

O O

S

C N

O

S O

O O H3C

Rysunek 1.2: Struktury anionów typowych cieczy jonowych.

tu widzenia zielonej chemii wydaje si˛e by´c dobra stabilno´s´c termiczna i chemiczna cie- czy jonowych oraz ich ekstremalnie niska pr˛e˙zno´s´c pary nasyconej, nawet w podwy˙zszonej temperaturze. Ciecze jonowe posiadaj ˛a równie˙z szeroki zakres temperaturowy stabilno´sci fazy ciekłej, w porównaniu do wszystkich rozpuszczalników organicznych i nieorganicz- nych. Dodatkowo, ró˙znego rodzaju wła´sciwo´sci fizykochemiczne (g˛esto´s´c, lepko´s´c, napi˛ecie powierzchniowe, współczynnik załamania ´swiatła) i termodynamiczne (luka mieszalno´sci, rozpuszczalno´s´c, ciepło mieszania, pr˛e˙zno´s´c pary) cieczy jonowych mo˙zna modyfikowa´c w kontrolowany sposób poprzez modyfikacje struktury jonów lub podstawników wyst˛epuj ˛a- cych w kationach lub anionach (np. zmiana długo´sci podstawnika lub wprowadzenie ró˙znych grup funkcyjnych). Dlatego te˙z, w literaturze anglosaskiej, ciecze jonowe okre´sla si˛e bardzo cz˛esto terminami tuneable solvents lub designer solvents.

1.2. Współczynniki aktywno´sci

w rozcie ´nczeniu niesko ´nczenie wielkim

Dziedzin ˛a chemii fizycznej, podaj ˛ac ˛a prosty (a jednocze´snie uniwersalny) formalizm opisu mieszanin wieloskładnikowych jest klasyczna termodynamika chemiczna. W szcze- gólno´sci definiuje ona układ zwany mieszanin ˛a doskonał ˛a. Definicja ta opiera si˛e na podaniu wyra˙zenia na cz ˛astkow ˛aentalpi˛e swobodn ˛a(tzw. potencjał chemiczny) i-tego składnika mie- szaniny. Wyra˙zenie to przedstawia si˛e nast˛epuj ˛aco [6]:

ˆµi(T, P, x) = µi(T, P) + RT ln xi, (1.1)

(12)

gdzie T i P oznaczaj ˛a odpowiednio temperatur˛e i ci´snienie układu, a x jest wektorem ułam- ków molowych wszystkich składników mieszaniny, . Indeksem górnym „∗” oznaczono wła-

´sciwo´sci opisuj ˛ace układ doskonały. Symbol „daszka” odnosi si˛e natomiast do wła´sciwo´sci składnika w mieszaninie – jego brak oznacza, ˙ze dany symbol jest przypisany wła´sciwo´sci substancji w stanie czystym. Potencjał chemiczny oblicza si˛e jako pochodn ˛a energii we- wn˛etrznej, entalpii, entalpii swobodnej lub energii swobodnej wzgl˛edem liczby moli cz ˛aste- czek danego składnika, przy ustalonych warto´sciach wi˛ezów adekwatnych dla wybranego potencjału termodynamicznego. Potencjał chemiczny odgrywa zasadnicz ˛a rol˛e w termody- namice chemicznej. W szczególno´sci, poj˛ecie to stanowi podstaw˛e do definicji aktywno´sci termodynamicznej, pojawia si˛e w kryteriach i warunkach równowag fazowych i chemicz- nych.

Roztwory rzeczywiste (szczególnie te o istotnym w znaczeniu praktycznym, np. miesza- niny zwi ˛azków polarnych i asocjuj ˛acych, roztwory wodne elektrolitów) wykazuj ˛azazwyczaj znacz ˛ace odchylenia od doskonało´sci. Odchylenia te mog ˛a by´c zarówno dodatnie jak i ujem- ne. Zale˙zy to od składu mieszaniny, ale przede wszystkim istotna jest tutaj natura chemiczna wszystkich jej składników, a w szczególno´sci od rodzaju i siły oddziaływa´n mi˛edzycz ˛astecz- kowych. W ramach termodynamiki klasycznej nie jest mo˙zliwe podanie ogólnego wyra˙zenia na potencjał chemiczny składnika w mieszaninie rzeczywistej, analogicznego do równania (1.1), poniewa˙z dziedzina ta nie opisuje wpływu mikroskopowych wła´sciwo´sci układu na je- go wła´sciwo´sci makroskopowe. Mo˙zna jednak wprowadzi´c pewne wielko´sci, które opisuj ˛a jedynie odchylenia wła´sciwo´sci mieszaniny od wła´sciwo´sci wybranego układu referencyjne- go. Najcz˛e´sciej, układem takim jest wła´snie mieszanina doskonała zdefiniowana równaniem (1.1), a miar ˛a odchylenia tak zwany współczynnik aktywno´sci. Zgodnie z definicj ˛a:

ln γi(T, P, x) ≡ ˆµi(T, P, x) − ˆµi(T, P, x)

RT (1.2)

W układach dwuskładnikowych, definiuje si˛e cz˛esto współczynnik aktywno´sci składnika

„2” w rozpuszczalniku „1” w rozcie´nczeniu niesko´nczenie wielkim zdefiniowany równa- niem:

γ12= lim

x2→0γ1 (1.3)

Warto´s´c γ12 mo˙ze stanowi´c ´zródło informacji na temat wzajemnego powinowactwa mi˛e- dzy cz ˛asteczkami substancji rozpuszczonej i rozpuszczalnika. Je´sli γ12≪ 1, powinowactwo jest silne (oddziaływania 1-2 s ˛a silniejsze od oddziaływa´n 1-1), je´sli natomiast γ12≫ 1 po- winowactwo jest słabe (oddziaływania 1-2 s ˛a słabsze od oddziaływa´n 1-1). Je´sli natomiast

12

(13)

γ12 ≈ 1, układ jest bliski doskonało´sci, co oznacza, ˙ze oddziaływania cz ˛asteczek ró˙znych składników mieszaniny maj ˛a sił˛e porównywaln ˛a do oddziaływa´n cz ˛asteczek tego samego składnika. Oprócz znaczenia czysto poznawczego, warto´sci γ12 mog ˛a mie´c równie˙z znacze- nie praktyczne. Przy u˙zyciu warto´sci γ12mo˙zna na przykład oblicza´c współczynniki aktyw- no´sci mieszanin dwuskładnikowych o dowolnym st˛e˙zeniu substancji rozpuszczonej lub roz- puszczalnika [7]. Tego typu obliczenia mo˙zna wykona´c dysponuj ˛ac odpowiednim mode- lem termodynamicznym podaj ˛acym zale˙zno´s´c nadmiarowej entalpii swobodnej mieszania.

W modelach takich wyst˛epuj ˛a na ogół pewne parametry, które mo˙zna dopasowa´c wła´snie do danych γ12. Znajomo´s´c tych parametrów jest szczególnie istotna, poniewa˙z umo˙zliwiaj ˛a one obliczanie wielu ciekawych wła´sciwo´sci termodynamicznych mieszanin, takich jak diagra- my fazowe równowagi ciecz-para, ciecz-ciecz, ciało stałe-ciecz b ˛ad´z nadmiarowe entalpie i pojemno´sci cieplne mieszania.

Z danych γ12 mo˙zna równie˙z oblicza´c ró˙znego rodzaju parametry okre´slaj ˛ace przydat- no´s´c danego rozpuszczalnika (np. cieczy jonowej) w wybranych procesach ekstrakcyjnych.

Przykładem takiego parametru jest selektywno´s´c Si j∞ (1)zdefiniowana jako:

S∞ (1)i j = γ1i

γ1 j (1.4)

gdzie symbole i i j oznaczaj ˛a indeksy przypisane do składników, wzgl˛edem których liczona jest selektywno´s´c. Warto´sci S∞ (1)i j ≪ 1 lub S∞ (1)i j ≫ 1 wskazuj ˛a, ˙ze rozpuszczalnik „1” mo˙ze by´c traktowany jako dobre medium do rozdzielnia składnika i od składnika j. W literatu- rze, szczególnie du˙zo uwagi po´swi˛econo badaniom zdolno´sci cieczy jonowych do rozdzie- lania ekstrakcyjnego w˛eglowodorów alifatycznych od aromatycznych [8], zwi ˛azków siarki (np. tiofenu lub benzotiofenu) od lekkich frakcji benzynowych (modelowe układy dla pro- cesów ekstrakcyjnego odsiarczania paliw) [9], czy te˙z butanolu z roztworów wodnych [10].

Kolejn ˛a mo˙zliwo´sci ˛a, któr ˛a daje wykorzystanie współczynników aktywno´sci w rozcie´n- czeniu niesko´nczenie wielkim jest zastosowanie tych danych w celu okre´slenia stopnia od- działywania substancji na ´srodowisko naturalne [11]. Wynika to z faktu, ˙ze γ12 mo˙zna po- wi ˛aza´c z ró˙znego typu współczynnikami podziału wybranych substancji, np. mi˛edzy ´sro- dowiskiem wodnym lub powietrzem a gleb ˛a. Współczynniki podziału umo˙zliwiaj ˛a oblicza- nie równowagowych st˛e˙ze´n substancji w danym ´srodowisku, co ma zasadnicze znaczenie na przykład w badaniach ekotoksykologicznych.

Eksperymentalne warto´sci γ12wyznacza si˛e najcz˛e´sciej z bezpo´srednich pomiarów rów- nowag fazowych (np. równowaga ciecz-para) w roztworach rozcie´nczonych b ˛ad´z te˙z z po- miarów chromatograficznych. Pierwsze z wymienionych metod s ˛a na ogół czasochłonne.

(14)

Ponadto, wymagaj ˛a one du˙zych ilo´sci substancji badanych, dlatego te˙z s ˛a one stosunkowo drogie. Wynika st ˛ad wi˛eksza popularno´s´c metod opartych na wykorzystaniu chromatogra- fii gazowej. Metoda ta ogranicza si˛e wył ˛acznie do układów z nielotnymi rozpuszczalnikiem.

Dlatego te˙z stosuje si˛e je m.in. do wyznaczania γ12w polimerach i cieczach jonowych. Meto- d˛e chromatografii gazowej opart ˛a na równaniu Everetta i Cruickshanka [12,13] stosuj ˛a z po- wodzeniem od wielu lat grupy badawcze Doma´nskiej z Politechniki Warszawskiej [14–36], Muteleta z Université de Lorraine [37–43], Heintza i Verevkina z Universität Rostock [44–

51], Dohnala z Instytutu Technologii Chemicznej w Pradze [52–56] oraz wiele innych. Nie- mal˙ze wszystkie opublikowane dane eksperymentalne γ12w układach z cieczami jonowymi zostały wyznaczone t ˛a wła´snie metod ˛a.

Oprócz eksperymentalnego wyznaczania γ12, istnieje szereg metod słu˙z ˛acych do oblicza- nia i modelowania tej wła´sciwo´sci, w szczególno´sci jej zale˙zno´sci temperaturowej. Kolejny podrozdział przedstawia zwi˛ezły przegl ˛ad literatury na ten temat.

1.3. Modelowanie danych γ

12

– przegl ˛ ad literatury

Wła´sciwo´sci termodynamiczne substancji oraz mieszanin (w tym współczynniki aktyw- no´sci w rozcie´nczeniu niesko´nczenie wielkim) mo˙zna oblicza´c przy u˙zyciu ró˙znego rodza- ju metod i modeli. W przypadku danych γ12, najcz˛e´sciej wykorzystywanymi podej´sciami s ˛ametody z pogranicza termodynamiki chemicznej i chemii kwantowej (np. model COSMO- RS [57, 58], ang. COnductor-like Screening MOdel for Real Solvents), metody udziałów grupowych oparte na modelach opisuj ˛acych współczynniki aktywno´sci i nadmiarow ˛a en- talpi˛e swobodn ˛a (energi˛e Gibbsa) mieszania (np. modele UNIFAC [59–61], ang. UNIquac Functional-group Activity Coefficients lub NRTL-SAC [62], ang. Non-Random Two-Liquid Segment Activity Coefficients) oraz korelacje empiryczne (np. typu QSPR [63–68], ang. Qu- antitative Structure-Property Relationship).

Szczególnie du˙zo uwagi po´swi˛econo w ostatnim czasie korelacjom typu QSPR [63–68].

Metoda ta polega na podaniu ilo´sciowej (tzn. matematycznej) zale˙zno´sci pomi˛edzy wybran ˛a wła´sciwo´sci ˛a P danego zwi ˛azku chemicznego (lub klasy zwi ˛azków chemicznych) a jego struktur ˛a, opisan ˛a przy pomocy ró˙znego rodzaju deskryptorów X = [X1, X2, . . .]:

P= f (X) (1.5)

W zale˙zno´sci od rodzaju funkcji f mo˙zna wyró˙zni´c kilka typów modeli z rodziny QSPR.

Najcz˛e´sciej spotykane s ˛a modele liniowe, traktuj ˛ace opisywan ˛a wła´sciwo´s´c (lub bardzo cz˛e- 14

(15)

sto logarytm jej warto´sci) jako kombinacj˛e liniow ˛a deskryptorów:

logP = C0+

i

CiXi, (1.6)

gdzie współczynniki C0, C1, . . . s ˛a charakterystyczne dla danego problemu. Ich warto´sci wy- znacza si˛e na ogół metodami regresji liniowej dost˛epnych danych eksperymentalnych. Na- st˛epnie, równanie (1.6) mo˙zna stosowa´c do obliczania warto´sci wła´sciwo´sci P innej sub- stancji, pod warunkiem, ˙ze znane s ˛a dla niej warto´sci wszystkich deskryptorów. Liniowe modele QSPR ciesz ˛a si˛e du˙z ˛a popularno´sci ˛a przede wszystkim ze wzgl˛edu na ich prostot˛e, co jest bardzo atrakcyjne z punktu widzenia praktycznego. Cz˛esto s ˛a równie˙z postrzegane jako narz˛edzia ciekawe z czysto poznawczego punktu widzenia. Współczynnikom Ci mo˙z- na bowiem przypisa´c pewien sens fizyczny zwi ˛azany z udziałem jaki wnosi do wła´sciwo´sci P deskryptor Xi. Je´sli na przykład, deskryptor Xi zwi ˛azany jest z polarno´sci ˛a cz ˛asteczki, to warto´s´c towarzysz ˛acego mu współczynnika Ci mo˙ze w sposób ilo´sciowy informowa´c o wpływie polarno´sci na opisywan ˛a wła´sciwo´s´c P. Mniejsza warto´s´c Ci oznacza´c b˛edzie mniejszy wpływ, wi˛eksza natomiast wpływ bardziej istotny. Rozumowanie takie mo˙ze mie´c szczególne znaczenie przy porównywaniu wła´sciwo´sci ró˙znych zwi ˛azków, ale równie˙z przy projektowaniu nowych zwi ˛azków tzw. metodami in silico. Deskryptorami mog ˛a by´c ró˙znego rodzaju parametry charakteryzuj ˛ace wła´sciwo´sci, w funkcji których chce si˛e wyrazi´c mode- lowan ˛a wła´sciwo´s´c. W szczególno´sci, mo˙zna wyró˙zni´c deskryptory empiryczne lub teore- tyczne. Do deskryptorów empirycznych zalicza si˛e inne wła´sciwo´sci fizykochemiczne lub parametry obliczone na ich podstawie (np. parachora obliczona z napi˛ecia powierzchnio- wego, współczynnik ´sci´sliwo´sci obliczony z danych wolumetrycznych). Deskryptory teore- tyczne z kolei obejmuj ˛a ró˙znego rodzaju wielko´sci wynikaj ˛ace bezpo´srednio ze struktury zwi ˛azku, zarówno tej chemicznej (sposób poł ˛aczenia atomów), jak i elektronowej (poziomy energetyczne, momenty rozkładu ładunku, itp.). Przykładami deskryptorów mog ˛a by´c ró˙z- nego rodzaju indeksy topologiczne obliczane metodami teorii grafów na podstawie liczby i sposobu poł ˛aczenia atomów w obr˛ebie cz ˛asteczki. Deskryptorem mo˙ze by´c równie˙z wyst˛e- powanie (lub nie) w strukturze cz ˛asteczki ró˙znych grup funkcyjnych. Na takich deskrypto- rach opieraj ˛a si˛e metody udziałów grupowych (GC, ang. Group Contribution). Zestawienie i omówienie ró˙znego rodzaju indeksów topologicznych mo˙zna znale´z´c w obszernej mono- grafii Todeschiniego i Consonniego [69].

W literaturze opisano równie˙z metody QSPR pozwalaj ˛ace oblicza´c (tzn. korelowa´c i/lub przewidywa´c) współczynniki aktywno´sci w rozcie´nczeniu niesko´nczenie wielkim ró˙z- nych zwi ˛azków „molekularnych” (tj. niejonowych) w cieczach jonowych [63,64,66]. Mode-

(16)

le te wymieniono (w kolejno´sci chronologicznej) oraz pokrótce omówiono w dalszej cz˛e´sci pracy.

W roku 2004. Eike i współpracownicy [63] u˙zyli metodologi QSPR jako narz˛edzia do ko- relacji i przewidywania współczynników aktywno´sci w rozcie´nczeniu niesko´nczenie wiel- kim 38 solutów w 3 cieczach jonowych (tetrafluoroboranie 1-butylo-4-metylopirydyniowym, bis(trifluorometylosulfonylo)imidku 1-etylo-3-metyloimidazoliowym

oraz 1-etylo-2,3-dimetyloimidazoliowym; w dalszej cz˛e´sci tekstu oznaczonych jako

[C4C1Pyr][BF4], [C2C1Im][NTf2] i [C2C1C1(2)Im][NTf2]). Soluty opisane zostały przy wy- korzystaniu współczynników podziału oktanol-woda oraz dodatkowych deskryptorów mo- lekularnych wyprowadzonych z topologii cz ˛asteczki lub obliczonych metodami kwantowo- mechanicznymi. Optymalny zestaw deskryptorów został wybrany przy pomocy algorytmu GFA (ang. Genetic Function Approximation). Współczynniki powstałych korelacji QSPR zostały wyznaczone na podstawie danych γ12 zmierzonych przy ró˙znych warto´sciach tem- peratury. W celu uzyskania ogólnej zale˙zno´sci γ12(T ) wprowadzono dodatkowe współczyn- niki opisuj ˛ace zale˙zno´s´c temperaturow ˛a (po dwa na ka˙zdy współczynnik korelacji QSPR).

W sumie, dane γ12 dla ka˙zdej zbadanej cieczy jonowej zostały opisane przy pomocy 10 pa- rametrów, co daje około 4 punkty eksperymentalne na 1 parametr. Autorzy pokazali, ˙ze przy pomocy ich podej´scia mo˙zna opisa´c dane γ12ze wzgl˛ednie dobr ˛a dokładno´sci ˛a. Współczyn- niki korelacji mi˛edzy obliczonymi i eksperymentalnymi danymi lnγ12 dla cieczy jonowych [C4C1Pyr][BF4], [C2C1Im][NTf2], [C2C1C1(2)Im][NTf2] wynosz ˛aodpowiednio 0.952, 0.975 oraz 0.970. ´Srednie odchylenie wzgl˛edne γ12 (obliczone dla T = 298.15 K) wynosi odpo- wiednio: 31.4, 35.2 oraz 37.5%. Nale˙zy podkre´sli´c, ˙ze przedstawiona metoda jest korelacyj- na z punktu widzenia cieczy jonowych. Oznacza to, ˙ze przedstawiony model nie pozwala na obliczanie warto´sci współczynnika aktywno´sci w rozcie´nczeniu niesko´nczenie wielkim w cieczy jonowej innej ni˙z te uwzgl˛ednione w pracy [63]. Mo˙zna natomiast przewidywa´c warto´sci γ12 solutów spoza zbioru tych u˙zytych przez autorów. Obliczenie takie nie jest jednak trywialne, gdy˙z wymagana jest znajomo´s´c kwantowo-mechanicznych deskryptorów molekularnych – wymaga zatem wiedzy z dziedziny chemii kwantowej oraz umiej˛etno´sci zwi ˛azanych z obsług ˛a odpowiedniego oprogramowania. W pracy [63] wykonano takie ob- liczenia dla 15 dodatkowych solutów w celu zademonstrowania mo˙zliwo´sci predykcyjnych opracowanych korelacji. Nie porównano jednak warto´sci obliczonych z eksperymentalnymi, dlatego te˙z nie jest mo˙zliwa rzetelna ocena faktycznej dokładno´sci tego modelu.

Prac˛e łudz ˛aco podobn ˛a do artykułu Eike’a i współpracowników, opublikowali dwa lata pó´zniej Tämm i Burk [64], którzy przedstawili korelacje QSPR dla danych γ12 tych samych solutów w tych samych cieczach jonowych. Autorzy Ci zmienili jedynie zestaw deskryp-

16

(17)

torów opisuj ˛acych soluty. Nie uzyskano jednak znacz ˛acej poprawy dokładno´sci oblicze´n, zarówno je´sli chodzi o korelacj˛e jak i przewidywanie.

Innym przykładem liniowej korelacji QSPR opartej na deskryptorach obliczonych meto- dami kwantowo-mechanicznymi jest model Ge i współpracowników z roku 2009 [66]. Au- torzy Ci zastosowali zmodyfikowane podej´scie LSER, tzw. TLSER (ang. Theoretical LSER), w którym deskryptory starszej wersji metody LSER (wyznaczone przede wszystkim empi- rycznie) zostały zast ˛apione odpowiednikami teoretycznymi. Nie ulega w ˛atpliwo´sci, ˙ze jest to podej´scie bardziej uniwersalne. Umo˙zliwia ono bowiem wykonanie oblicze´n tylko i wy- ł ˛acznie na podstawie struktury substancji rozpuszczonej i rozpuszczalnika – niezale˙znie od na ogół trudno dost˛epnych danych eksperymentalnych. W omawianej pracy, przedstawio- no obliczenia warto´sci γ12 niestety tylko dla dwóch cieczy jonowych (trifluorometylosul- fonian 1-butylo-3-metyloimidazoliowy [C4C1Im][OTf] oraz tetrafluoroboran 1-propylo-2,3- dimetyloimidazoliowy [C3C1C1(2)][BF4]). Jako deskryptory solutu wzi˛eto moment dipolo- wy, obj˛eto´s´c van der Waalsa cz ˛asteczki oraz szereg wła´sciwo´sci elektronowych i elektro- statycznych (poziomy energetyczne HOMO/LUMO, skrajne warto´sci ładunku cz ˛astkowego w obr˛ebie cz ˛asteczki). Model opracowano na podstawie danych zebranych dla 34 solutów (alkanów, alkenów, cykloalkanów, acetonu, acetonitrylu, dioksanu, octanu etylu, tetrahydro- furanu, liniowych i rozgał˛ezionych alkoholi o liczbie atomów w˛egla od 1 do 5 oraz chlorow- copochodnych metanu). Wykazano, ˙ze lnγ12dobrze koreluje si˛e z wymienionymi deskrypto- rami. Współczynniki korelacji dla [C4C1Im][OTf] i [C3C1C1(2)][BF4] wynosz ˛aodpowiednio 0.956 i 0.967. ´Srednie odchylenia wzgl˛edne mi˛edzy obliczonymi i eksperymentalnymi war- to´sciami γ12 s ˛a jednak bardzo wysokie i wynosz ˛a odpowiednio 112.2 oraz 25.0% (warto´sci obliczone w ramach tej pracy). Warto podkre´sli´c, ˙ze w omawianej pracy nie przetestowa- no zaproponowanych modeli pod k ˛atem ich mo˙zliwo´sci predykcyjnych, tzn. nie obliczono współczynników aktywno´sci w rozcie´nczeniu niesko´nczenie wielkim w układach nie u˙zy- tych do wyznaczenia współczynników modelu QSPR. Ponadto wszystkie obliczenia zostały wykonane tylko dla jednej warto´sci temperatury, co czyni zaproponowany model bezu˙zy- tecznym w obliczaniu innych wa˙znych funkcji termodynamicznych, np. cz ˛astkowej entalpii mieszania w rozcie´nczeniu niesko´nczenie wielkim.

Artykuł opublikowany w 2010 przez zespół Xi to kolejny przykład zastosowania podej-

´scia QSPR [67]. Obliczenia wykonano dla 38 ró˙znych solutów, w tym polarnych i niepolar- nych, w bis(trifluorometylosulfonylo)imidku triheksylo(tetradecylo)fosfoniowym. Deskryp- tory opisuj ˛ace soluty to tak˙ze ró˙znego rodzaju wła´sciwo´sci geometryczne, topologiczne i elektrostatyczne badanych zwi ˛azków. Jako deskryptor potraktowano równie˙z odwrotno´s´c temperatury wyra˙zonej w skali absolutnej. Wszystkie dost˛epne dane podzielono na dwa pod-

(18)

zbiory: zbiór ucz ˛acy, na podstawie którego wyznaczono parametry modelu i testuj ˛acy (wali- duj ˛acy), na podstawie którego sprawdzono jego mo˙zliwo´sci predykcyjne. Zbiór testuj ˛acy za- wierał zarówno dane dla solutów spoza zbioru ucz ˛acego, jak równie˙z dane zmierzone w innej temperaturze. Współczynniki korelacji mi˛edzy eksperymentalnymi a obliczonymi warto´scia- mi lnγ12 w zbiorze ucz ˛acym wynosz ˛a: 0.943 (T = 302.45 K), 0.950 (T = 322.35 K), 0.964 (T = 342.45 K). ´Srednie odchylenia wzgl˛edne mi˛edzy obliczonymi i eksperymentalnymi warto´sciami γ12 wynosz ˛a odpowiednio 221, 86.8 i 56.3% (warto´sci obliczone w ramach tej pracy). W przypadku zbioru testuj ˛acego, współczynniki korelacji s ˛a znacznie ni˙zsze: 0.729 (T = 303.15 K), 0.735 (T = 308.15 K), 0.744 (T = 313.15 K) i 0.742 (T = 318.15 K). Przez to ´srednie odchylenia wzgl˛edne mi˛edzy obliczonymi i eksperymentalnymi warto´sciami γ12 s ˛a bardzo wysokie i wynosz ˛a odpowiednio 67.5, 126.8, 103.6 i 135.6% (warto´sci obliczone w ramach tej pracy).

Oprócz liniowych metod QSPR, wyró˙znia si˛e metody, w których funkcja f w równa- niu (1.5) nie jest funkcj ˛a liniow ˛a wzgl˛edem deskryptorów. W ostatnim czasie, szczególnie du˙zo uwagi po´swi˛eca si˛e tzw. sztucznym sieciom neuronowym (ANN, ang. Artificial Neu- ral Networks). Metoda ta charakteryzuje si˛e o wiele wi˛ekszymi mo˙zliwo´sciami, je´sli chodzi zarówno o korelacje jak i przewidywanie ró˙znego typu wła´sciwo´sci. ANN opiera si˛e na rów- noczesnym przetwarzaniu informacji wej´sciowej (w tym kontek´scie – deskryptorów) przez jednostki zwane sztucznymi neuronami. Topologi˛e sieci neuronów, czyli sposób ich poł ˛a- czenia oraz kierunek przekazywania informacji mo˙zna zdefiniowa´c praktycznie w dowolny sposób. W przypadku zastosowa´n, których dotyczy ta praca sztuczne neurony uło˙zone s ˛a za- zwyczaj warstwowo, a przekazywanie informacji odbywa si˛e w jednym kierunku, tzn. od tak zwanej warstwy wej´sciowej (ang. input layer) do wyj´sciowej (ang. output layer). Przetwa- rzanie informacji wej´sciowej odbywa si˛e w tak zwanej warstwie ukrytej (ang, hidden layer), ewentualnie w kliku nast˛epuj ˛acych po sobie warstwach ukrytych. Szczegółowe informacje o sposobie przetwarzania danych wyj´sciowych znajduj ˛a si˛e w dalszej cz˛e´sci pracy (rozdz.

2.3, strona 28).

Metoda ANN została zastosowana do opisu danych γ12w układach z cieczami jonowymi dopiero jeden raz, w pracy Nami i współpracowników z roku 2011 [70]. Badacze zastosowali dwuwarstwow ˛asie´c neuronow ˛a. Dane wej´sciowe, zło˙zone z ró˙znych wła´sciwo´sci fizykoche- micznych solutów (np. obj˛eto´s´c krytyczna, czynnik acentryczny, g˛esto´s´c) oraz ró˙znych de- skryptorów kwantowo-mechanicznych cieczy jonowych (np. ´sredni moment dipolowy) były przetwarzane przez warstw˛e ukryt ˛a zło˙zon ˛a z 10 sztucznych neuronów. W sumie do opra- cowania modelu wzi˛eto ponad 900 punktów eksperymentalnych, w tym 19 imidazoliowych cieczy jonowych i 24 soluty. Kompletny zbiór danych podzielono na podzbiory ucz ˛acy (70%)

18

(19)

i testuj ˛acy (30%). Współczynniki korelacji wynosiły kolejno 0.9961 oraz 0.9938 natomiast odchylenie standardowe lnγ12 były na poziomie 0.103 i 0.128. Uzyskane współczynniki ko- relacji s ˛azatem bardzo wysokie. Wynika to jednak z faktu, ˙ze zarówno zbiór ucz ˛acy jak i wa- liduj ˛acy były niewielkich rozmiarów. Poza tym liczba parametrów modelu (tzw. wag) przy wybranej topologii sieci wynosiła 101, co daje ok. 6 punktów eksperymentalnych ze zbioru ucz ˛acego na parametr. Nie jest to du˙zo, bior ˛ac pod uwag˛e liczb˛e danych γ12dost˛epnych w li- teraturze. Niemniej jednak zastosowanie metody ANN do opisu tego typu danych wydaje si˛e by´c bardzo interesuj ˛ace i obiecuj ˛ace. Niestety autorzy omawianej pracy nie opublikowa- li wyznaczonych parametrów modelu. Nie było zatem mo˙zliwe dokładniejsze sprawdzenie jego dokładno´sci, w szczególno´sci obliczenie ´sredniego odchylenia wzgl˛ednego.

Mutelet i współpracownicy [68] zaproponowali w roku 2011 kolejn ˛a, tym razem opart ˛a na idei udziałów grupowych, metod˛e do przewidywania danych γ12. Jest to najobszerniej- szy i najwszechstronniejszy model opisany w literaturze. Szczegóły na jego temat zostan ˛a opisane w dalszej cz˛e´sci tekstu (rozdział 3.3), poniewa˙z model ten zostanie u˙zyty w analizie porównawczej opisanej w tej pracy.

1.4. Cel pracy

Modele opisane w powy˙zszym przegl ˛adzie literatury maj ˛a wiele wad, do których nale˙zy zaliczy´c przede wszystkim niewielki rozmiar baz danych eksperymentalnych γ12, na podsta- wie których wyznaczono parametry modeli, jak równie˙z ich ograniczone mo˙zliwo´sci predyk- cyjne (ograniczenie do kilku typów cieczy jonowych, brak zale˙zno´sci temperaturowej, trud- no dost˛epne deskryptory). Dlatego te˙z, celem tej pracy jest opracowanie oraz ocena nowego, pozbawionego tych wad, modelu matematycznego umo˙zliwiaj ˛acego obliczanie współczyn- ników aktywno´sci w rozcie´nczeniu niesko´nczenie wielkim ró˙znego typu zwi ˛azków w cie- czach jonowych. Zaproponowany model podany zostanie w postaci metody udziałów grupo- wych. Grupy funkcyjne zostały zdefiniowane w sposób, który umo˙zliwiał b˛edzie obliczanie danych γ12dla cieczy jonowych zbudowanych z ró˙znorodnych kationów i anionów. Parame- try nowego modelu zostan ˛a wyznaczone w oparciu o wszystkie dane eksperymentalne γ12 opublikowane w otwartej literaturze do ko´nca roku 2014.

(20)

20

(21)

Rozdział 2 Model

2.1. Baza danych

2.1.1. Informacje ogólne

Głównym celem, który musiał zosta´c osi ˛agni˛ety przed przyst ˛apieniem do prac nad no- wym modelem było zgromadzenie jak najobszerniejszego banku danych eksperymental- nych. Na podstawie dokładnego przegl ˛adu literatury opublikowanej w latach 2001–2014, udało si˛e zebra´c dane ł ˛acznie z 136 prac [14–35, 37–56, 71–164]. W sumie skatalogowano 26339 punktów eksperymentalnych zgromadzonych w 5863 zestawach „solut w cieczy jono- wej”. W bazie danych zgromadzono dane dla 161 cieczy jonowych, opartych na 71 kationach oraz 37 anionach. Szczegółowe podsumowanie bazy danych przedstawia Tabela 2.1. Jak nie- trudno zauwa˙zy´c, wi˛ekszo´s´c cieczy jonowych to ciecze oparte na kationach imidazoliowych.

Poza tym, w bazie znale´z´c mo˙zna równie˙z dane dla cieczy pirydyniowych, pirolidyniowych, amoniowych, fosfoniowych, piperydyniowych, morfoliniowych, izochinoliniowych i sulfo- niowych.

(22)

Tabela 2.1: Podsumowanie bazy danych współczynników aktywno´sci w rozcie´nczeniu niesko´nczenie wielkim (γ12) wykorzystanej podczas tworzenia tej pracy: liczba cieczy jonowych, soluty, liczba odniesie´n, zestawy i punkty danych; zakresy temperatury oraz γ12. Klasyfikacja przeprowadzona na podstawie kationu cieczy jonowej.

Rodzinaa Liczba danych T (K) ln γ12

Ciecze jonowe Soluty Odno´sniki Zestawy danychb Punkty eksperymentalneb min max min max

Im 90 120 81 2552 (377) 11019 (1153) 288.15 413.00 −3.689 9.191

Py 15 81 15 528 (4) 2975 (22) 297.00 378.15 −2.408 6.279

Quin 2 53 2 89 (0) 505 (0) 308.15 368.15 −0.994 4.654

Pyr 15 76 15 704 (17) 3481 (57) 298.15 373.15 −1.444 6.422

Pip 7 65 6 324 (0) 1879 (0) 308.15 368.15 −1.457 6.188

Bicyc 2 69 2 92 (0) 437 (0) 313.15 363.15 −1.313 3.938

Mo 3 63 3 185 (0) 1107 (0) 318.15 368.15 −1.737 5.666

N 13 100 9 516 (13) 1908 (39) 243.55 396.15 −4.605 8.284

P 13 67 11 402 (28) 1418 (89) 298.15 373.15 −3.507 6.799

S 1 32 1 32 (0) 250 (0) 298.15 368.15 −0.238 4.875

Ł ˛acznie 161 126 136 5424 (439) 24979 (1360) 243.55 413.00 −4.605 9.191

aLegenda: Im, imidazoliowe; Py, pirydyniowe; Quin, izochinolinowe; Pyr, pirolidyniowe, Pip, piperydyniowe; Bicyc, amoniowe bicykliczne; Mo, morfoliniowe; N, amoniowe; P, fosfoniowe; S, sulfoniowe.

bLiczb˛e zestawów danych/punktów eksperymentalnych wył ˛aczonych z procesu tworzenia modelu podano w nawiasach.

22

(23)

2.1.2. Format danych

Baz˛e danych zorganizowano w postaci pliku tekstowego. Format przechowywania da- nych został zaprojektowany w ramach tej pracy. Operacje odczytu/zapisu i przetwarzania danych były wykonywane przy pomocy skryptów zaprojektowanych i zaprogramowanych (równie˙z w ramach pracy) w ´srodowisku obliczeniowym MATLAB (wersja 2013a).

Ka˙zdy zestaw danych został oznaczony nagłówkiem składaj ˛acym si˛e z: tagu wskazuj ˛ace- go czy zestaw uwzgl˛edniony zostanie w procesie tworzenia modelu, nazwy cieczy jonowej, nazwy solutu, odno´snika literaturowego. Nast˛epnie podano tabel˛e danych eksperymental- nych, gdzie elementy pierwszej i drugiej kolumny przedstawiaj ˛a odpowiednio temperatur˛e pomiaru w skali absolutnej oraz warto´s´c współczynnika aktywno´sci w rozcie´nczeniu nie- sko´nczenie wielkim.

2.1.3. Przegl ˛ ad i ewaluacja danych

Podczas tworzenia bazy danych zauwa˙zono, ˙ze w przypadku niektórych par ciecz jonowa + solut, dost˛epnych jest kilka zestawów danych opublikowanych przez niezale˙znych auto- rów. Jak si˛e jednak okazało, dane te w wi˛ekszo´sci przypadków rozbie˙zne. Ilustruje to Rysu- nek 2.1, na których przedstawiono dane γ12 1-heksenu w cieczy jonowej [C4C1Im][NTf2], opublikowane przez badaczy niemieckich [157,164] i chi´nskich [144]. Konieczny okazał si˛e zatem dodatkowy przegl ˛ad zebranych danych oraz ich ewaluacja według ustalonych i do- brze zdefiniowanych kryteriów. Niestety, ustalenie takich kryteriów nie było łatwe, przede wszystkim dane zostały wyznaczone t ˛a sam ˛a technik ˛a pomiarow ˛a (metoda chromatogra- ficzne). Ró˙znic mo˙zna by zatem doszukiwa´c si˛e w czysto´sci zarówno cieczy jonowej jak i solutów. Niestety, w wi˛ekszo´sci prac autorzy takich danych nie przedstawiali, co czyniło to (jak˙ze przecie˙z wa˙zne) kryterium bezu˙zytecznym. Oczywi´scie, mo˙zna by takie niedokładnie opisane dane odrzuci´c od razu. Spowodowałoby to jednak znacz ˛ace zmniejszenie rozmiaru bazy danych, co ograniczyłoby pó´zniej mo˙zliwo´sci predykcyjne modelu. Jako kryterium akceptacji lub odrzucenia danych przyj˛eto zatem spójno´s´c w ˛atpliwych danych z danymi opublikowanymi dla podobnych zwi ˛azków, na przykład w obr˛ebie szeregu homologiczne- go. Przykład opisanego post˛epowania przedstawia Rysunek 2.2. Jak wynika z Tabeli 2.1, na podstawie przyj˛etego post˛epowania odrzucono ł ˛acznie 1360 punktów eksperymentalnych zebranych w 439 zbiorach danych, co stanowi ok. 5% wszystkich danych zgromadzonych w bazie.

(24)

Rysunek 2.1: Zestawienie danych eksperymentalnych dla mieszaniny cieczy jonowej [C4C1Im][NTf2] z 1–heksenem opublikowanych przez trzy zespoły. Kolorem czarnym ozna- czono dane opublikowane przez zespół Heintz’a [158], kolorem czerwonym oznaczono dane opublikowane przez zespół Zhang’a [144] natomiast kolorem niebieskim oznaczono dane opublikowane przez zespół Krummen’a [164]

.

2.2. Opis układu {ciecz jonowa + solut}

2.2.1. Ciecze jonowe

Do opisu cieczy jonowych zaadoptowano ide˛e udziałów grupowych. W pierwszym eta- pie, podzielono ciecze jonowe na kationy i aniony, a nast˛epnie utworzono baz˛e jonów. Baz˛e t˛e zorganizowano w formie osobnego pliku tekstowego. Ka˙zdemu z jonów przypisano na- st˛epuj ˛ace dane: indywidualne oznaczenie umo˙zliwiaj ˛ace identyfikacj˛e jonu w procesie prze- twarzania danych, mas˛e cz ˛asteczkow ˛a oraz udziały grupowe (identyfikator grupy plus liczba jej wyst ˛apie´n w strukturze jonu).

W celu uzyskania mo˙zliwie jak najdokładniejszego a jednocze´snie najwszechstronniej- szego opisu, zdefiniowano w sumie 71 grup funkcyjnych. W obr˛ebie zbioru wszystkich grup, wyró˙zni´c mo˙zna trzy zasadnicze rodzaje grup: rdzenie kationów (lub całe kationy), rdzenie anionów (lub całe aniony) oraz grupy podstawników.

Warto wspomnie´c, ˙ze w ramach pracy przetestowano ró˙zne zestawy grup funkcyjnych, 24

(25)

Rysunek 2.2: Zestawienie warto´sci γ12zmierzonych w temperaturze T = 323.15K dla mie- szanin szeregu cieczy jonowych [CnC1Im][NTf2] (n - długo´s´c ła´ncucha podstawnikowego) z 1-heksenem. Na podstawie zestawienia odrzucono dane opublikowane w 2007 roku przez Zhang’a [144] oznaczone kolorem czerwonym. Do dalszej korelacji dopuszczono punkty opublikowane przez zespoły Kato [157] (punkty czarne) i Krummen’a [164](punkty niebie- skie)

.

które umo˙zliwiały opis wszystkich zgromadzonych jonów. W szczególno´sci sprawdzono równie˙z mo˙zliwo´s´c zastosowania mniejszej liczby grup, np. poprzez rozło˙zenie pier´scieni kationów na mniejsze fragmenty. Jednak˙ze zastosowanie stosunkowo niewielkich grup nie prowadziło do wyników o zadowalaj ˛acej dokładno´sci. Ponadto takie podej´scie uniemo˙zli- wiało rozró˙znienie ró˙znego rodzaju izomerów (szczególnie je´sli chodzi o kationy). Zapro- ponowany podział na grupy rozwi ˛azuje problem nierozró˙znialno´sci izomerów, a dodatkowo poprzez wprowadzenie pewnych specjalnych grup umo˙zliwia uwzgl˛ednienie tzw. efektów s ˛asiedztwa (ang. proximity effects), które w przypadku układów tak zło˙zonych jak te z cie- czami jonowymi, maj ˛a kluczowy wpływ na ich wła´sciwo´sci fizykochemiczne.

Dla kilku typów kationów i anionów zdefiniowanych zostało wi˛ecej ni˙z jedna grupa (je- den rdze´n). Przykładem mog ˛a by´c tu n-alkilosiarczany, do opisu których wprowadzono dwie grupy. I tak grupa oznaczona symbolem [CH3SO4] została przypisana anionowi metylosiar-

(26)

czanowemu, podczas gdy dla alkilosiarczanów z dłu˙zszym podstawnikiem alkilowym zde- finiowano grup˛e [CH2SO4], obejmuj ˛ac ˛a grup˛e siarczanow ˛a oraz przył ˛aczon ˛a do niej bezpo-

´srednio grup˛e metylenow ˛a. Sens takiego podziału polega na uwzgl˛ednieniu ró˙znic pomi˛edzy wła´sciwo´sciami grupy metylowej i metylenowej przył ˛aczonych bezpo´srednio do atomu tle- nu w anionie siarczanowym. W podobny sposób zdefiniowano grupy dla karboksylanów i dialkilofosforanów. Analogiczne post˛epowanie w przypadku kationów doprowadziło na przykład do zdefiniowania ró˙znych grup na przykład dla amoniowych cieczy jonowych ró˙z- ni ˛acych si˛e liczb ˛a podstawników. Grupy zdefiniowane dla tej rodziny kationów to: grupa [N1]+opisuj ˛aca kationy z jednym podstawnikiem, RNH3+oraz grupa [N4]+opisuj ˛aca katio- ny R4N+. Analogicznie zdefiniowano grupy dla ró˙znie podstawionych kationów imidazolio- wym i pirydyniowych.

Je´sli chodzi o grupy podstawników, to zdefiniowano je w ten sposób, ˙zeby mo˙zliwe by- ło rozró˙znienie fragmentów wyst˛epuj ˛acych w strukturach liniowych i rozgał˛ezionych (np.

CH2w prostych podstawnikach alkilowych przy kationie) i pier´scieniowych – zarówno tych alifatycznych (np. grupa cycC-CH2) jak i aromatycznych (np. grupa aC-CH2). Dodatkowo wprowadzono indywidualne grupy dla fragmentów przył ˛aczonych bezpo´srednio do hetero- atomów w cz ˛asteczkach kationów (N, S, P). Na przykład grupa aN-CH2przypisana do grupy metylenowej przył ˛aczonej bezpo´srednio do atomu azotu w pier´scieniu aromatycznym. Ce- lem takiego post˛epowania było wyszczególnienie zmian wła´sciwo´sci (np. zmiana geometrii, rozkładu ładunku elektrycznego) danej grupy (w tym przypadku CH2) w stosunku do tej samej grupy poł ˛aczonej z atomem w˛egla.

Kompletna lista grup funkcyjnych zdefiniowanych w ramach niniejszej pracy została przedstawiona w dodatku A. Przykładowy podział na grupy przedstawia Rysunek 2.3.

2.2.2. Soluty

W niniejszej pracy uwzgl˛edniono eksperymentalne warto´sci γ12 ró˙znych solutów roz- puszczonych w cieczach jonowych. Do zwi ˛azków tworz ˛acych baz˛e danych nale˙zy zaliczy´c alkany (proste i rozgał˛ezione), cykloalkany, w˛eglowodory aromatyczne, alkeny, alkiny, al- kohole, etery, aldehydy, ketony, estry i inne (np.kwasy karboksylowe, epoksydy, nitroetan, trietyloamina, tiofen i woda). W sumie zebrano dane dla 126 ró˙znych zwi ˛azków.

Aby opisa´c soluty wykorzystane podczas tworzenia tej pracy zastosowano deskryptory bazuj ˛acego na metodologii QSPR podej´scia LSER (ang. Linear Solvation Energy Relation- ship), opracowanego i opublikowanego przez Abrahama w roku 1993[165]. Pierwotna wer- sja LSER podstała w celu uzyskania jako´sciowego oraz ilo´sciowego opisu oddziaływa´n mi˛e- dzycz ˛asteczkowych pomi˛edzy faz ˛astacjonarn ˛a a solutem w procesach chromatograficznych.

26

(27)

Rysunek 2.3: Podział kationu i anionu na grupy funkcyjne zdefiniowane w niniejszej pracy na przykładzie cieczy jonowej [C4C1Im][C8SO4].

Uogólniona metoda LSER pozwala na korelacj˛e wła´sciwo´sci termodynamicznych reguluj ˛a- cych procesy transferu mi˛edzyfazowego solutu zwi ˛azanych z entalpi ˛a swobodn ˛a Gibbsa.

Przykładem takiej wła´sciwo´sci jest współczynnik podziału gaz-ciecz, KL. Model LSER dla tej konkretnej wła´sciwo´sci reprezentowany jest przez równanie:

logKL= c + eE + sS + aA + bB + lL (2.1)

Symbolami pogrubionymi oznaczono oryginalne deskryptory metody LSER charakteryzuj ˛a- ce soluty: E – nadmiarowa refrakcja molowa; S – dipolarno´s´c/polaryzowalno´s´c (umiej˛etno´s´c solutu do stabilizacji s ˛asiednich dipoli ze wzgl˛edu jego zdolno´s´c orientacji i oddziaływania indukcyjne), A, B – kwasowo´s´c i zasadowo´s´c wi ˛azania wodorowego, L – warto´s´c współ- czynnika podziału solutu mi˛edzy faz˛e gazow ˛a a ciekłym n–heksadekanem w temperaturze 298 K. Małymi literami oznaczono współczynniki charakterystyczne dla rozpuszczalnika (w kontek´scie niniejszej pracy – cieczy jonowej): c – stała modelu ustalana empirycznie;

e, s, a, b, l – współczynniki okre´slaj ˛ace warto´sci udziałów wła´sciwo´sci komplementarnych cieczy jonowych, gdzie e – udział tendencji do oddziaływania mi˛edzy elektronami π a wol- nymi parami elektronowymi, s – udział oddziaływa´n mi˛edzy typami dipoli, a – udział zasa-

(28)

dowo´sci wi ˛aza´n wodorowych, b – udział kwasowo´sci wi ˛aza´n wodorowych, l – miara zdol- no´sci fazy do rozró˙zniania homologów w szeregach homologicznych.

Okazuje si˛e, ˙ze współczynnik podziału KL mo˙zna powi ˛aza´c ze współczynnikiem aktyw- no´sci w rozcie´nczeniu niesko´nczenie wielkim. Oznacza to, ˙ze równanie (2.1) mo˙zna zasto- sowa´c równie˙z do korelacji danych γ12, pod warunkiem, ˙ze znane s ˛a warto´sci deskryptorów E, S, A, B, L dla znacznej liczby solutów. Kompletn ˛a list˛e deskryptorów dla solutów rozwa-

˙zanych w tej pracy mo˙zna odnale´z´c w oryginalnej pracy Abrahama [165].

2.3. Sztuczne sieci neuronowe

2.3.1. Informacje ogólne

Sztuczna sie´c neuronowa (w dalszej cz˛e´sci tekstu stosowany b˛edzie angielski skrót ANN) to algorytm ucz ˛acy zainspirowany budow ˛a o´srodkowego układu nerwowego. Główne podo- bie´nstwa pomi˛edzy struktur ˛a biologiczn ˛a mózgu a ANN to mi˛edzy innymi warstwowy układ jednostek składowych (odpowiednio neuronów i sztucznych neuronów) oraz sposób prze- twarzania informacji przez te jednostki. Sztuczne neurony uło˙zone w warstw˛e zbieraj ˛a dane wej´sciowe z poprzedniej warstwy, a nast˛epnie przetwarzaj ˛a je przy pomocy uprzednio zdefi- niowanych funkcji przej´scia, wykorzystuj ˛ac przy tym zbiór parametrów charakterystycznych dla danego problemu. Przetworzone dane mog ˛a zosta´c podane do kolejnej warstwy w celu dalszego przetwarzania, lub w szczególno´sci przetworzone do ko´ncowej postaci wyj´sciowej.

Warto´sci parametrów sieci (wag) przypisane s ˛a do ka˙zdego ze sztucznych neuronów, a w zasadzie do poł ˛acze´n pomi˛edzy nimi. Warto´sci wag s ˛a na ogół parametrami czysto em- pirycznymi. Ogólnie rzecz bior ˛ac, s ˛a to współczynniki skomplikowanego równania matema- tycznego dopasowane do pewnych docelowych warto´sci wyj´sciowych zmiennych (target) w procesie optymalizacji nieliniowej. W ramach terminologii ANN, optymalizacj˛e (dopaso- wywanie) wag okre´sla si˛e mianem uczenia sieci.

W zale˙zno´sci od sposobu poł ˛aczenia sztucznych neuronów oraz kierunku przepływu in- formacji przez sie´c, wyró˙zni´c mo˙zna ró˙znego rodzaju ANN. W szczególno´sci jednokierun- kowe (ang. feedforward) sztuczne sieci neuronowe s ˛a szeroko wykorzystywane w proble- mach aproksymacji skomplikowanych zale˙zno´sci pomi˛edzy wieloma zmiennymi. Dotyczy to równie˙z wielu problemów in˙zynierii chemicznej oraz innych gał˛ezi chemii stosowanej.

W tym rodzaju sieci przepływ informacji odbywa si˛e wył ˛acznie w jednym kierunku – w to- pologii sieci nie wyst˛epuj ˛a ˙zadne zawrócenia lub p˛etle. Dane wej´sciowe przechodz ˛a przez kolejne warstwy neuronów, trafiaj ˛ac ostatecznie do warstwy wyj´sciowej. Najcz˛e´sciej stosuje

28

(29)

si˛e sieci dwuwarstwowe zło˙zone tylko z jednej warstwy ukrytej oraz warstwy wyj´sciowej.

W dalszej cz˛e´sci tekstu przedstawiono proces przetwarzania danych wej´sciowych w wyj-

´sciowe przy pomocy tego typu sieci.

Dane wej´sciowe stanowi ˛a R-elementowy wektor o składowych rzeczywistych, oznacza- ny odt ˛ad jako x = [x1, . . . , xR]T (gdzieT oznacza transpozycj˛e). Dane wyj´sciowe to z kolei warto´sci rzeczywiste, oznaczone symbolem y. Niech warstwa ukryta rozwa˙zanej sieci b˛e- dzie zło˙zona z S sztucznych neuronów. Liczba neuronów warstwy wyj´sciowej ma wymiar sygnału wyj´sciowego — w tym przypadku 1 (y jest wielko´sci ˛a skalarn ˛a). Rozwa˙zana sie´c ma zatem topologi˛e „R–S–1”.

Proces obliczania warto´sci wyj´sciowej y przez jednokierunkow ˛a sie´c neuronow ˛a rozpo- czyna si˛e od przetworzenia danych wej´sciowych x przez neurony z warstwy ukrytej (ozna- czonej jako warstwa nr 1). Efektem tej operacji jest wektor o1= [o11, . . . , o1S]T. Ka˙zdy sztucz- ny neuron warstwy ukrytej oblicza pojedyncz ˛a składow ˛a wektora o1, zgodnie z wzorem

o1j= f1j n1j

( j = 1, . . ., S) (2.2)

gdzie fj1oznacza funkcj˛e przej´scia j-tego neuronu w pierwszej warstwie, natomiast n1j ozna- cza wypadkow ˛a warto´s´c wej´sciow ˛a dla j-tego neuronu obliczan ˛a jako:

n1j=

R i=1

w1jixi+ b1j ( j = 1, . . . , S) (2.3)

Symbole w1ji oraz b1j wyst˛epuj ˛ace w powy˙zszej zale˙zno´sci oznaczaj ˛a parametry charaktery- styczne sieci czyli wagi. Zazwyczaj ta sama funkcja przej´scia u˙zywana jest dla wszystkich sztucznych neuronów w danej warstwie, tzn. f11 = f21 = . . . = fS1 ≡ f1. Stosuj ˛ac notacj˛e wektorow ˛a, mo˙zna zapisa´c równania (2.2) i (2.3) w zwi˛ezłej postaci:

o1= f1(W1x+ b1) (2.4)

gdzie W1i b1to macierze wag o wymiarach odpowiednio S × R i S × 1. Analogicznie otrzy- mywane s ˛a dane wyj´sciowe z drugiej warstwy, tj. o2. W tym wypadku danymi wej´sciowymi jest jednak wektor wyj´sciowy z poprzedniej warstwy, czyli o1:

o2= f2(W2o1+ b2) (2.5)

Analogicznie dla kolejnych warstw. W szczególno´sci, dla sieci dwuwarstwowych rozwa˙za- nych w tej pracy o21= y, natomiast wymiar macierzy wag W2wynosi 1×S. Ponadto b2= b21.

(30)

Podsumowuj ˛ac, ogólna reguła odwzorowania x 7→ y przedstawia si˛e wzorem:

y= f2[W2f1(W1x+ b1) + b21] (2.6)

W równaniu (2.6) macierze wag (W1, b1, W2, b2) zawieraj ˛ał ˛acznie S(R+2)+1 elementów.

Dodatkowo, przedstawion ˛a sie´c charakteryzuj ˛a dwie funkcje przej´scia, jedna wektorowa f1 i jedna skalarna f2.

Proces uczenia sieci, tj. wyznaczania najlepszych wektorów wag, wymaga podania zesta- wu przykładowych danych wej´sciowych xi oraz odpowiadaj ˛acych im danych wyj´sciowych ti(i = 1, . . ., N). Ogólnie rzecz ujmuj ˛ac uczenie sieci polega na dopasowaniu wag do zbioru danych (xi,ti). Dopasowanie polega na otrzymaniu takich warto´sci wag, które minimalizu- j ˛a tzw. funkcj˛e celu opisuj ˛ac ˛a dokładno´s´c uczenia. Najcz˛e´sciej stosowan ˛a funkcj ˛a celu jest

´sredni bł ˛ad kwadratowy MSE (ang. mean square error) zdefiniowany jako

MSE = 1 N

N i=1

(ti− yi)2 (2.7)

Uczenie sieci sprowadza si˛e zatem do problemu nieliniowej metody najmniejszych kwa- dratów. W literaturze opisano szereg algorytmów słu˙z ˛acych do rozwi ˛azania tego problemu.

Najpopularniejszym jest algorytm Levenberga-Marquardta (LM)[166, 167] wykorzystuj ˛acy gradienty i jakobiany obliczone z wykorzystaniem techniki wstecznej propagacji bł˛edów.

Ka˙zdy algorytm ucz ˛acy (wł ˛aczaj ˛ac w to algorytm LM) jest zazwyczaj ł ˛aczony z krzy-

˙zow ˛a metod ˛a walidacji zwan ˛a metod ˛a „wczesnego zatrzymania” (ang. early stop) procesu uczenia. W metodzie tej, kompletny zbiór danych wej´sciowych {(xi,ti) : i = 1, . . . N}) dzie- li si˛e na trzy rozł ˛aczne podzbiory. Pierwszy podzbiór (na ogół ok. 80–90%), to tak zwany zbiór ucz ˛acy. Dane z tego zbioru u˙zywane s ˛a bezpo´srednio w procesie dopasowywania wag.

Drugi i trzeci podzbiór (5–10% w przypadku w ka˙zdym z nich) to zbiory waliduj ˛acy i testu- j ˛acy. MSE zbioru waliduj ˛acego jest na bie˙z ˛aco monitorowany podczas procesu uczenia sieci.

W typowych warunkach uczenia, obserwuje si˛e spadek MSE w kolejnych iteracjach, zarów- no je´sli chodzi o zbiór ucz ˛acy jak i waliduj ˛acy. Jednak˙ze, pocz ˛awszy od pewnej iteracji MSE zbioru walidacyjnego mo˙ze zacz ˛a´c wzrasta´c. Proces taki nazywa si˛e „przeuczeniem” sieci.

Je˙zeli „przeuczenie” nast˛epuje przez okre´slon ˛a liczb˛e kolejnych iteracji, to proces uczenia sieci zostaje zatrzymany, a wagi przypisane iteracji odpowiadaj ˛acej najni˙zszej warto´sci MSE zbioru ucz ˛acego zostaj ˛a zwrócone jako warto´sci optymalne. Z drugiej strony, proces ucze- nia mo˙ze by´c zatrzymany je´sli liczba iteracji przekroczy zało˙zon ˛a odgórnie warto´s´c, b ˛ad´z warto´s´c MSE spadnie poni˙zej warto´sci zdefiniowanej przed rozpocz˛eciem procesu uczenia.

30

(31)

Dane ze zbioru testuj ˛acego nie s ˛a u˙zywane zarówno w procesie uczenia jak i walidacji.

MSE obliczone po tym zbiorze jest miar ˛a dokładno´sci i mo˙zliwo´sci predykcyjnych modelu.

Oczywi´scie, dobrze nauczona sie´c to taka, dla której MSE zbioru testuj ˛acego jest zbli˙zona do MSE zbioru ucz ˛acego.

2.3.2. Implementacja

Dane wej´sciowe i wyj´sciowe

Celem niniejszej pracy jest opracowanie modelu, przy pomocy którego mo˙zliwe b˛edzie obliczanie zale˙zno´sci temperaturowej współczynnika aktywno´sci w rozcie´nczeniu niesko´n- czenie wielkim na podstawie udziałów grupowych kationów i anionów cieczy jonowej oraz deskryptorów korelacji LSER solutów. Dlatego te˙z dane wej´sciowe x = [x1, . . . , xR]T i wyj-

´sciowe y zdefiniowane s ˛a nast˛epuj ˛aco:

x1= 1000/(T /K) (2.8a)

x1+i= ni i= (1, . . ., NG) (2.8b)

xNG+2= E (2.8c)

xNG+3= S (2.8d)

xNG+4= A (2.8e)

xNG+5= B (2.8f)

xNG+6= L (2.8g)

y= ln γ12 (2.8h)

Symbol ni w równaniu (2.8b) oznacza liczb˛e wyst ˛apie´n grupy nr i w strukturze cieczy jonowej (kationu i/lub anionu; je´sli dana grupa nie wyst˛epuje, wówczas ni= 0), natomiast

(32)

NGoznacza liczb˛e grup (w tej pracy NG= 71).

Funkcje przej´scia

Funkcje przej´scia dla warstwy ukrytej i wej´sciowej (odpowiednio f1i f2), których u˙zyto w procesie uczenia maj ˛a posta´c:

f1(t) = tanht = et− e−t

et+ e−t (2.9a)

f2(t) = t (2.9b)

S ˛a to typowe funkcje stosowane powszechnie przy zastosowaniu sztucznych sieci neurono- wych jako narz˛edzia do aproksymacji funkcji. W przypadku zastosowania tego typu funkcji bardzo cz˛esto (w tym równie˙z w tej pracy) stosuje si˛e normalizacj˛e danych wej´sciowych i wyj´sciowych do zakresu [−1, 1].

Parametry procesu uczenia

W ramach tej pracy poł ˛aczono równania (2.6), (2.8) i (2.9) w celu opracowania mode- lu ł ˛acz ˛acego sztuczne sieci neuronowe, metod˛e udziałów grupowych oraz podej´scie LSER.

Proces uczenia sieci przeprowadzono ł ˛acz ˛ac algorytm LM i kryterium wczesnego zatrzyma- nia. Maksymaln ˛a liczb˛e iteracji ustalono na 1000, natomiast liczb˛e kolejnych iteracji, dla których MSE zbioru waliduj ˛acego mogło wzrasta´c ustalono na 10.

Podział na zbiory: ucz ˛acy, waliduj ˛acy i testuj ˛acy

Do procesu uczenia sieci wykorzystano ł ˛acznie 24979 punktów eksperymentalnych. W zbio- rze ucz ˛acym znalazło si˛e 22482 punktów (90%). W zbiorze waliduj ˛acym i testuj ˛acym (5%

ka˙zdy) zebrano odpowiednio 1248 i 1249 punktów. W szczególno´sci, do zbioru ucz ˛acego, wł ˛aczono punkty eksperymentalne dla cieczy jonowych zawieraj ˛ace grupy funkcyjne, któ- rych liczba wyst ˛apie´n w bazie danych była ni˙zsza ni˙z 100. Krok ten miał na celu unikni˛ecie

„niedouczenia” modelu przedstawionego równaniem 2.6. Pozostałe punkty zostały rozdzie- lone w sposób losowy pomi˛edzy wszystkimi trzema podzbiorami.

32

(33)

Topologia sieci (liczba neuronów w warstwie ukrytej)

Kluczowym parametrem ka˙zdej dwuwarstwowej jednokierunkowej sieci neuronowej jest liczba neuronów w warstwie ukrytej, S. Niestety, nie istniej ˛a uniwersalne i ´scisłe zasady przypisywania warto´sci S do danego problemu. Ogólnie przyjmuje si˛e, ˙ze optymalna liczba neuronów warstwy ukrytej zale˙zy w pewien zło˙zony sposób od wymiarów danych wej´scio- wych i wyj´sciowych, ilo´sci danych wej´sciowych, rodzaju funkcji przej´scia, algorytmu ucz ˛a- cego, itp. Bardzo wa˙znym parametrem jest równie˙z liczba wag sieci. Rzecz jasna, nie powin- na ona przekracza´c liczby próbek w zbiorze ucz ˛acym Nu. Ogólnie przyjmuje si˛e, ˙ze stosunek Nudo liczby wag, zdefiniowany jako

r= Nu

S(R + 2) + 1 (2.10)

powinien by´c mo˙zliwie najwi˛ekszy, w celu unikni˛ecia przeuczenia sieci. Z drugiej strony, zmniejszanie liczby wag prowadzi do pogorszenia dokładno´sci („niedouczenia”). Przy wy- borze optymalnej warto´sci r konieczne staje si˛e zatem doj´scie do pewnego konsensusu. Ró˙z- ni autorzy rekomenduj ˛a ró˙zne warto´sci r. Najcz˛e´sciej przytaczanym jest jednak kryterium Klimasauskasa [168], według którego warto´s´c r powinna wynosi´c co najmniej 5.

W niniejszej pracy, R = 77 oraz Nu = 22482. Mo˙zna zatem z łatwo´sci ˛a wykaza´c, ˙ze dla rmin= 5, najwi˛eksza mo˙zliwa liczba sztucznych neuronów w warstwie ukrytej wynosi Smax

= 57. Optymalna warto´s´c S została ustalona na podstawie badania MSE sieci z ró˙znymi liczbami neuronów w warstwie ukrytej.

Oprogramowanie

Wszystkie obliczenia i operacje zwi ˛azane ze sztucznymi sieciami neuronowymi wyko- nano przy pomocy pakietu obliczeniowego MATLAB, wersja 2013a, na licencji Politechniki Warszawskiej. W szczególno´sci zastosowano metody dodatku Neural Network Toolbox takie jak na przykład net, feedforwardnet, train. Opracowanie zbiorcze wyników równie˙z wyko- nano w programie MATLAB. Ró˙znego rodzaju podprogramy, skrypty i funkcje pomocnicze zostały zaprojektowane i napisane w ramach tej pracy.

(34)

34

Cytaty

Powiązane dokumenty

Od tego czasu żadnych egzaminów zaległych z mechaniki ogólnej studenci Wydziału Mechanicznego przedemng, nie

Warstwy utworzone w procesie azotowania jarzeniowego charakteryzują się wysoką odpornością na ścieranie, wytrzymałością zmęczeniową oraz lepsza

• Całki nieoznaczone funkcji jednej zmiennej, podstawowe metody całkowania funkcji oraz sens geometryczny całki oznaczonej funkcji w przedziale. • Metody rozwiązywania

W zależności od regionu geograficznego stosuje się różne surowce do produkcji biopaliw.. W tabeli poniżej zostały zebrane najważniejsze surowce do produkcji etanolu

Jedną z ważniejszych reakcji z użyciem kwasów boronowych jest reakcja Suzuki-Miyaura, w której tworzone jest nowe wiązania węgiel-węgiel, a jej produktami są związki

Przeprowadzono badania dotyczące reakcji otrzymywania wodorotlenku magnezu o wysokiej czystości w wyniku jego strącania z roztworów wodnych soli (azotan, chlorek,

Treść rozprawy jest zgodna z jej tematem i dotyczy bardzo aktualnego problemu badawczego, albowiem obecnie wytwarzane stopy cynku nie spełniają wymagań w zakresie

Wykres potencjał korozyjny - czas dla próbki SW5-TAN-POW (przed pomiarem krzywej