• Nie Znaleziono Wyników

The Intersection of Planning and Learning

N/A
N/A
Protected

Academic year: 2021

Share "The Intersection of Planning and Learning"

Copied!
3
0
0

Pełen tekst

(1)

Delft University of Technology

The Intersection of Planning and Learning

Moerland, T.M.

DOI

10.4233/uuid:5437884e-0078-4b36-b2c7-c6edfea3b418

Publication date

2021

Document Version

Final published version

Citation (APA)

Moerland, T. M. (2021). The Intersection of Planning and Learning.

https://doi.org/10.4233/uuid:5437884e-0078-4b36-b2c7-c6edfea3b418

Important note

To cite this publication, please use the final published version (if applicable).

Please check the document version above.

Copyright

Other than for strictly personal use, it is not permitted to download, forward or distribute the text or part of it, without the consent of the author(s) and/or copyright holder(s), unless the work is under an open content license such as Creative Commons. Takedown policy

Please contact us and provide details if you believe this document breaches copyrights. We will remove access to the work immediately and investigate your claim.

This work is downloaded from Delft University of Technology.

(2)

Propositions

accompanying the dissertation

T

HE

I

NTERSECTION OF

P

L ANNING AND

L

EARNING

by

Thomas M

OERL AND

Thesis

1. Reinforcement learning and MDP planning share the same algorithmic design space (Ch. 3), and the same design space as all planning methods.

2. Rational sequential decision-making agents must be able to simulate the stochas-tic nature of their environment (Ch. 4 & 5).

3. Rational sequential decision-making agents need to combine atomic and general-izing representations (Ch. 6 & 7).

4. Reinforcement learning research should focus on redefining the MDP problem space through abstraction and conditioning on goals (Ch. 4).

5. Intelligence originates from optimization.

6. An important benefit of reinforcement learning in machines is that they, as op-posed to humans, do not require “sandwich methods” to integrate negative feed-back.

7. Progress in artificial intelligence will cause a “survival of the stupidest” in humans. 8. The course of a human life is primarily determined by randomness.

9. The global connectedness of society causes a dangerous loss of exploration. 10. Artificial intelligence research will in time help us understand the

phenomenolog-ical side of consciousness.

These propositions are regarded as opposable and defendable, and have been approved as such by the promotors Prof. C.M. Jonker and Prof. A. Plaat

(3)

Stellingen

behorende bij het proefschrift

T

HE

I

NTERSECTION OF

P

L ANNING AND

L

EARNING

door

Thomas M

OERL AND

1. Reinforcement learning en MDP plannen delen dezelfde algoritmische ruimte (Hfd. 3), en dezelfde algoritmische ruimte als alle planningsmethoden.

2. Rationele agenten in sequentiële beslisproblemen moeten in staat zijn om de sto-chasticiteit van de omgeving te simuleren (Hfd. 4 & 5).

3. Rationele agenten in sequentiële beslisproblemen moeten atomische en generali-serende representaties combineren (Hfd. 6 & 7).

4. Reinforcement learning onderzoek moet focussen op herdefinitie van de MDP probleemruimte door middel van abstractie and het conditioneren op doelen (Hfd. 4).

5. Intelligentie komt voort uit optimalisatie.

6. Een belangrijk voordeel van reinforcement learning in machines is dat ze, in te-genstelling to mensen, geen “sandwich methodes” nodig hebben om negatieve feedback te integreren.

7. Voortuitgang in kunstmatige intelligentie zal voor mensen tot “overleving van de domste” leiden.

8. Het verloop van een menselijk leven wordt hoofdzakelijk door toeval bepaald. 9. De wereldwijde verbondenheid van de maatschappij leidt tot een gevaarlijk verlies

van exploratie.

10. Kunstmatige intelligentie onderzoek zal ons op termijn helpen om de fenomeno-logische kant van bewustzijn te begrijpen.

Deze stellingen worden opponeerbaar en verdedigbaar geacht en zijn als zodanig goedgekeurd door de promotoren Prof. C.M. Jonker and Prof. A Plaat.

Cytaty

Powiązane dokumenty

Omawiano sprawę związaną z powoływaniem i odwoływaniem członków ko- misji egzaminacyjnej ds. zajmowano się m.in. prob- lematyką przeprowadzenia egzaminów adwokackich,

Zamyślam w kwietniu r. przedsięwziąść podróż uczoną do ob­ cych krajów, której głównym celem jest obeznanie się z teraźniejszym stanem Filozofii w Europie,

W stosunku do pomiarów poletkowych w górnej wypukłej części stoku war- tości erozji były wyższe w każdych warunkach opadowych, natomiast w środko- wej nieco wklęsłej

On 24 August 2012 an Executive Regulation of the Ministry of Labour and Social Policy dated 1 August 2012 took effect, which amends an Executive Regulation on the

In terms of natural and technical - operational parameters, the selection of an appropriate equipment for extinguishing forest fires is based on the parallel

terytorialnego, zadania samorządu terytorialnego, powiat metropolitalny. Ustawy o samorządzie gminnym, samorządzie powiatowym i samorządzie województwa zwane dalej ustawami

określany jest w literaturze między innymi jako człowiek prawdziwy (patrz Aleksan- der Zinowiew), homo russicus (patrz Aleksander Sołżenicyn), czy też człowiek żyjący zgodnie

By means of the velocity profiles (and possibly the density profiles) an impression can be obtained of the dispersion of pollutants in any of the above cases. All these and