Simulation for Path Planning of SLOCUM Glider in Near-bottom Ocean Currents Using Heuristic Algorithms and Q-Learning
In: Defence science journal: DSJ, Band 65, Heft 3, S. 220-225
ISSN: 0011-748X
287748 Ergebnisse
Sortierung:
In: Defence science journal: DSJ, Band 65, Heft 3, S. 220-225
ISSN: 0011-748X
In: Defence science journal: a journal devotet to science & technology in defence, Band 65, Heft 3, S. 220-225
ISSN: 0011-748X
In: CAIE-D-23-04633
SSRN
In: SWEVO-D-24-01105
SSRN
SSRN
SSRN
In: CAIE-D-24-06108
SSRN
National audience ; Cet article présente les résultats expérimentaux obtenus avec une architecture originale permettant un apprentissage générique dans le cadre de processus décisionnels de Markov factorisés observables dans le désordre (PDMFOD). L'article décrit tout d'abord le cadre formel des PDMFOD puis le fonctionnement de l'algorithme, notamment le principe de parallélisation et l'attribution dynamique des récompenses. L'architecture est ensuite appliquée à deux problèmes de navigation, l'un dans un labyrinthe et l'autre dans un trafic routier (New York Driving). Les tests montrent que l'architecture permet effectivement d'apprendre une politique de décisions performante et générique malgré le nombre élevé de dimensions des espaces d'états des deux systèmes.
BASE
National audience ; Cet article présente les résultats expérimentaux obtenus avec une architecture originale permettant un apprentissage générique dans le cadre de processus décisionnels de Markov factorisés observables dans le désordre (PDMFOD). L'article décrit tout d'abord le cadre formel des PDMFOD puis le fonctionnement de l'algorithme, notamment le principe de parallélisation et l'attribution dynamique des récompenses. L'architecture est ensuite appliquée à deux problèmes de navigation, l'un dans un labyrinthe et l'autre dans un trafic routier (New York Driving). Les tests montrent que l'architecture permet effectivement d'apprendre une politique de décisions performante et générique malgré le nombre élevé de dimensions des espaces d'états des deux systèmes.
BASE
National audience ; Cet article présente les résultats expérimentaux obtenus avec une architecture originale permettant un apprentissage générique dans le cadre de processus décisionnels de Markov factorisés observables dans le désordre (PDMFOD). L'article décrit tout d'abord le cadre formel des PDMFOD puis le fonctionnement de l'algorithme, notamment le principe de parallélisation et l'attribution dynamique des récompenses. L'architecture est ensuite appliquée à deux problèmes de navigation, l'un dans un labyrinthe et l'autre dans un trafic routier (New York Driving). Les tests montrent que l'architecture permet effectivement d'apprendre une politique de décisions performante et générique malgré le nombre élevé de dimensions des espaces d'états des deux systèmes.
BASE
Blog: Cleaning up our nuclear past: faster, safer and sooner
Q & A with Jamie Matear, Director of Siting Coordination at Canada's Nuclear Waste Management Organization (NWMO) Jamie visited Nuclear Waste Services earlier this year as part of a collaboration and learning visit. We sat down with Jamie to find …
In: Journal of economic dynamics & control, Band 31, Heft 11, S. 3699-3722
ISSN: 0165-1889
In: Statistica Neerlandica, Band 44, Heft 3, S. 105-114
ISSN: 1467-9574
We present an asymptotically optimal Bayesian learning procedure for the (s, Q) inventory policy, for the case when the probability distribution of lead time demand is unknown. This distribution is not required to be a member of a certain family, and the maximal lead time demand is also allowed to be unknown. The algorithm developed for this purpose Is an extension of a standard iterative procedure, which in its original form ‐in spite of claims to the contrary‐might produce solution values that are arbitrarily far away from the optimal one.
SSRN
Working paper
In: Studies in second language learning and teaching: SSLLT, Band 12, Heft 1, S. 37-58
ISSN: 2084-1965
The present study employed an interpretive approach to investigate individual learners' viewpoints on foreign language learning boredom (FLLB). To this aim, a Q method, which shares features of both qualitative and quantitative research approaches, was used to explore 37 Iranian English as a foreign language (EFL) learners' perceptions of potential sources of boredom in the classroom. Nonprobability purposeful sampling was used to select participants from two private language institutes in Mashhad, Iran. A hybrid-type Q sampling was employed to produce 40 statements related to the sources of FLLB. Using PQ Method, an exclusive statistical package for Q methodology, the Q sorts were intercorrelated and factor-analyzed. Three factors were extracted and rotated using varimax rotation and hand adjustment. Factor arrays and qualitative analyses were utilized to find and interpret three different accounts of FLLB. The three factors showed that the students held three divergent prototypical points of view about the sources of boredom experienced in EFL learning in class: (a) teacher-induced boredom, (b) student-induced boredom, and (c) activity-induced boredom. The findings also showed that different learner prototypes experience FLLB distinctly. Thus teachers should consider using different strategies to prevent or reduce this negative emotion in the context of L2 learning since otherwise this process could be impeded.