IFT-4201 Apprentissage par renforcement
Outils théoriques expliquant les raisons, les conditions et les garanties de fonctionnement d'un algorithme; formulation d'un problème réel (instance d'apprentissage par renforcement interactif); caractérisation empirique des algorithmes; environnements simples (Multi-Armed Bandit) communément utilisés pour aborder des problèmes d'apprentissage par renforcement interactif; algorithmes fondamentaux (Upper Confidence Bound, Thompson Sampling) permettant d'aborder le compromis exploration-exploitation en apprentissage par renforcement; utilisation efficace de l'information structurelle par la régression paramétrique ou non et par les réseaux de neurones; variantes dans les dynamiques des environnements et applications associées, y compris l'optimisation bayésienne; prise de décision séquentielle dans les processus de décision markoviens (MDP).
Responsables
- Faculté des sciences et de génie
- Département d'informatique et de génie logiciel
Préalables
(GLO-2100 OU IFT-2008) ET (MAT-1200 OU MAT-2930 OU PHY-1001) ET (IFT-4102* OU GIF-4101*)
* Indique un préalable qui peut être suivi simultanément.
Cette activité est contributoire dans:
Cours équivalents ou jumelés ULaval
- IFT-7201 Apprentissage par renforcement Depuis l'hiver 2020
Les cours équivalents sont des activités de même cycle dont le contenu est identique ou très semblable. La réussite de l'un entraîne la reconnaissance de l'autre. Si, à l’une des sessions indiquées, vous avez réussi un cours équivalent, vous n’avez pas à vous inscrire au cours présenté sur cette page. Le cours équivalent vous sera reconnu.
Les cours jumelés sont des activités de cycles différents. Si vous avez suivi un cours de 1er cycle de niveau 4000, vous ne pouvez pas suivre le cours correspondant de niveau 6000 ou 7000 si vous poursuivez des études au 2e ou au 3e cycle et vous ne pouvez pas demander à la direction de votre programme de le reconnaître.
Cette page constitue la description officielle de cette activité. L'Université Laval se réserve le droit de modifier l'activité sans préavis. Tous les horaires indiqués sont sujets à changement.
Répartition hebdomadaire
- 3h Cours
- 0h Laboratoire ou travaux pratiques
- 6h Travail personnel
- 9h Total
Horaire
Pour vous inscrire, accédez à monPortail.
Hiver 2025 – 1 section offerte
NRC 15923 Capacité maximale: 40 étudiants Enseignant: Audrey Durand
Plages horaires
-
- Type: Sur Internet
- Dates: Du 13 jan. 2025 au 25 avr. 2025
-
- Type: En classe
- Dates: Du 13 jan. 2025 au 25 avr. 2025
- Journée: Mardi
- Horaire: De 9h30 à 12h20
Automne 2023 – 1 section offerte
NRC 85775 Capacité maximale: 3 étudiants
Plages horaires
-
- Type: Sur Internet
- Dates: Du 5 sept. 2023 au 15 déc. 2023
-
- Type: En classe
- Dates: Du 5 sept. 2023 au 15 déc. 2023
- Journée: Jeudi
- Horaire: De 9h30 à 12h20
- Pavillon: Adrien-Pouliot
- Local: 2573
Automne 2022 – 1 section offerte
NRC 85843 Capacité maximale: 10 étudiants
Plage horaire
-
- Type: Classe virtuelle synchrone
- Dates: Du 6 sept. 2022 au 16 déc. 2022
- Journée: Jeudi
- Horaire: De 9h30 à 12h20