Workshop

Reinforcement Learning for Real Life (RL4RealLife) Workshop

Yuxi Li ⋅ Emma Brunskill ⋅ MINMIN CHEN ⋅ Omer Gottesman ⋅ Lihong Li ⋅ Yao Liu ⋅ Zhiwei Tony Qin ⋅ Matthew Taylor

Project Page [ Contact: RL4RealLife@gmail.com ]

Abstract

Discover how to improve the adoption of RL in practice, by discussing key research problems, SOTA, and success stories / insights / lessons w.r.t. practical RL algorithms, practical issues, and applications with leading experts from both academia and industry @ NeurIPS 2022 RL4RealLife workshop.

Video

Chat is not available.

Schedule

Timezone: America/Los_Angeles

5:30 AM

posters (for early birds, optional)

6:25 AM

opening remarks

Video

6:31 AM

Invited talk: Outracing Champion Gran Turismo Drivers with Deep Reinforcement Learning

Peter Stone

Video

Link

7:01 AM

Invited talk: Scaling reinforcement learning in the real world, from gaming to finance to manufacturing

Robert Nishihara

Video

7:30 AM

Intro speaker

7:31 AM

Invited talk: Deep Reinforcement Learning for Real-World Inventory Management

Dhruv Madeka

Video

8:00 AM

Coffee break

8:20 AM

Panel RL Implementation

Xiaolin Ge ⋅ Alborz Geramifard ⋅ Kence Anderson ⋅ Craig Buhr ⋅ Robert Nishihara ⋅ Yuandong Tian

Video

9:10 AM

Panel RL Benchmarks

Minmin Chen ⋅ Pablo Samuel Castro ⋅ Caglar Gulcehre ⋅ Tony Jebara ⋅ Peter Stone

Video

10:00 AM

Lunch Break / Posters

11:31 AM

Invited talk AlphaTensor: Discovering faster matrix multiplication algorithms with RL

Matej Balog

Video

12:00 PM

Panel RL Theory-Practice Gap

Peter Stone ⋅ Matej Balog ⋅ Jonas Buchli ⋅ Jason Gauci ⋅ Dhruv Madeka

Video

12:55 PM

closing remarks

1:00 PM

Coffee break / Posters

1:30 PM

Posters

An Empirical Evaluation of Posterior Sampling for Constrained Reinforcement Learning

Danil Provodin ⋅ Pratik Gajane ⋅ Mykola Pechenizkiy ⋅ Maurits Kaptein

An Empirical Evaluation of Posterior Sampling for Constrained Reinforcement Learning

Danil Provodin ⋅ Pratik Gajane ⋅ Mykola Pechenizkiy ⋅ Maurits Kaptein

Video

MARLIM: Multi-Agent Reinforcement Learning for Inventory Management

Rémi Leluc ⋅ Elie Kadoche ⋅ Antoine Bertoncello ⋅ Sébastien Gourvénec

Video

MARLIM: Multi-Agent Reinforcement Learning for Inventory Management

Rémi Leluc ⋅ Elie Kadoche ⋅ Antoine Bertoncello ⋅ Sébastien Gourvénec

A Versatile and Efficient Reinforcement Learning Approach for Autonomous Driving

Guan Wang ⋅ Haoyi Niu ⋅ desheng zhu ⋅ Jianming HU ⋅ Xianyuan Zhan ⋅ Guyue Zhou

A Versatile and Efficient Reinforcement Learning Approach for Autonomous Driving

Guan Wang ⋅ Haoyi Niu ⋅ desheng zhu ⋅ Jianming HU ⋅ Xianyuan Zhan ⋅ Guyue Zhou

Video

Semi-analytical Industrial Cooling System Model for Reinforcement Learning

Yuri Chervonyi ⋅ Praneet Dutta

Video

Semi-analytical Industrial Cooling System Model for Reinforcement Learning

Yuri Chervonyi ⋅ Praneet Dutta

Structured Q-learning For Antibody Design

Alexander Cowen-Rivers ⋅ Philip John Gorinski ⋅ aivar sootla ⋅ Asif Khan ⋅ Jun WANG ⋅ Jan Peters ⋅ Haitham Bou Ammar

Video

Structured Q-learning For Antibody Design

Alexander Cowen-Rivers ⋅ Philip John Gorinski ⋅ aivar sootla ⋅ Asif Khan ⋅ Jun WANG ⋅ Jan Peters ⋅ Haitham Bou Ammar

Hierarchical Reinforcement Learning for Furniture Layout in Virtual Indoor Scenes

Xinhan Di ⋅ Pengqian Yu

Video

Hierarchical Reinforcement Learning for Furniture Layout in Virtual Indoor Scenes

Xinhan Di ⋅ Pengqian Yu

Learning an Adaptive Forwarding Strategy for Mobile Wireless Networks: Resource Usage vs. Latency

Victoria Manfredi ⋅ Alicia Wolfe ⋅ Xiaolan Zhang ⋅ Bing Wang

Video

Learning an Adaptive Forwarding Strategy for Mobile Wireless Networks: Resource Usage vs. Latency

Victoria Manfredi ⋅ Alicia Wolfe ⋅ Xiaolan Zhang ⋅ Bing Wang

Video

Safe Reinforcement Learning for Automatic Insulin Delivery in Type I Diabetes

Maxime Louis ⋅ Hector Romero Ugalde ⋅ Pierre Gauthier ⋅ Alice Adenis ⋅ Yousra Tourki ⋅ Erik Huneker

Video

Safe Reinforcement Learning for Automatic Insulin Delivery in Type I Diabetes

Maxime Louis ⋅ Hector Romero Ugalde ⋅ Pierre Gauthier ⋅ Alice Adenis ⋅ Yousra Tourki ⋅ Erik Huneker

Power Grid Congestion Management via Topology Optimization with AlphaZero

Matthias Dorfer ⋅ Anton R. Fuxjaeger ⋅ Kristián Kozák ⋅ Patrick Blies ⋅ Marcel Wasserer

Power Grid Congestion Management via Topology Optimization with AlphaZero

Matthias Dorfer ⋅ Anton R. Fuxjaeger ⋅ Kristián Kozák ⋅ Patrick Blies ⋅ Marcel Wasserer

Video

Multi-Agent Reinforcement Learning with Shared Resources for Inventory Management

Yuandong Ding ⋅ Mingxiao Feng ⋅ Guozi Liu ⋅ Wei Jiang ⋅ Chuheng Zhang ⋅ Li Zhao ⋅ Lei Song ⋅ Houqiang Li ⋅ Yan Jin ⋅ Jiang Bian

Video

Multi-Agent Reinforcement Learning with Shared Resources for Inventory Management

Yuandong Ding ⋅ Mingxiao Feng ⋅ Guozi Liu ⋅ Wei Jiang ⋅ Chuheng Zhang ⋅ Li Zhao ⋅ Lei Song ⋅ Houqiang Li ⋅ Yan Jin ⋅ Jiang Bian

Video

LibSignal: An Open Library for Traffic Signal Control

Hao Mei ⋅ Xiaoliang Lei ⋅ Longchao Da ⋅ Bin Shi ⋅ Hua Wei

Video

LibSignal: An Open Library for Traffic Signal Control

Hao Mei ⋅ Xiaoliang Lei ⋅ Longchao Da ⋅ Bin Shi ⋅ Hua Wei

Implementing Reinforcement Learning Datacenter Congestion Control in NVIDIA NICs

Benjamin Fuhrer ⋅ Yuval Shpigelman ⋅ Chen Tessler ⋅ Shie Mannor ⋅ Gal Chechik ⋅ Eitan Zahavi ⋅ Gal Dalal

Video

Implementing Reinforcement Learning Datacenter Congestion Control in NVIDIA NICs

Benjamin Fuhrer ⋅ Yuval Shpigelman ⋅ Chen Tessler ⋅ Shie Mannor ⋅ Gal Chechik ⋅ Eitan Zahavi ⋅ Gal Dalal

Provably Efficient Reinforcement Learning for Online Adaptive Influence Maximization

Kaixuan Huang ⋅ Yu Wu ⋅ Xuezhou Zhang ⋅ Shenyinying Tu ⋅ Qingyun Wu ⋅ Mengdi Wang ⋅ Huazheng Wang

Provably Efficient Reinforcement Learning for Online Adaptive Influence Maximization

Kaixuan Huang ⋅ Yu Wu ⋅ Xuezhou Zhang ⋅ Shenyinying Tu ⋅ Qingyun Wu ⋅ Mengdi Wang ⋅ Huazheng Wang

Video

Pareto-Optimal Diagnostic Policy Learning in Clinical Applications via Semi-Model-Based Deep Reinforcement Learning

zheng Yu ⋅ Yikuan Li ⋅ Joseph Kim ⋅ Kaixuan Huang ⋅ Yuan Luo ⋅ Mengdi Wang

Video

Pareto-Optimal Diagnostic Policy Learning in Clinical Applications via Semi-Model-Based Deep Reinforcement Learning

zheng Yu ⋅ Yikuan Li ⋅ Joseph Kim ⋅ Kaixuan Huang ⋅ Yuan Luo ⋅ Mengdi Wang

tinyMAN: Lightweight Energy Manager using Reinforcement Learning for Energy Harvesting Wearable IoT Devices

Toygun Basaklar ⋅ Yigit Tuncel ⋅ Umit Ogras

Video

tinyMAN: Lightweight Energy Manager using Reinforcement Learning for Energy Harvesting Wearable IoT Devices

Toygun Basaklar ⋅ Yigit Tuncel ⋅ Umit Ogras

Optimizing Audio Recommendations for the Long-Term

Lucas Maystre ⋅ Daniel Russo ⋅ Yu Zhao

Video

Optimizing Audio Recommendations for the Long-Term

Lucas Maystre ⋅ Daniel Russo ⋅ Yu Zhao

Controlling Commercial Cooling Systems Using Reinforcement Learning

Jerry Luo ⋅ Cosmin Paduraru ⋅ Octavian Voicu ⋅ Yuri Chervonyi ⋅ Scott Munns ⋅ Jerry Li ⋅ Crystal Qian ⋅ Praneet Dutta ⋅ Daniel Mankowitz ⋅ Jared Quincy Davis ⋅ Ningjia Wu ⋅ Xingwei Yang ⋅ Chu-Ming Chang ⋅ Ted Li ⋅ Rob Rose ⋅ Mingyan Fan ⋅ Hootan Nakhost ⋅ Tinglin Liu ⋅ Deeni Fatiha ⋅ Neil Satra ⋅ Juliet Rothenberg ⋅ Molly Carlin ⋅ Satish Tallapaka ⋅ Sims Witherspoon ⋅ David Parish ⋅ Peter Dolan ⋅ Chenyu Zhao

Controlling Commercial Cooling Systems Using Reinforcement Learning

Video

Multi-Agent Reinforcement Learning for Fast-Timescale Demand Response

Vincent Mai ⋅ Philippe Maisonneuve ⋅ Tianyu Zhang ⋅ Jorge Montalvo Arvizu ⋅ Liam Paull ⋅ Antoine Lesage-Landry

Video

Multi-Agent Reinforcement Learning for Fast-Timescale Demand Response

Vincent Mai ⋅ Philippe Maisonneuve ⋅ Tianyu Zhang ⋅ Jorge Montalvo Arvizu ⋅ Liam Paull ⋅ Antoine Lesage-Landry

Identifying Disparities in Sepsis Treatment by Learning the Expert Policy

Hyewon Jeong ⋅ Siddharth Nayak ⋅ Taylor Killian ⋅ Sanjat Kanjilal ⋅ Marzyeh Ghassemi

Video

Identifying Disparities in Sepsis Treatment by Learning the Expert Policy

Hyewon Jeong ⋅ Siddharth Nayak ⋅ Taylor Killian ⋅ Sanjat Kanjilal ⋅ Marzyeh Ghassemi

Bandits for Online Calibration: An Application to Content Moderation on Social Media Platforms

Vashist Avadhanula ⋅ Omar Abdul Baki ⋅ Hamsa Bastani ⋅ Osbert Bastani ⋅ Caner Gocmen ⋅ Daniel Haimovich ⋅ Darren Hwang ⋅ Dmytro Karamshuk ⋅ Thomas Leeper ⋅ Jiayuan Ma ⋅ Gregory macnamara ⋅ Jake Mullet ⋅ Christopher Palow ⋅ Sung Park ⋅ Varun S Rajagopal ⋅ Kevin Schaeffer ⋅ Parikshit Shah ⋅ Deeksha Sinha ⋅ Nicolas Stier-Moses ⋅ Ben Xu

Bandits for Online Calibration: An Application to Content Moderation on Social Media Platforms

Video

Beyond CAGE: Investigating Generalization of Learned Autonomous Network Defense Policies

Melody Wolk ⋅ Andy Applebaum ⋅ Camron Dennler ⋅ Patrick Dwyer ⋅ Marina Moskowitz ⋅ Harold Nguyen ⋅ Nicole Nichols ⋅ Nicole Park ⋅ Paul Rachwalski ⋅ Frank Rau ⋅ Adrian Webster

Beyond CAGE: Investigating Generalization of Learned Autonomous Network Defense Policies

Melody Wolk ⋅ Andy Applebaum ⋅ Camron Dennler ⋅ Patrick Dwyer ⋅ Marina Moskowitz ⋅ Harold Nguyen ⋅ Nicole Nichols ⋅ Nicole Park ⋅ Paul Rachwalski ⋅ Frank Rau ⋅ Adrian Webster

Video

Optimizing Industrial HVAC Systems with Hierarchical Reinforcement Learning

William Wong ⋅ Praneet Dutta ⋅ Octavian Voicu ⋅ Yuri Chervonyi ⋅ Cosmin Paduraru ⋅ Jerry Luo

Video

Optimizing Industrial HVAC Systems with Hierarchical Reinforcement Learning

William Wong ⋅ Praneet Dutta ⋅ Octavian Voicu ⋅ Yuri Chervonyi ⋅ Cosmin Paduraru ⋅ Jerry Luo

Reinforcement Learning Approaches for Traffic Signal Control under Missing Data

Hao Mei ⋅ Junxian Li ⋅ Bin Shi ⋅ Hua Wei

Video

Reinforcement Learning Approaches for Traffic Signal Control under Missing Data

Hao Mei ⋅ Junxian Li ⋅ Bin Shi ⋅ Hua Wei

Video

Reinforcement Learning-Based Air Traffic Deconfliction

Denis Osipychev ⋅ Dragos Margineantu

Reinforcement Learning-Based Air Traffic Deconfliction

Denis Osipychev ⋅ Dragos Margineantu

Video

Automatic Evaluation of Excavator Operators using Learned Reward Functions

Pranav Agarwal ⋅ Marek Teichmann ⋅ Sheldon Andrews ⋅ Samira Ebrahimi Kahou

Video

Automatic Evaluation of Excavator Operators using Learned Reward Functions

Pranav Agarwal ⋅ Marek Teichmann ⋅ Sheldon Andrews ⋅ Samira Ebrahimi Kahou

Function Approximations for Reinforcement Learning Controller for Wave Energy Converters

Soumyendu Sarkar ⋅ Vineet Gundecha ⋅ Alexander Shmakov ⋅ Sahand Ghorbanpour ⋅ Ashwin Ramesh Babu ⋅ Alexandre Pichard ⋅ Mathieu Cocho

Video

Function Approximations for Reinforcement Learning Controller for Wave Energy Converters

Soumyendu Sarkar ⋅ Vineet Gundecha ⋅ Alexander Shmakov ⋅ Sahand Ghorbanpour ⋅ Ashwin Ramesh Babu ⋅ Alexandre Pichard ⋅ Mathieu Cocho

Video