NIPS 2017

Poster

Wed 18:30

Multi-Modal Imitation Learning from Unstructured Demonstrations using Generative Adversarial Nets
Karol Hausman · Yevgen Chebotar · Stefan Schaal · Gaurav Sukhatme · Joseph Lim

Poster

Wed 18:30

Policy Gradient With Value Function Approximation For Collective Multiagent Planning
Duc Thien Nguyen · Akshat Kumar · Hoong Chuin Lau

Poster

Wed 18:30

Dynamic Safe Interruptibility for Decentralized Multi-Agent Reinforcement Learning
El Mahdi El-Mhamdi · Rachid Guerraoui · Hadrien Hendrikx · Alexandre Maurer

Poster

Mon 18:30

Towards Generalization and Simplicity in Continuous Control
Aravind Rajeswaran · Kendall Lowrey · Emanuel Todorov · Sham Kakade

Poster

Wed 18:30

Inverse Reward Design
Dylan Hadfield-Menell · Smitha Milli · Pieter Abbeel · Stuart J Russell · Anca Dragan

Poster

Wed 18:30

Learning Combinatorial Optimization Algorithms over Graphs
Elias Khalil · Hanjun Dai · Yuyu Zhang · Bistra Dilkina · Le Song

Poster

Mon 18:30

Scalable Planning with Tensorflow for Hybrid Nonlinear Domains
Ga Wu · Buser Say · Scott Sanner

Poster

Wed 18:30

Robust and Efficient Transfer Learning with Hidden Parameter Markov Decision Processes
Taylor Killian · Samuel Daulton · Finale Doshi-Velez · George Konidaris

Poster

Mon 18:30

Value Prediction Network
Junhyuk Oh · Satinder Singh · Honglak Lee

Poster

Wed 18:30

Unifying PAC and Regret: Uniform PAC Bounds for Episodic Reinforcement Learning
Christoph Dann · Tor Lattimore · Emma Brunskill

Poster

Tue 18:30

Finite sample analysis of the GTD Policy Evaluation Algorithms in Markov Setting
Yue Wang · Wei Chen · Yuting Liu · Zhi-Ming Ma · Tie-Yan Liu

Poster

Wed 18:30

Thinking Fast and Slow with Deep Learning and Tree Search
Thomas Anthony · Zheng Tian · David Barber

Main Navigation