NeurIPS 2024

Poster

Thu 16:30

HelpSteer 2: Open-source dataset for training top-performing reward models
Zhilin Wang · Yi Dong · Olivier Delalleau · Jiaqi Zeng · Gerald Shen · Daniel Egert · Jimmy Zhang · Makesh Narsimhan Sreedhar · Oleksii Kuchaiev

Poster

Wed 11:00

LRM-Zero: Training Large Reconstruction Models with Synthesized Data
Desai Xie · Sai Bi · Zhixin Shu · Kai Zhang · Zexiang Xu · Yi Zhou · Soeren Pirk · Arie Kaufman · Xin Sun · Hao Tan

Poster

Fri 16:30

Improved off-policy training of diffusion samplers
Marcin Sendera · Minsu Kim · Sarthak Mittal · Pablo Lemos · Luca Scimeca · Jarrid Rector-Brooks · Alexandre Adam · Yoshua Bengio · Nikolay Malkin

Workshop

Sat 11:54

OLMoE: Open Mixture-of-Experts Language Models
Niklas Muennighoff · Luca Soldaini · Dirk Groeneveld · Kyle Lo · Jacob Morrison · Sewon Min · Weijia Shi · Evan Walsh · Oyvind Tafjord · Nathan Lambert · Yuling Gu · Shane Arora · Akshita Bhagia · Dustin Schwenk · David Wadden · Alexander Wettig · Binyuan Hui · Tim Dettmers · Douwe Kiela · Noah Smith · Pang Wei Koh · Amanpreet Singh · Hannaneh Hajishirzi

Workshop

Sat 10:40

PATIENT-Ψ: Using Large Language Models to Simulate Patients for Training Mental Health Professionals
Ruiyi Wang · Stephanie Milani · Jamie Chiu · Jiayin Zhi · Shaun Eack · Travis Labrum · Samuel Murphy · Nev Jones · Kate Hardy · Hong Shen · Fei Fang · Zhiyu Chen

Poster

Wed 11:00

RedPajama: an Open Dataset for Training Large Language Models
Maurice Weber · Dan Fu · Quentin Anthony · Yonatan Oren · Shane Adams · Anton Alexandrov · Xiaozhong Lyu · Huu Nguyen · Xiaozhe Yao · Virginia Adams · Ben Athiwaratkun · Rahul Chalamala · Kezhen Chen · Max Ryabinin · Tri Dao · Percy Liang · Christopher Ré · Irina Rish · Ce Zhang

Poster

Fri 16:30

DataComp-LM: In search of the next generation of training sets for language models
Jeffrey Li · Alex Fang · Georgios Smyrnis · Maor Ivgi · Matt Jordan · Samir Yitzhak Gadre · Hritik Bansal · Etash Guha · Sedrick Scott Keh · Kushal Arora · Saurabh Garg · Rui Xin · Niklas Muennighoff · Reinhard Heckel · Jean Mercat · Mayee Chen · Suchin Gururangan · Mitchell Wortsman · Alon Albalak · Yonatan Bitton · Marianna Nezhurina · Amro Abbas · Cheng-Yu Hsieh · Dhruba Ghosh · Josh Gardner · Maciej Kilian · Hanlin Zhang · Rulin Shao · Sarah Pratt · Sunny Sanyal · Gabriel Ilharco · Giannis Daras · Kalyani Marathe · Aaron Gokaslan · Jieyu Zhang · Khyathi Chandu · Thao Nguyen · Igor Vasiljevic · Sham Kakade · Shuran Song · Sujay Sanghavi · Fartash Faghri · Sewoong Oh · Luke Zettlemoyer · Kyle Lo · Alaaeldin El-Nouby · Hadi Pouransari · Alexander Toshev · Stephanie Wang · Dirk Groeneveld · Luca Soldaini · Pang Wei Koh · Jenia Jitsev · Thomas Kollar · Alex Dimakis · Yair Carmon · Achal Dave · Ludwig Schmidt · Vaishaal Shankar

Workshop

BigDocs: A Permissively-Licensed Dataset for Training Vision-Language Models on Document and Code Tasks
Juan Rodriguez · Xiangru Jian · Siba Smarak Panigrahi · Tianyu Zhang · Aarash Feizi · Abhay Puri · Akshay Kalkunte Suresh · François Savard · Amirhossein Abaskohi · Ahmed Masry · Shravan Nayak · Mahsa Massoud · Rabiul Awal · Pierre-André Noël · Mats L Richter · Saverio Vadacchino · Shubham Agarwal · Sanket Biswas · Ying Zhang · Sathwik Tejaswi Madhusudhan · Joao Monteiro · Krishnamurthy Dvijotham · Torsten Scholak · Nicolas Chapados · Sean Hughes · M. Tamer Özsu · Aishwarya Agrawal · Marco Pedersoli · Chris Pal · Perouz Taslakian · David Vazquez · Issam Hadj Laradji · Spandana Gella · Sai Rajeswar Mudumba

Main Navigation

248 Results