firstbacksecondback
248 Results
Poster
|
Thu 16:30 |
HelpSteer 2: Open-source dataset for training top-performing reward models Zhilin Wang · Yi Dong · Olivier Delalleau · Jiaqi Zeng · Gerald Shen · Daniel Egert · Jimmy Zhang · Makesh Narsimhan Sreedhar · Oleksii Kuchaiev |
|
Poster
|
Wed 11:00 |
LRM-Zero: Training Large Reconstruction Models with Synthesized Data Desai Xie · Sai Bi · Zhixin Shu · Kai Zhang · Zexiang Xu · Yi Zhou · Soeren Pirk · Arie Kaufman · Xin Sun · Hao Tan |
|
Poster
|
Fri 16:30 |
Improved off-policy training of diffusion samplers Marcin Sendera · Minsu Kim · Sarthak Mittal · Pablo Lemos · Luca Scimeca · Jarrid Rector-Brooks · Alexandre Adam · Yoshua Bengio · Nikolay Malkin |
|
Workshop
|
Sat 11:54 |
OLMoE: Open Mixture-of-Experts Language Models Niklas Muennighoff · Luca Soldaini · Dirk Groeneveld · Kyle Lo · Jacob Morrison · Sewon Min · Weijia Shi · Evan Walsh · Oyvind Tafjord · Nathan Lambert · Yuling Gu · Shane Arora · Akshita Bhagia · Dustin Schwenk · David Wadden · Alexander Wettig · Binyuan Hui · Tim Dettmers · Douwe Kiela · Noah Smith · Pang Wei Koh · Amanpreet Singh · Hannaneh Hajishirzi |
|
Workshop
|
Sat 10:40 |
PATIENT-Ψ: Using Large Language Models to Simulate Patients for Training Mental Health Professionals Ruiyi Wang · Stephanie Milani · Jamie Chiu · Jiayin Zhi · Shaun Eack · Travis Labrum · Samuel Murphy · Nev Jones · Kate Hardy · Hong Shen · Fei Fang · Zhiyu Chen |
|
Poster
|
Wed 11:00 |
RedPajama: an Open Dataset for Training Large Language Models Maurice Weber · Dan Fu · Quentin Anthony · Yonatan Oren · Shane Adams · Anton Alexandrov · Xiaozhong Lyu · Huu Nguyen · Xiaozhe Yao · Virginia Adams · Ben Athiwaratkun · Rahul Chalamala · Kezhen Chen · Max Ryabinin · Tri Dao · Percy Liang · Christopher Ré · Irina Rish · Ce Zhang |
|
Poster
|
Fri 16:30 |
DataComp-LM: In search of the next generation of training sets for language models Jeffrey Li · Alex Fang · Georgios Smyrnis · Maor Ivgi · Matt Jordan · Samir Yitzhak Gadre · Hritik Bansal · Etash Guha · Sedrick Scott Keh · Kushal Arora · Saurabh Garg · Rui Xin · Niklas Muennighoff · Reinhard Heckel · Jean Mercat · Mayee Chen · Suchin Gururangan · Mitchell Wortsman · Alon Albalak · Yonatan Bitton · Marianna Nezhurina · Amro Abbas · Cheng-Yu Hsieh · Dhruba Ghosh · Josh Gardner · Maciej Kilian · Hanlin Zhang · Rulin Shao · Sarah Pratt · Sunny Sanyal · Gabriel Ilharco · Giannis Daras · Kalyani Marathe · Aaron Gokaslan · Jieyu Zhang · Khyathi Chandu · Thao Nguyen · Igor Vasiljevic · Sham Kakade · Shuran Song · Sujay Sanghavi · Fartash Faghri · Sewoong Oh · Luke Zettlemoyer · Kyle Lo · Alaaeldin El-Nouby · Hadi Pouransari · Alexander Toshev · Stephanie Wang · Dirk Groeneveld · Luca Soldaini · Pang Wei Koh · Jenia Jitsev · Thomas Kollar · Alex Dimakis · Yair Carmon · Achal Dave · Ludwig Schmidt · Vaishaal Shankar |
|
Workshop
|
BigDocs: A Permissively-Licensed Dataset for Training Vision-Language Models on Document and Code Tasks Juan Rodriguez · Xiangru Jian · Siba Smarak Panigrahi · Tianyu Zhang · Aarash Feizi · Abhay Puri · Akshay Kalkunte Suresh · François Savard · Amirhossein Abaskohi · Ahmed Masry · Shravan Nayak · Mahsa Massoud · Rabiul Awal · Pierre-André Noël · Mats L Richter · Saverio Vadacchino · Shubham Agarwal · Sanket Biswas · Ying Zhang · Sathwik Tejaswi Madhusudhan · Joao Monteiro · Krishnamurthy Dvijotham · Torsten Scholak · Nicolas Chapados · Sean Hughes · M. Tamer Özsu · Aishwarya Agrawal · Marco Pedersoli · Chris Pal · Perouz Taslakian · David Vazquez · Issam Hadj Laradji · Spandana Gella · Sai Rajeswar Mudumba |