firstbacksecondback
530 Results
Poster
|
Fri 11:00 |
PINNacle: A Comprehensive Benchmark of Physics-Informed Neural Networks for Solving PDEs Hao Zhongkai · Jiachen Yao · Chang Su · Hang Su · Ziao Wang · Fanzhi Lu · Zeyu Xia · Yichi Zhang · Songming Liu · Lu Lu · Jun Zhu |
|
Poster
|
Fri 11:00 |
PrivAuditor: Benchmarking Data Protection Vulnerabilities in LLM Adaptation Techniques Derui Zhu · Dingfan Chen · Xiongfei Wu · Jiahui Geng · Zhuo Li · Jens Grossklags · Lei Ma |
|
Affinity Event
|
GPTCodeval: An Empirical Evaluation Benchmark for Code Generation Using Language Models Shreya Rajpal · Anbarasi Masilamani · Siva Shanmugam Gopal |
||
Affinity Event
|
A Hierarchical Agriculture Benchmark for Multimodal Large Language Models Yutong Zhou · Masahiro Ryo |
||
Affinity Event
|
Benchmarking CNN-Based Systems for Corn Leaf Pest Detection using Fine-Tuning Mariana Risco Cosavalente · Sulei Román · Carlos Silva |
||
Oral
|
Thu 15:50 |
CVQA: Culturally-diverse Multilingual Visual Question Answering Benchmark David Romero · Chenyang Lyu · Haryo Wibowo · Santiago Góngora · Aishik Mandal · Sukannya Purkayastha · Jesus-German Ortiz-Barajas · Emilio Cueva · Jinheon Baek · Soyeong Jeong · Injy Hamed · Yong Zheng-Xin · Zheng Wei Lim · Paula Silva · Jocelyn Dunstan · Mélanie Jouitteau · David LE MEUR · Joan Nwatu · Ganzorig Batnasan · Munkh-Erdene Otgonbold · Munkhjargal Gochoo · Guido Ivetta · Luciana Benotti · Laura Alonso Alemany · Hernán Maina · Jiahui Geng · Tiago Timponi Torrent · Frederico Belcavello · Marcelo Viridiano · Jan Christian Blaise Cruz · Dan John Velasco · Oana Ignat · Zara Burzo · Chenxi Whitehouse · Artem Abzaliev · Teresa Clifford · Gráinne Caulfield · Teresa Lynn · Christian Salamea-Palacios · Vladimir Araujo · Yova Kementchedjhieva · Mihail Mihaylov · Israel Azime · Henok Ademtew · Bontu Balcha · Naome A. Etori · David Adelani · Rada Mihalcea · Atnafu Lambebo Tonja · Maria Cabrera · Gisela Vallejo · Holy Lovenia · Ruochen Zhang · Marcos Estecha-Garitagoitia · Mario Rodríguez-Cantelar · Toqeer Ehsan · Rendi Chevi · Muhammad Adilazuarda · Ryandito Diandaru · Samuel Cahyawijaya · Fajri Koto · Tatsuki Kuribayashi · Haiyue Song · Aditya Khandavally · Thanmay Jayakumar · Raj Dabre · Mohamed Imam · Kumaranage Nagasinghe · Alina Dragonetti · Luis Fernando D'Haro · Niyomugisha Olivier · Jay Gala · Pranjal Chitale · Fauzan Farooqui · Thamar Solorio · Alham Aji |
|
Poster
|
SRFUND: A Multi-Granularity Hierarchical Structure Reconstruction Benchmark in Form Understanding Jiefeng Ma · Yan Wang · Chenyu Liu · Jun Du · Yu Hu · Zhenrong Zhang · Pengfei Hu · Qing Wang · Jianshu Zhang |
||
Affinity Event
|
Copycats: the many lives of a publicly available medical imaging dataset Amelia Jiménez-Sánchez · Natalia-Rozalia Avlona · Dovile Juodelyte · Théo Sourget · Caroline Vang-Larsen · Anna Rogers · Hubert Zając · Veronika Cheplygina |
||
Poster
|
Wed 11:00 |
BenchMARL: Benchmarking Multi-Agent Reinforcement Learning Matteo Bettini · Amanda Prorok · Vincent MOENS |
|
Poster
|
Wed 11:00 |
Text to Blind Motion Hee Jae Kim · Kathakoli Sengupta · Masaki Kuribayashi · Hernisa Kacorri · Eshed Ohn-Bar |
|
Poster
|
Wed 11:00 |
SustainDC: Benchmarking for Sustainable Data Center Control Avisek Naug · Antonio Guillen-Perez · Ricardo Luna Gutierrez · Vineet Gundecha · Cullen Bash · Sahand Ghorbanpour · Sajad Mousavi · Ashwin Ramesh Babu · Dejan Markovikj · Lekhapriya Dheeraj Kashyap · Desik Rengarajan · Soumyendu Sarkar |
|
Poster
|
Fri 16:30 |
Dataset and Lessons Learned from the 2024 SaTML LLM Capture-the-Flag Competition Edoardo Debenedetti · Javier Rando · Daniel Paleka · Silaghi Florin · Dragos Albastroiu · Niv Cohen · Yuval Lemberg · Reshmi Ghosh · Rui Wen · Ahmed Salem · Giovanni Cherubin · Santiago Zanella-Beguelin · Robin Schmid · Victor Klemm · Takahiro Miki · Chenhao Li · Stefan Kraft · Mario Fritz · Florian Tramer · Sahar Abdelnabi · Lea Schönherr |