TabICLv2: A Better, Faster, Scalable, and Open Tabular Foundation Model
Date5 maiHeure14:00 - 14:20Lieu Open Stage
Je présenterai nos dernières avancées dans la construction de meilleurs prédicteurs sur les données tabulaires et relationnelles. Ces progrès reposent à la fois sur de puissants modèles fondamentaux basés sur les Transformers et sur une meilleure préparation des données. Les modèles fondamentaux pour données tabulaires sont pré-entraînés pour intégrer des a priori implicites utiles aux tables. TabICL est un modèle fondamental tabulaire ouvert et parmi les plus performants. La préparation des données peut être très chronophage et fastidieuse, bien qu’elle soit cruciale lorsque les données dépassent le cadre d’un simple tableau numérique. Le package skrub facilite considérablement cette préparation.