Keynote – Data Science Is Not AI, but It Is Its Genesis, and Its New Frontier
Date5 maiHeure09:45 - 10:00Lieu Master Stage
Je présenterai nos dernières avancées dans la construction de meilleurs prédicteurs sur les données tabulaires et relationnelles. Ces progrès reposent à la fois sur de puissants modèles fondamentaux basés sur les Transformers et sur une meilleure préparation des données. Les modèles fondamentaux pour données tabulaires sont pré-entraînés pour intégrer des a priori implicites utiles aux tables. TabICL est un modèle fondamental tabulaire ouvert et parmi les plus performants. La préparation des données peut être très chronophage et fastidieuse, bien qu’elle soit cruciale lorsque les données dépassent le cadre d’un simple tableau numérique. Le package skrub facilite considérablement cette préparation.