The Adoption of the Python Array API in scikit-learn
Date5 maiHeure14:20 - 14:40Lieu Open Stage
Le Python Array API est une API standard inspirée de l'API de NumPy, progressivement adoptée par les bibliothèques productrices de tableaux telles que NumPy, PyTorch, CuPy, JAX, DPNP d'une part, et les bibliothèques consommatrices de tableaux telles que SciPy et scikit-learn d'autre part. Une fois adopté, il permettra à scikit-learn d'exploiter le support d'accélération matérielle (par exemple le support GPU) de la bibliothèque sous-jacente aux tableaux d'entrée, au lieu de toujours essayer de les convertir en NumPy et d'exécuter les calculs sur le CPU.
Dans cette présentation, nous donnerons un aperçu de l'adoption de ce standard dans la bibliothèque scikit-learn, tant du point de vue technique que de la dynamique des contributions open source, puis nous illustrerons les impacts sur les performances à travers quelques exemples de pipelines.