Hugging Face, Startup de machine learning open-source

Louana Lelong
Par 
Louana Lelong
Responsable Contenu & Évènementiel
Dernière mise à jour le 
03
 
May
 
2024
Devenez Data Scientist et donnez un tournant décisif à votre carrière !
Découvrir notre formation
Hugging Face, Startup de machine learning open-source | Jedha
Sommaire

Hugging Face est une start up française qui s'est fait connaître grâce à un Chatbot créé pour les adolescents. Aujourd'hui, elle est sur le point de révolutionner le domaine du Machine Learning grâce à l'infrastructure NLP qu'ils ont développée. On vous explique sa croissance impressionnante !

Devenez Data Scientist et donnez un tournant décisif à votre carrière !
Découvrir notre formation
Formation IAFormation IA

Difficile de ne pas mentionner Hugging Face lorsque l'on parle de natural langage processing. Et pour cause, cette startup de machine learning open source est devenu l'un des noms les plus influents de cette technologie révolutionnaire. Sans surprise, elle est désormais l'un des joujoux préférés de nombreux investisseurs. Zoom sur cette plateforme en passe de devenir le GitHub du machine learning.

A la découverte de Hugging Face

Hugging Face est une startup très prometteuse qui entend apporter une révolution dans le domaine du ML en fournissant des technologies de traitement du langage naturel open source. Elle a été fondée en 2016 par Clément Delangue et Julien Chaumond, deux ingénieurs français.

L'infrastructure de NLP qu'ils ont développée est devenue au fil du temps une référence parmi les bibliothèques ML.

Hugging Face affiche sur son dépôt GitHub, près de 43 mille étoiles et enregistre plus de 6000 contributeurs. Elle compte également plus de 7000 modèles différents et couvre près de 140 langues. À ses débuts, cette start-up se présentait comme une sorte de chatbot pour les adolescents capables d'alimenter une conversation. Cependant, son histoire commence en 2018 lorsque ses concepteurs ont lancé sa bibliothèque open source Transformers. Celle-ci permet aux ingénieurs et aux scientifiques de se lancer dans la construction de modèles de ML appliqués au traitement du langage naturel.

Avec le temps, la société franco-américaine commence à monétiser son modèle pour les entreprises. Celles-ci s'en servent notamment pour optimiser les résultats de recherche dans Bing, assurer le remplissage automatique dans Gmail ou classifier des réponses dans Typeform. La technologie de la jeune société est actuellement utilisée par plus de 5000 sociétés. De plus, elle a déjà attiré l'attention de grands noms comme Bing, Facebook, Monzo, Apple et Amazon qui souhaitent utiliser ses offres.

Amazon par exemple a déjà annoncé l'intégration de la bibliothèque Transformers à sa plateforme d'IA en mode cloud, SageMaker.

Fonctionnement de Hugging Face

Hugging Face propose différents services que l'on peut diviser en deux grandes catégories : les services gratuits de la plateforme open source et les fonctionnalités payantes auxquelles souscrivent de nombreuses sociétés aux besoins plus conséquents. Grâce à ses différentes fonctionnalités, elle est devenue le cinquième projet le plus actif sur GitHub. Scientifiques et ingénieurs s'en servent pour des applications concrètes et pour réaliser des optimisations en fonction de leurs besoins. Avec son niveau d'abstraction relativement poussé, elle peut s'avérer très pratique pour les développeurs plus généraux.

La jeune start-up doit principalement sa grande popularité à sa bibliothèque Transformers qui est d'ailleurs son service le plus populaire. Elle est soutenue par les meilleurs frameworks de Machine Learning comme PyTorch et TensorFlow. Différents types de fonctionnalités payantes sont disponibles sur la plateforme.

Elles diffèrent de la formule gratuite par la possibilité offerte d'importation de modèles privés via le service d'hébergement. Cette option est très pertinente puisqu'une entreprise peut vouloir garder secrets ses travaux en cours.

La plateforme offre également la possibilité à toute personne physique ou morale de créer un compte et d'importer des modèles pour les partager ou recueillir des avis. La jeune start-up ML propose ainsi une solution d'hébergement communautaire et open source. Les différents modèles qu'elle fournit servent à un large panel de tâches. Dans le domaine du PNL, elles concernent entre autres les aspects suivants : résumés, réponses aux questions, masque de remplissage, classification de texte, traduction, extraction de caractéristiques, similitude de phrases, classification de jetons…

Quant aux fonctionnalités audio, elles concernent la reconnaissance vocale automatique, la classification audio, le speech-to-text… Hugging Face, propose également des modèles spécialisés dans la vision par ordinateur, c'est-à-dire l'utilisation de l'intelligence artificielle pour voir et interpréter des données visuelles. Les tâches réalisables vont de la classification d'images à la détection d'objets en passant par la segmentation d'images. De plus, la plateforme de ML offre la possibilité de réaliser des opérations d'inférence avec des performances qui varient selon le niveau de souscription.

Avantages et inconvénients de Hugging Face

Depuis ses débuts la Hugging Face a connu une croissance rapide en raison de ses nombreux avantages. Ceux-ci concernent principalement son approche axée sur la communauté.

Cette plateforme de Machine Learning est en effet open source. Elle permet ainsi d'aider des personnes qui partagent les mêmes idées à construire un réseau.

De plus, ses prix sont très attractifs eu égard à la qualité et à la pertinence de ses fonctionnalités. L'abonnement à son API basé sur l'inférence commence par exemple à moins de 10 euros le mois. Autre avantage, l'interface de cette plateforme est simple à prendre en main et ses outils faciles à déployer. Enfin, elle met un accent particulier sur l'éthique de l'IA.

Le Github du machine learning ?

Dire que la plateforme Hanging Face a de grandes ambitions serait un euphémisme. Et pour cause, dès sa création elle ambitionne de devenir la référence dans le domaine du NLP. Son développement sans précédent a d'ailleurs amené de nombreux investisseurs à parier sur son potentiel. C'est ainsi que cette plateforme de ML a réussi à lever 40 millions de dollars en financement de série B en 2021. Par le passé, elle avait déjà réussi à lever 15 millions dont près de 90% reposent toujours sur ses comptes.

Ces différentes levées de fonds visent à soutenir les ambitions de la jeune société qui souhaite devenir le « GitHub du ML ». Selon Julien Chaumond, ces fonds serviront à embaucher afin de tripler la taille de l'équipe actuelle. Dans la pratique, la jeune société envisage une expansion de ses services monétisés sans pour autant toucher à sa partie communautaire. Ce modèle est très semblable à celui de GitHub qui propose également une partie gratuite de bonne facture et des services spécifiques pour les clients qui en ont besoin.


Quand utiliser Hugging Face ?

La plateforme fournit des bibliothèques open source qui contiennent des modèles préformés. Ceux-ci sont très utiles aux Data scientist et aux ingénieurs pour la résolution des problèmes d'apprentissage automatiques. De même, Hugging Face est pratique dans une grande variété de cas d'utilisations, à savoir :

  • les classements de séquence,
  • les questions et réponses,
  • le résumé,
  • la reconnaissance d'entité désignée,
  • la traduction…

Le classement de séquence par exemple aide à prédire exactement la catégorie d'une entrée donnée. Avec les questions-réponses, l'objectif est de mettre au point un algorithme capable de répondre automatiquement à des questions posées par des hommes. Quant au résumé, il consiste à créer avec l'aide de la PNL une version plus courte d'un texte plus long.

Soirée Portes Ouvertes Jedha BootcampSoirée Portes Ouvertes Jedha Bootcamp
Louana Lelong
Louana Lelong
Responsable Contenu & Évènementiel
Diplômée de SKEMA, Louana a choisie de se spécialiser dans le marketing et a eu l'occasion de travailler en tant que Responsable Contenu & Évènementiel dans notre école en 2022. Au contact des élèves et alumnis de Jedha, Louana a développé une connaissance fine du monde de la formation qu'elle a partagée dans de nombreux articles.

Articles recommandés

Intelligence Artificielle
Les applications du Deep Learning | Jedha
C’est une branche du Machine Learning très prometteuse. Que ce soit pour reconnaître des visages sur des images, analyser des textes et les interpréter automatiquement ou encore avoir des voitures qui conduisent toutes seules, les applications du Deep Learning sont nombreuses. Aujourd’hui, nous vous proposons un workshop qui va vous permettre de comprendre ce domaine et voir en quoi nous pourrions concrètement l’utiliser. Retrouver les slides du workshop sur Slideshare
Intelligence Artificielle
Algorithme Q-Learning : apprentissage par renforcement
L'apprentissage par renforcement est très utilisé dans le machine learning et fait appel au Q-learning, on vous explique ces notions et comment nous les enseignons dans nos formations Jedha Bootcamp.
Intelligence Artificielle
Formation Sagemaker Machine Learning | Jedha
Apprenez à déployer vos applications Web sur lesquelles vous avez implémenté votre algorithme d'IA grâce à la maîtrise de SageMaker
Intelligence Artificielle
Quels sont les différents algorithmes de Deep Learning ? | Jedha
Le Deep Learning est une forme d'IA dérivée du Machine Learning. Le Deep Learning est capable d'imiter le cerveau humain grâce à des réseaux de neurones artificiels.
Blog
La différence entre Machine Learning supervisé et non-supervisé
Le Machine Learning supervisé et non supervisé sont deux méthodes d'apprentissage incontournables. Comment les distinguer et quelles sont leurs évolutions ?
Intelligence Artificielle
Comment évaluer et améliorer son modèle de Machine Learning | Jedha
Une fois que vous avez construit votre modèle de Machine Learning, quelles sont les prochaines étapes ? Il vous faudra l'’évaluer puis l’améliorer, découvrez ici comment.