Llama 2 est le nouveau modèle d’IA lancé par Meta. Il succède à Llama, qui, comme d’autres systèmes de chatbot, était déjà capable de générer du texte et du code. Llama 2 est une IA plus puissante, Open Source et gratuite. Elle se positionne comme concurrente directe de ChatGPT 4. Initialement conçue pour les entreprises et les chercheurs, mais pouvant profiter à tout le monde, son utilisation à des fins commerciales est, pour la première fois, autorisée. Focus sur ce nouvel outil IA signé Meta, maison mère de Facebook et d’Instagram. Pourquoi Meta l’a rendu gratuit et open source, comment l’utiliser, où le trouver, et quelles sont les alternatives d’intelligence artificielle existantes, sont les questions auxquelles nous allons apporter des réponses.
Meta rend Llama 2 Open Source et gratuit
Le 15 juillet 2023, Meta a ouvert son modèle de langage nouvelle génération Llama 2 en open source. C’est-à-dire que son code de programmation est en accès libre. L’IA signée Meta est ainsi disponible gratuitement pour tous, entreprises comme grand public.
Le rival de ChatGPT (OpenAI) et de Bard (Google), Llama 2 a été pré-formaté sur 40 % de données supplémentaires que Llama et a été enrichie de plus d’un million d’annotations d’origine humaine. La qualité de ses réponses a donc été fortement améliorée et la longueur du contexte, doublée.
Il combine un apprentissage par renforcement avec rétroaction humaine (RLHF), un réglage de fin supervisé (SFT) et une modélisation de récompense initiale et itérative.
Meta et Microsoft sont partenaires dans le but de démocratiser l’IA grâce à l’Open Source avec une mission de transparence, d’éthique et de sécurité. Marc Zuckerberg explique le choix de l’Open Source car lorsque le logiciel est ouvert, davantage de personnes peuvent l’étudier et l’analyser pour identifier et résoudre les éventuels et potentiels problèmes.
Comment utiliser Llama 2 ?
Comme Llama 2 est un outil Open Source, il sera disponible via les principales plateformes de cloud comme Azure de Microsoft ou AWS d’Amazon. Ils peuvent aussi télécharger le modèle sur le site de Meta, instantanément, vous pouvez commencer à lui poser des questions ou à lui demander de vous fournir un contenu créatif à partir d’invites spécifiques.
Vous pouvez aussi télécharger le code de Llama 2 depuis Hugging Face. Vous aurez alors besoin d’un compte Hugging Face et des bibliothèques et dépendances nécessaires à l’exécution du code.
Le modèle open source est aussi disponible sur Github. Cette version inclut des pondérations de modèle et un code de démarrage pour des modèles de langage Llama pré-entraînés et affinés, allant des paramètres 7B à 70B. Cette présence encourage la collaboration. Les développeurs peuvent contribuer à l’amélioration du modèle, partager leurs idées et travailler ensemble pour rendre l’IA encore plus robuste et efficace.
Quels sont les avantages Llama 2 ?
Un besoin de ressources moins important
Llama 2 nécessite des ressources moins importantes que beaucoup de ses concurrents tout en étant aussi efficace, voir supérieur. L’outil comprend moins de paramètres, soit moins de variables et un volume de données analysées plus réduit. Sa vitesse de calcul est donc supérieure.
Une grande rigueur
Meta s’est appuyé sur des études qui montrent que pour perfectionner une IA, il vaut mieux recourir à de petits modèles entraînés sur un grand nombre de données précises plutôt que de s’appuyer sur de grands modèles au très grand nombre de paramètres qui n’ont pas été suffisamment longtemps en hase d’apprentissage.
Cela permet de gagner en rigueur et de réduire le nombre d’erreurs et d’approximations.
Un fonctionnement en open source
Meta a fait le choix de n’utiliser que des données publiques qui ont l’avantage de pouvoir être republiées. Elles sont extraites en grande majorité (plus de ⅔) de drumps de Common Crawl, de corpus de livres (projet Gutenberg et un sous-ensemble de The Pile), de données scientifiques (ArCiv), de FAQ (StackExtchange) et du jeu de données GitHub public disponible sur BigQuery). Avec ce choix de l’Open Source, Meta fait en sorte qu’un maximum de chercheurs travaillent sur ce modèle et l’enrichissent, pour pouvoir se targuer d’être à l’origine d’avancées majeures dans l’IA.
Quelles sont les limites Llama 2 ?
L’IA de Meta, comme ses concurrents, n’échappe pas aux biais cognitifs et aux stéréotypes existants dans la société actuelle. Dans les tests, l’entreprise a ainsi détecté des réponses ont laissé transparaître des préjugés de genre, sur la religion, l’orientation sexuelle, la couleur de peau, le statut socio-économique, l’âge, le handicap et la nationalité.
De même, comme ses concurrents, il arrive à Llama 2 de produire des erreurs factuelles, même si ses résultats sont meilleurs, elle n’est pas infaillible.
Quelles sont les alternatives à Llama 2 ?
Bien que Llama 2 apparaisse comme une avancée significative dans le domaine de l’IA, il existe d’autres outils dans le domaine des modèles de langage. Les alternatives de Llama 2 sont principalement des outils d’écriture IA, mais peuvent également être des chatbots IA ou des compagnons IA. En tout il existe ainsi une centaine d’outils qui peuvent être utilisés à la place de Llama 2.
Avec le lancement de Llama 2, Meta devient ainsi concurrent direct de Google et d’OpenAI. Si Google prônait une approche tournée vers l’ouverture, elle a changé de stratégie pour s’aligner sur celle d’OpenAI, qui est propriétaire et fermée. Cet outil Open Source risque aussi d’impacter les start-up qui se sont montées pour capitaliser sur le boom de l’IA générative, comme Anthropic (avec Claude.ai), Cohere ou Mistral AI.
Les alternatives les plus connues sont donc ChatGPT qui est gratuite et Google Bard qui utilise le modèle de langage PaLM 2. Elles sont déjà largement utilisées par le grand public comme par les professionnels. Mais on peut aussi citer DeepL Write, HuggingChat (également open source) ou Perplexity AI.
Llama 2 de Meta représente une étape importante dans le développement de l’intelligence artificielle générative. En rendant ce modèle puissant, gratuit et open source, Meta ouvre la voie à une nouvelle ère d’innovation et de collaboration dans le domaine de l’IA.
Avec des performances supérieures, une accessibilité accrue et une flexibilité sans précédent, Llama 2 est bien plus qu’un simple modèle de langage. Il est un catalyseur pour l’innovation, un outil pour la démocratisation de la technologie, et un témoignage de l’importance de l’open source dans le développement responsable de l’IA.