IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Twitter dévoile une partie de son code source en open source, dont son algorithme de recommandation.
Elon Musk fait une analogie à Linux et sollicite l'aide de la communauté

Le , par Stéphane le calme

17PARTAGES

14  0 
Près d'un an après qu'Elon Musk a lancé pour la première fois l'idée de rendre public l'algorithme de recommandation de Twitter, la société a publié le code source de son algorithme de recommandation sur GitHub. Dans un Twitter Space discutant de cette décision, Musk a déclaré qu'il espérait que les utilisateurs seraient en mesure de trouver des « problèmes » potentiels dans le code et de contribuer à l'améliorer.

Toutefois, le code publié vendredi ne traite que de la façon dont les tweets sont affichés dans le flux « Pour Vous » de Twitter. La société n'a pas publié le code sous-jacent de son algorithme de recherche ni la manière dont le contenu est affiché sur d'autres parties de Twitter, bien que Musk ait déclaré que la société ouvrirait également « à coup sûr » l'algorithme de recherche.

Le timing est également intéressant. Des parties du code source de Twitter ont été divulguées en ligne via GitHub peu de temps avant. Le réseau social a déposé une demande de retrait en vertu de la loi américaine DMCA. La demande, que GitHub a publiée en ligne, indique que les informations divulguées comprenaient « le code source exclusif de la plateforme de médias sociaux et des outils internes de Twitter ». Certains se demandent si ce n'est pas cet évènement qui a un peu forcé la main à Elon Musk.


Comme promis à plusieurs reprises par le PDG de Twitter, Elon Musk, Twitter a ouvert une partie de son code source à l'inspection publique, y compris l'algorithme qu'il utilise pour recommander des tweets dans la chronologie des utilisateurs.

Sur GitHub, Twitter a publié deux référentiels contenant du code pour de nombreuses parties qui font fonctionner le réseau social, y compris le mécanisme utilisé par Twitter pour contrôler les tweets que les utilisateurs voient sur la chronologie Pour Vous.

Dans un billet de blog décrivant le fonctionnement des recommandations de Twitter, la société a expliqué les différentes étapes de l'algorithme, y compris le classement et le filtrage. Ceux qui sont intéressés peuvent trouver un extrait ci-dessous.

Comment choisissons-nous les Tweets ?

La base des recommandations de Twitter est un ensemble de modèles et de fonctionnalités de base qui extraient des informations latentes des tweets, des utilisateurs et des données d'engagement. Ces modèles visent à répondre à des questions importantes sur le réseau Twitter, telles que « Quelle est la probabilité que vous interagissiez avec un autre utilisateur à l'avenir ? » ou, « Quelles sont les communautés sur Twitter et quels sont les Tweets à la mode en leur sein ? » Répondre à ces questions avec précision permet à Twitter de fournir des recommandations plus pertinentes.

Le pipeline de recommandations est composé de trois étapes principales qui consomment ces fonctionnalités :
  • récupérer les meilleurs Tweets à partir de différentes sources de recommandation dans un processus appelé recherche de candidats ;
  • classer chaque Tweet à l'aide d'un modèle d'apprentissage automatique ;
  • appliquer des heuristiques et des filtres, tels que le filtrage des Tweets des utilisateurs que vous avez bloqués, du contenu NSFW et des Tweets que vous avez déjà vus.

Le service responsable de la construction et du service de la chronologie Pour Vous s'appelle Home Mixer. Home Mixer est construit sur Product Mixer, notre framework Scala personnalisé qui facilite la création de flux de contenu. Ce service agit comme l'épine dorsale du logiciel qui relie différentes sources de candidats, fonctions de notation, heuristiques et filtres.

Le diagramme ci-dessous illustre les principaux composants utilisés pour construire une chronologie*:


[ndlr. Des détails sont donnés à ce niveau concernant entre autres les sources de candidats]

Classement

L'objectif de la chronologie Pour Vous est de vous proposer des Tweets pertinents. À ce stade du pipeline, nous avons environ 1500 candidats qui pourraient être pertinents. La notation prédit directement la pertinence de chaque Tweet candidat et constitue le principal signal de classement des Tweets sur votre journal. À ce stade, tous les candidats sont traités de la même manière, quelle que soit la source du candidat dont ils proviennent.

Le classement est réalisé avec un réseau neuronal d'environ 48 millions de paramètres qui est continuellement formé sur les interactions Tweet pour optimiser l'engagement positif (par exemple, J'aime, Retweets et Réponses). Ce mécanisme de classement prend en compte des milliers de fonctionnalités et produit dix étiquettes pour donner à chaque Tweet un score, où chaque étiquette représente la probabilité d'un engagement. Nous classons les Tweets à partir de ces scores.

Heuristiques, filtres et fonctionnalités du produit

Après l'étape de classement, nous appliquons des heuristiques et des filtres pour implémenter diverses fonctionnalités du produit. Ces fonctionnalités marchent ensemble pour créer un flux équilibré et diversifié. Voici quelques exemples :
  • filtrage de la visibilité : filtrez les Tweets en fonction de leur contenu et de vos préférences. Par exemple, supprimez les Tweets des comptes que vous bloquez ou désactivez ;
  • diversité des auteurs : évitez trop de Tweets consécutifs d'un même auteur ;
  • équilibre du contenu : Assurez-vous que nous diffusons un juste équilibre entre les Tweets In-Network et Out-of-Network ;
  • fatigue basée sur les commentaires : réduisez le score de certains Tweets si le spectateur a fourni des commentaires négatifs autour de ceux-ci ;
  • preuve sociale : Exclure les Tweets Out-of-Network sans connexion de second degré au Tweet comme garantie de qualité. En d'autres termes, assurez-vous qu'une personne que vous suivez interagit avec le Tweet ou suit l'auteur du Tweet ;
  • conversations : fournissez plus de contexte à une réponse en l'associant au Tweet d'origine ;
  • tweets modifiés : déterminez si les Tweets actuellement sur un appareil sont obsolètes et envoyez des instructions pour les remplacer par les versions modifiées.

[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Twitter recommendation source code now available to all on GitHub <a href="https://t.co/9ozsyZANwa">https://t.co/9ozsyZANwa</a></p>— Elon Musk (@elonmusk) <a href="https://twitter.com/elonmusk/status/1641876892302073875?ref_src=twsrc%5Etfw">March 31, 2023</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]

Lors d'une session Twitter Spaces, Musk a précisé : « Notre version initiale du soi-disant algorithme va être assez embarrassante, et les gens vont trouver beaucoup d'erreurs, mais nous allons les corriger très rapidement ». Et d'ajouter « même si vous n'êtes pas d'accord avec quelque chose, au moins vous saurez pourquoi c'est là, et que vous n'êtes pas secrètement manipulé... L'analogue, ici, auquel nous aspirons est le grand exemple de Linux en tant que système d'exploitation open source… On peut, en théorie, découvrir de nombreux exploits pour Linux. En réalité, ce qui se passe, c'est que la communauté identifie et corrige ces exploits ».

Sur ce deuxième point du billet de blog sur la prévention des risques, les versions open source n'incluent pas le code qui alimente les recommandations publicitaires de Twitter ou les données utilisées pour former l'algorithme de recommandation de Twitter. De plus, elles incluent peu d'instructions sur la façon d'inspecter ou d'utiliser réellement le code, ce qui renforce l'idée que les versions sont strictement axées sur les développeurs.

« [Nous avons exclu] tout code qui compromettrait la sécurité et la confidentialité des utilisateurs ou la capacité de protéger notre plateforme contre les acteurs malveillants, y compris saper nos efforts pour lutter contre l'exploitation et la manipulation sexuelles des enfants », a écrit Twitter. Un message qui pourrait paraître un peu surprenant dans la mesure où il vient quelques semaines seulement après que Twitter a licencié une grande partie de son personnel d'IA éthique ainsi que son équipe de confiance et sécurité, qui était responsable de la modération du contenu parmi d'autres tâches liées à la sécurité des utilisateurs. Mais la société insiste néanmoins sur le fait qu'elle « [a pris] des mesures pour garantir que la sécurité et la confidentialité des utilisateurs seraient protégées » avec la publication du code.

Twitter indique qu'il travaille sur des outils pour gérer les suggestions de code de la communauté et synchroniser les modifications apportées à son référentiel interne. Vraisemblablement, ceux-ci seront mis à disposition à une date ultérieure.

« Nous allons chercher des suggestions, non seulement sur les bogues, mais aussi sur la façon dont l'algorithme devrait fonctionner », a déclaré Musk lors de la session Spaces. « Ce sera un processus évolutif. Je ne m'attendrais pas à ce que ce soit un mouvement ascendant ininterrompu… mais nous sommes très ouverts à ce qui améliorerait l'expérience utilisateur ».

Des utilisateurs ont déjà trouvé des détails intéressants dans le code lui-même

Dans son billet de blog décrivant le fonctionnement des recommandations de Twitter, la société a expliqué les différentes étapes de l'algorithme, y compris le classement et le filtrage. Mais les utilisateurs de Twitter ont déjà trouvé des détails intéressants dans le code lui-même. Par exemple, Jane Manchun Wong a noté que « l'algorithme de Twitter indique spécifiquement si l'auteur du Tweet est Elon Musk ». Cela peut offrir une autre explication de la raison pour laquelle les tweets de Musk apparaissent si souvent. Wong a également noté que l'algorithme comporte des étiquettes indiquant si l'auteur du tweet est un « utilisateur expérimenté » ainsi que s'il est républicain ou démocrate.

[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Twitter’s algorithm specifically labels whether the Tweet author is Elon Musk<br><br>“author_is_elon”<br><br>besides the Democrat, Republican and “Power User” labels<a href="https://t.co/fhpBjdfifX">https://t.co/fhpBjdfifX</a> <a href="https://t.co/orCPvfMTb9">pic.twitter.com/orCPvfMTb9</a></p>— Jane Manchun Wong (@wongmjane) <a href="https://twitter.com/wongmjane/status/1641884551189512192?ref_src=twsrc%5Etfw">March 31, 2023</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]

Interrogé sur cet aspect de l'algorithme dans Twitter Space, Musk a déclaré: « Je suis d'accord que cela ne devrait pas être là… cela ne devrait certainement pas diviser les gens en républicains et démocrates, cela n'a aucun sens ». Un ingénieur de Twitter a ensuite précisé que les catégories n'étaient destinées qu'à « des fins de suivi des statistiques et que cela n'avait rien à voir avec l'algorithme ». Il a déclaré que les étiquettes visaient à « s'assurer que nous ne privilégions pas un groupe par rapport à un autre », bien qu'il n'ait pas expliqué pourquoi Musk avait sa propre catégorie.

« Mais n'est-ce pas bizarre que vous ayez quatre catégories et que l'une d'elles soit Elon ? », a demandé un internaute. « Je pense que c'est bizarre », a reconnu Musk. « C'était la première fois que j'apprenais ça ».


Rien n'a filtré sur les fameux 35 utilisateurs VIP...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de escartefigue
Modérateur https://www.developpez.com
Le 20/06/2024 à 7:49
Citation Envoyé par febneo Voir le message
Developpez.net est constant avec la propagande anti-Musk. Avez-vous déjà lu un seul article positif à son sujet sur ce forum ?
On imagine tellement bien le profile de l'auteur incel (sous différent pseudos), en train de se faire un petit plaisir hédoniste juste avant de croiser un miroir et de contempler sa propre médiocrité.
C'est donc votre tout premier message sur le forum :



Vous n'avez même pas eu la courtoisie de vous présenter sur le forum "présentations", ni participé à aucun forum technique - c'est quand même la vocation première de "Développez" - mais pour dénigrer vous répondez présent.

Intéressant...
16  0 
Avatar de totozor
Expert confirmé https://www.developpez.com
Le 29/11/2024 à 7:35
Citation Envoyé par kuafem Voir le message
Maintenant je dois adresser l'éléphant dans la pièce : pourquoi autant d'articles anti-Musk et plus récemment anti-Trump sur ce site ?
Les articles sont factuels, n'est ce pas?
Donc la réponse est que ces personnes sont détestables et publiques.
Pourquoi ce site attire tous ces rédacteurs souffrant visiblement d'une sérieuse psychopathie ? Si papa a été méchant avec vous, ils faut vous faire soigner les gars !
Votre papa a été méchant avec vous?
Pourquoi ce jugement de valeur haineux?
17  2 
Avatar de Freem
Membre émérite https://www.developpez.com
Le 20/01/2025 à 9:17
À quelle titre, elle demande l’accès à leurs secrets industriels ?
Déjà, l'Union Européenne pourrais tout à fait le faire, au même titre que les USA le font, tout ce qui est hébergé par une entreprise étasunienne, y compris hors-sol, peut être remis au gouvernement américain sans besoin de procès ni de raison.

Ensuite, ici, ce n'est pas tant l'algorithme lui-même qui intéresse, mais les règles de modération. Vu que la modération est faite par algo, ça inclue l'algo, et c'est bien normal. X étant un média de diffusion de masse, tout comme les journaux, la télévision et la radio, il est de la responsabilité des gouvernements de s'assurer que les même règles soient respectées, et notamment celles liées à la parité des temps de parole des différents partis, extrêmes ou non.

Au final, le fait que ce soit un algo est, et je pense que sur un site de travailleurs de l'informatique c'est assez évident, ce que l'on appelle en dev: un détail d'implémentation.
Si ça ne plaît pas, hé bien, le plus simple c'est de faire que chaque action de l'algo soit vérifiée par un humain: ainsi, plus besoin d'expliquer comment l'algo marche, juste de vérifier les conditions de travail des humains, quels sont leurs ordres, comment est vérifié le fait que le contrat soit respecté.
Oui, ça coûte plus cher. Mais c'est encore un détail d'implémentation qui ne regarde en rien les gouvernements. Ce qui les concerne, c'est bel et bien que X soit clair sur le fait que X respecte les lois.
13  0 
Avatar de Cyberduck
Membre à l'essai https://www.developpez.com
Le 29/11/2024 à 7:46
Citation Envoyé par kuafem Voir le message
Bonjour,
Maintenant je dois adresser l'éléphant dans la pièce : pourquoi autant d'articles anti-Musk et plus récemment anti-Trump sur ce site ?
Pourquoi ce site attire tous ces rédacteurs souffrant visiblement d'une sérieuse psychopathie ? Si papa a été méchant avec vous, ils faut vous faire soigner les gars ! Musk n'est pas votre papa. Il n'est pas responsable de votre mal être !
🤣 Si c’est un LLM c’est très drôle.
Sinon ça fait un peu de la peine autant d’hypocrisie.
Ce n’est pas notre papa, mais visiblement, c’est le vôtre et il ne faut pas le critiquer.
13  1 
Avatar de AoCannaille
Expert confirmé https://www.developpez.com
Le 03/04/2023 à 11:00
Citation Envoyé par HaryRoseAndMac Voir le message
Je pense comme toi : Woke est devenu un mot fourre-tout. [...]
Est-ce que tu te rend compte que tu as des propos aussi péremptoires, vindicatifs et à la limite du sectaire que la catégorie de personne que tu décrit ?
Qui, au passage, je n'ai jamais croisé en France, alors que le profil contre lequels ils se battent pullule et dont tu fais un exemple notoire ?

On n'est pas les USA, il y a encore de la place pour la nuance dans nos avis et opinions, faudrait éviter d'importer ce manichéisme caricatural et parfaitement ridicule...
12  1 
Avatar de nadjim
Membre habitué https://www.developpez.com
Le 03/12/2024 à 12:07
Citation Envoyé par Jules34 Voir le message
Chez nous on a bien des juges qui condamnent Marine Le Pen en se cachant derrière la loi, c'est pareil... mais qui en relaxe d'autre pour LES MEME FAITS (Bayrou par exemple, relaxé malgré 8 condamnés au sein du modem pour des affaires d'emploi fictifs). Son seul tort ? Etre Marine le Pen.

Ce sont des procès politiques. Autant légitime que les procès de Moscou. La juge McCormick elle doit tout à l'administration Biden, elle lui mange dans la main.

Si la majorité des actionnaires à voté normalement aucun juge du monde peut aller contre.

Les USA ont un gros problème avec la gauche qui a trusté de nombreux postes, c'est une réalité aussi vivante que chez nous.

Mais voila ça satisfait une tripotée de rageur surement financé par les impôts de ceux qui bossent et ça permet aux journaleux de continuer à raconter des saloperies.
Personne n’est au-dessus des lois, pas même les politiques. Comme tout le monde, ils doivent assumer leurs actes. Trop souvent, certains profitent d’immunités ou d’influences pour échapper à la justice, et ça, ça détruit la confiance des citoyens envers nos institutions.

C’est facile de crier au « procès politique », mais ce genre d’accusation doit être basé sur des faits, pas juste des ressentis. Si une personnalité politique est jugée, c’est à un tribunal indépendant de décider si elle est coupable ou non, pas à l’opinion publique ou à ses fans.

Soutenir aveuglément une personnalité politique simplement parce qu’elle est du même bord que nous, peu importe ce qu’elle fait, c’est contre-productif. C’est ce genre d’attitude qui nous empêche de progresser. Ce n’est pas un individu ou un parti qui va tout résoudre, mais une justice juste et des citoyens capables de réfléchir au-delà des clivages.
11  0 
Avatar de Ryu2000
Membre extrêmement actif https://www.developpez.com
Le 20/06/2024 à 7:37
Citation Envoyé par febneo Voir le message
Avez-vous déjà lu un seul article positif à son sujet sur ce forum ?
N'importe quel membre du forum peut écrire un article. Si un jour il y a une actualité positive concernant Elon Musk, vous pourriez essayer d'en écrire un.
10  0 
Avatar de noremorse
Membre actif https://www.developpez.com
Le 19/01/2025 à 20:41
Pendant ce temps là, l’UE cache les contrats de Pfizer et dissimule les SMS de Der Leyen avec le pdg de Pfizer
15  5 
Avatar de Uther
Expert éminent sénior https://www.developpez.com
Le 02/04/2023 à 3:52
Le fait que Twitter soit techniquement a la ramasse est connu depuis toujours, la qualité de votre divination n'est pas particulièrement surprenante. Cependant ça n'a rien a voir avec être woke ou pas, pour peu que cette étiquette veuille dire quelque-chose. Par exemple Rust, souvent moqué par ses détracteurs pour son code de conduite qui promeut le respect et l'inclusivité, n'en reste pas moins un modèle de développement sérieux.

Le problème de Twitter, c'est plus lié au coté fonctionnement en mode startup du Web dont il n'a pas réellement réussi sortir.
13  4 
Avatar de agripp
Membre habitué https://www.developpez.com
Le 25/06/2023 à 19:42
Le mot chien désigne un animal, il n'est pas péjoratif, mais employé pour désigner un humain,il devient une insulte. De même en français le mot "nègre" est étymologiquement un doublé du mot "noir" lequel désigne une couleur et rien d'autre. Il se trouve que ce mot aurait été utilisé de façon péjorative et serait devenu une insulte. Le législateur a pris la décision d'en interdire l'usage jusque dans les nom désignant des gâteaux ou des lieux. De même cisgenre n'est certainement pas péjoratif par son étymologie, mais il peut dans la bouche ou sous la plume de certaines personnes le devenir. Il en est de même de beaucoup d'autres mots. En réalité c'est le contexte qui fait qu'un mot est dans un discours ou un texte un terme décrivant une réalité ou une insulte. Ainsi par exemple "manouche" est le nom d'une branche du peuple tsigane, branche dont les membres parlent une langue : le manouche (de même les roms - une autre branche - parlent le rom). Manouche n'est donc pas une insulte sauf si on l'emploie pour insulter quelqu'un.
8  0