Cette étude explore comment les développeurs interagissent avec ChatGPT sur plusieurs échanges, en analysant 645 prompts issus de conversations réelles de codage. Elle catégorise les messages des développeurs en sept rôles—allant de l'introduction des tâches à l'affinement des requêtes et à la fourniture de feedback—et utilise un modèle de Markov pour cartographier leur flux conversationnel. Les résultats montrent que la plupart des dialogues commencent par une définition de tâche, suivie de suivis itératifs ou d'affinements qui améliorent les réponses de ChatGPT. Ces découvertes révèlent comment les développeurs co-évoluent des solutions avec l'IA à travers des échanges stratifiés et pilotés par le feedback plutôt que par des requêtes uniques.Cette étude explore comment les développeurs interagissent avec ChatGPT sur plusieurs échanges, en analysant 645 prompts issus de conversations réelles de codage. Elle catégorise les messages des développeurs en sept rôles—allant de l'introduction des tâches à l'affinement des requêtes et à la fourniture de feedback—et utilise un modèle de Markov pour cartographier leur flux conversationnel. Les résultats montrent que la plupart des dialogues commencent par une définition de tâche, suivie de suivis itératifs ou d'affinements qui améliorent les réponses de ChatGPT. Ces découvertes révèlent comment les développeurs co-évoluent des solutions avec l'IA à travers des échanges stratifiés et pilotés par le feedback plutôt que par des requêtes uniques.

Analyse du Flux des Prompts de Développeurs dans les Conversations ChatGPT

2025/11/13 01:30

Résumé

1 Introduction

2 Collecte de données

3 RQ1: Quels types de requêtes d'ingénierie logicielle les développeurs présentent-ils à ChatGPT dans le prompt initial?

4 RQ2: Comment les développeurs présentent-ils leurs requêtes à ChatGPT dans les conversations à plusieurs tours?

5 RQ3: Quelles sont les caractéristiques du comportement de partage?

6 Discussions

7 Menaces à la validité

8 Travaux connexes

9 Conclusion et travaux futurs

Références

\

RQ2: Comment les développeurs présentent-ils leurs requêtes à ChatGPT dans les conversations à plusieurs tours?

==Motivation:== Les résultats présentés dans la Figure 3 et la Figure 4 révèlent qu'une part substantielle des DevGPT-PRs (33,2%) et des DevGPT-Issues (26,9%) comprend des conversations à plusieurs tours. Dans les conversations à tour unique, les développeurs posent une requête liée à l'ingénierie logicielle dans le prompt initial et reçoivent une réponse de ChatGPT, offrant un échange clair et direct. La dynamique des conversations à plusieurs tours introduit cependant une complexité. Ces interactions vont au-delà d'une simple requête et réponse, impliquant une série d'échanges qui potentiellement affinent, développent ou clarifient la requête initiale.

\ Cette communication en couches soulève une question sur les stratégies des développeurs pour articuler leurs requêtes sur plusieurs tours. Ainsi, nous introduisons RQ2, qui étudie la nature des prompts des développeurs dans les conversations à plusieurs tours. Pour faciliter une analyse complète, nous introduisons deux sous-questions:

RQ2.1: Quels sont les rôles des prompts des développeurs dans les conversations à plusieurs tours? Cette question vise à catégoriser le rôle structurel de chaque prompt dans la conversation à plusieurs tours correspondante.

RQ2.2: Quels sont les modèles de flux dans les conversations à plusieurs tours? Basée sur la taxonomie proposée comme réponse à RQ2.1, cette question explore le modèle de transition fréquent de ces rôles identifiés des prompts dans les conversations à plusieurs tours. Les réponses aux sous-questions ci-dessus fourniront des insights aux chercheurs sur la dynamique et les pratiques des développeurs utilisant ChatGPT via plusieurs cycles d'interactions.

\ 4.1 Approche

Dans RQ2.1, nous considérons les prompts dans toutes les 189 conversations à plusieurs tours, c'est-à-dire 64 conversations de DevGPT-PRs et 125 de DevGPT-Issues. Suivant une méthode similaire à RQ1, nous avons utilisé le codage ouvert pour étiqueter manuellement 645 prompts (236 prompts de DevGPT-PRs et 409 prompts de DevGPT-Issues) dans des conversations à plusieurs tours sur trois cycles:

– Dans le premier cycle, cinq co-auteurs ont indépendamment étiqueté 20 conversations sélectionnées aléatoirement à partir des ensembles de données DevGPT-PRs et DevGPT-Issues à plusieurs tours, englobant 40 conversations et 123 prompts. Après discussion, nous avons développé un livre de codage composé de sept étiquettes distinctes.

– Dans le deuxième cycle, basé sur le livre de codage existant, deux annotateurs ont indépendamment étiqueté un autre ensemble de 20 conversations de chacun des ensembles de données DevGPT-PRs et DevGPT-Issues à plusieurs tours, soit un total de 144 prompts. Les deux annotateurs ont atteint un score d'accord inter-évaluateurs de 0,89, mesuré par le coefficient kappa de Cohen, représentant un accord presque parfait (Landis et Koch, 1977). Les annotateurs ont ensuite discuté et affiné le livre de codage.

\ – Enfin, chacun des deux annotateurs du deuxième cycle a indépendamment étiqueté les données restantes. Dans RQ2.2, nous utilisons un modèle de Markov (Gagniuc, 2017) pour analyser les modèles de flux de conversation en traçant un graphe de transition de Markov. Un graphe de transition de Markov est un graphe orienté qui démontre les transitions probabilistes

entre divers états ou nœuds. Dans notre cas, chaque nœud du graphe représente une catégorie spécifique développée dans RQ2.1, et les arêtes orientées entre les nœuds indiquent la probabilité de transition d'une taxonomie à une autre basée sur les conversations à plusieurs tours que nous avons collectées. Pour extraire des insights significatifs du graphe de transition de Markov, nous proposons les étapes de post-traitement suivantes:

  1. Nous avons élagué le graphe en supprimant les transitions avec des probabilités inférieures à 0,05, assurant une concentration sur les relations statistiquement significatives.

  2. Nous avons affiné la structure du graphe en supprimant les nœuds sans arêtes entrantes et sortantes, à l'exception des nœuds de début et de fin. Cette étape assure la simplification car nous ne gardons que les composants essentiels.

  3. Nous avons systématiquement réorganisé le graphe de transition de Markov en un organigramme pour améliorer son interprétabilité, offrant une représentation plus facile à comprendre des modèles de flux.

    \ 4.2 Résultats

    4.2.1 RQ 2.1 Quels sont les rôles des prompts des développeurs dans les conversations à plusieurs tours? Le Tableau 4 présente notre taxonomie proposée pour classifier les prompts dans les conversations à plusieurs tours. Notre analyse révèle que, dans les pull requests et les issues, les conversations à plusieurs tours contiennent trois types principaux de prompts: ceux qui posent des questions de suivi (M1), ceux qui introduisent la tâche initiale (M2), et ceux qui sont affinés à partir d'un prompt précédent (M3). Un prompt de DevGPT-PRs et six prompts de DevGPT-Issues ont été catégorisés sous "Autres" en raison de leur nature de conversation informelle ou du manque de détails suffisants pour déterminer leurs rôles.

    \ Ci-dessous, nous décrivons chaque catégorie plus en détail.

    ==(M1) Suivi itératif:== Dans 33% et 40% des prompts dans les DevGPT-PRs et DevGPT-Issues à plusieurs tours, les développeurs postent des requêtes qui s'appuient directement sur les réponses antérieures de ChatGPT ou sur le contexte en cours, comme le débogage et la réparation d'une solution après la génération de code par ChatGPT. De tels suivis itératifs émergent généralement lorsque la tâche initiale présente un défi complexe que ChatGPT pourrait ne pas résoudre entièrement en une seule interaction. Par conséquent, les développeurs s'engagent dans un prompt spécifiant une demande de suivi, permettant à ChatGPT d'incorporer les retours humains et d'améliorer itérativement la solution proposée.

    \ ==(M2) Révéler la tâche initiale:== Nous constatons qu'une fraction similaire, c'est-à-dire 26% dans les DevGPT-PRs à plusieurs tours et 29% dans les DevGPT-Issues à plusieurs tours, des prompts servent à introduire la tâche initiale à ChatGPT. Cette distribution souligne que dans les conversations à plusieurs tours, contrairement aux conversations à tour unique où le seul prompt est dédié à l'esquisse de la tâche principale, il y a une quantité significative de prompts servant à d'autres fins.

    \ ==(M3) Affiner le prompt:== Outre le suivi itératif (M1), les développeurs ont également tendance à améliorer la solution proposée par ChatGPT en fournissant un prompt de requête affiné avec un contexte ou des contraintes supplémentaires. L'objectif est d'améliorer la qualité de la réponse pour la même requête postée dans le prompt précédent. Les prompts affinés représentent 17% des prompts dans les DevGPT-PRs à plusieurs tours et 14% dans les DevGPT-Issues.

    \ ==(M4) Donner des informations:== Dans 8% et 6% des prompts dans les DevGPT-PRs et DevGPT-Issues à plusieurs tours, les développeurs ne postent aucune demande à ChatGPT, mais partagent plutôt des connaissances ou du contexte avec ChatGPT.

    \ ==(M5) Révéler une nouvelle tâche== Nous observons que 7% et 4% des prompts dans les DevGPT-PRs et DevGPT-Issues à plusieurs tours postent une nouvelle tâche à ChatGPT, qui est distincte de la ou des tâches concernées dans les prompts précédents. Cette catégorie représente une différence claire par rapport aux suivis itératifs (M1), car la nouvelle tâche n'est pas liée ou ne s'appuie pas sur les réponses antérieures de ChatGPT et vise un objectif différent. Par exemple, un développeur a initialement demandé à ChatGPT de générer le SQL correspondant à un ensemble de requêtes Django et, dans un prompt ultérieur, a demandé le SQL pour un ensemble de requêtes différent, déplaçant ainsi le focus de la conversation vers une tâche entièrement nouvelle sans pertinence antérieure.

    \ ==(M6) Retour négatif:== Dans les conversations à plusieurs tours, quelques prompts (6% dans les DevGPT-PRs et 2% dans les DevGPT-Issues) contiennent uniquement des retours négatifs dirigés vers les réponses précédentes de ChatGPT, sans fournir d'informations pour que ChatGPT s'améliore ou résolve davantage. Par exemple, "Votre code est incorrect", "La même erreur persiste", et "...ne fonctionne pas". Cette catégorie souligne les instances où les développeurs cherchent à informer ChatGPT de ses lacunes, sans chercher d'assistance ou de clarification supplémentaire.

    \ (M7) Demander des clarifications: 4% et 5% des prompts dans les DevGPT-PRs et DevGPT-Issues à plusieurs tours demandent à ChatGPT d'élaborer sur sa réponse. Ces demandes d'élaboration visent à assurer l'exhaustivité d'une solution, par exemple, "Dois-je faire autre chose?". Elles incluent également la vérification de la capacité de ChatGPT à gérer des tâches spécifiques, ou des enquêtes pour vérifier si certaines conditions ont été prises en compte dans la réponse. De plus, les développeurs peuvent demander pourquoi certaines alternatives ont été négligées par ChatGPT, indiquant un engagement plus profond avec les solutions proposées et un désir de comprendre la logique derrière la solution proposée par ChatGPT.

    4.2.2 RQ 2.2 Quels sont les modèles de flux dans les conversations à plusieurs tours?

    La Figure 5 présente l'organigramme résultant après avoir appliqué les étapes de post-traitement sur un graphe de transition de Markov basé sur les conversations annotées résultant de RQ2.1. L'organigramme s'applique aux conversations à plusieurs tours dans les DevGPT-PRs et DevGPT-Issues. Comme illustré dans la Figure 5, les conversations à plusieurs tours commencent généralement par la présentation de la tâche initiale (M2) ou des informations contextuelles (M4).

    \ Notre analyse de suivi détaillée révèle que 81% des conversations à plusieurs tours dans les DevGPT-PRs et 90% dans les DevGPT-Issues commencent par l'esquisse de la tâche initiale. À l'inverse, environ 13% des conversations à plusieurs tours dans les DevGPT-PRs et 3% dans les DevGPT-Issues introduisent la tâche initiale dans le deuxième prompt. Dans des cas extrêmes, la tâche initiale est divulguée aussi tard que le septième tour, ou, dans certains cas, la tâche initiale n'est jamais explicitement présentée—à la place, ces conversations ne présentent que des informations à ChatGPT sans énoncer directement la tâche.

    \ Quant au flux complet, nous avons identifié les modèles suivants basés sur la Figure 5:

  4. Début → révéler la tâche initiale → suivi itératif → fin

  5. Début → révéler la tâche initiale → affiner le prompt → (suivi itératif) → fin

  6. Début → révéler la tâche initiale → révéler une nouvelle tâche → fin

  7. Début → donner des informations → révéler la tâche initiale → … → fin

  8. Début → révéler la tâche initiale → demander des clarifications → fin

  9. Début → révéler la tâche initiale → retour négatif → fin

    \ Les modèles de flux (1) à (3) montrent les flux d'interaction développeur-ChatGPT les plus courants dans les conversations à plusieurs tours. La tâche initiale est divulguée dans le prompt initial, suivie de prompts visant à améliorer les réponses de ChatGPT via un suivi itératif, des affinements de prompt, ou pour révéler une nouvelle tâche.

    Le modèle (4) démontre des flux d'interaction commencés par des développeurs fournissant des informations à ChatGPT comme première étape. Ensuite, la tâche initiale a été révélée, suivie de modèles semblables à (1) à (3). Le modèle

Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter service@support.mexc.com pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.

Vous aimerez peut-être aussi

Directeur des investissements de Bitwise : Pourquoi avons-nous tous sous-estimé la nouvelle plateforme d'introduction en bourse de Coinbase ?

Directeur des investissements de Bitwise : Pourquoi avons-nous tous sous-estimé la nouvelle plateforme d'introduction en bourse de Coinbase ?

Auteur : Matt Hougan, CIO de Bitwise Compilé par : AididioJP, Foresight News Une idée fondamentale derrière l'investissement dans les crypto-monnaies est qu'elles vont remodeler l'infrastructure du secteur financier. Jusqu'à présent, nous pouvons citer trois domaines où de réels progrès ont été réalisés : Bitcoin redéfinit le rôle de l'or comme couverture contre l'inflation. Les Stablecoins redéfinissent le dollar. La tokenisation redéfinit le trading et le règlement. Bien que ces changements en soient encore à leurs débuts, la tendance est déjà assez claire. Je crois qu'à terme, la plupart des actifs seront tokenisés, la majorité des dollars américains circuleront via des stablecoins, et Bitcoin sera aussi largement accepté que l'or. Ce sont des opportunités de plusieurs billions de dollars, suffisantes pour alimenter un marché haussier d'une génération dans le marché des crypto-monnaies. Mais ce lundi, nous avons vu un quatrième domaine important : la formation de capital. Je crois que ce sera un thème clé dans l'espace des crypto-monnaies en 2026. Ensuite, j'expliquerai ce qui s'est exactement passé, pourquoi c'est si important, et comment saisir cette opportunité d'investissement si mon jugement est correct. Tout d'abord, passons en revue quelques éléments de contexte. La formation de capital est l'une des fonctions les plus importantes du secteur financier. Grâce à ce processus, les entrepreneurs peuvent lever des fonds, créer de nouvelles entreprises, développer des produits et créer des emplois. Malheureusement, le système actuel est non seulement rigide et inefficace, mais aussi extrêmement hostile aux investisseurs individuels. Les fonds institutionnels affluent vers les entreprises de risques capitaux de premier plan, qui réinvestissent ensuite dans les meilleures startups. Ces entreprises restent privées pendant de longues périodes, accumulant continuellement de la valeur pour les premiers actionnaires. Lorsqu'elles entrent finalement en bourse, les actions sont principalement vendues à d'autres investisseurs institutionnels. Les investisseurs particuliers ne peuvent participer qu'aux dernières étapes. Ce système est coûteux et complexe sur le plan réglementaire, ce qui entraîne un nombre d'introductions en bourse nettement inférieur à celui du passé. Les crypto-monnaies ont tenté de changer cela en 2017 et 2018 avec l'essor des Initial Coin Offerings (ICO). Les ICO permettaient aux gens ordinaires d'investir dans des projets avant qu'ils ne deviennent publics, connectant directement les entrepreneurs et les investisseurs particuliers. Mais pour être honnête, le résultat a été un désastre complet. En raison d'un manque de réglementation, la grande majorité des ICO se sont finalement avérées être des arnaques. Des escrocs ont levé des milliards de dollars auprès d'un public non averti, puis se sont enfuis avec l'argent. La situation s'est aggravée au point que la Commission américaine des valeurs mobilières et des échanges (SEC) a dû intervenir, menaçant même de poursuivre pénalement les promoteurs. La répression de 2018 a mis fin à la folie des ICO et plongé le marché des crypto-monnaies dans un long hiver. Alors, qu'est-ce qui est différent maintenant ? La plupart des personnes qui ont vécu le boom des ICO de 2017-2018 le considèrent comme un échec complet, exposant pleinement la nature opaque de l'espace des crypto-monnaies. Cependant, une petite minorité y a vu un potentiel. Malgré les nombreux problèmes des ICO, elles ont en effet prouvé une chose : les crypto-monnaies peuvent rapidement lever des fonds pour de nouveaux projets. Par rapport aux coûts élevés, aux procédures lourdes et à la tendance à favoriser les riches dans les introductions en bourse traditionnelles, les ICO sont en effet moins chères, plus rapides et plus équitables. Paul Atkins, l'actuel président de la Commission américaine des valeurs mobilières et des échanges (SEC), est l'un de ceux qui voient ce potentiel. Son soutien aux projets d'ICO n'est pas surprenant : avant de rejoindre la SEC, il a été co-président de la Token Alliance, une organisation dédiée à la promotion de l'innovation dans les tokens ICO. Il a également siégé au conseil d'administration de Securitize, une entreprise axée sur la tokenisation. En juillet de cette année, Atkins a publiquement appelé à l'établissement d'un nouveau cadre réglementaire et d'un système de prévention des risques pour créer les conditions propices à des ICO de haute qualité. Il a soutenu que tant que les problèmes de la version 1.0 des ICO peuvent être résolus, nous pouvons nous attendre à inaugurer un boom de formation de capital mené par les crypto-monnaies. Ce lundi, Coinbase a franchi une étape importante dans cette direction en annonçant le lancement de sa plateforme ICO. Désormais, Coinbase lancera chaque mois un projet de crypto-monnaie rigoureusement examiné. Cela permet aux investisseurs de participer à l'investissement avant le lancement du projet et permet aux équipes de projet d'explorer de nouveaux canaux de collecte de fonds. Coinbase appliquera des normes strictes, notamment des vérifications des antécédents des équipes, des exigences de divulgation d'informations et s'assurera que les initiés ne peuvent pas vendre de tokens dans les six mois suivant le lancement du projet. En bref, par l'autorèglementation, ils visent à résoudre de nombreux problèmes de l'ère ICO 2017-2018. Mes prédictions et perspectives Je prédis que d'ici 2026, il y aura au moins six ICO de plusieurs milliards de dollars via des plateformes comme Coinbase. Bien que ce soit encore petit par rapport au marché traditionnel des introductions en bourse - qui a vu 176 introductions en bourse aux États-Unis en 2024, levant un total de 33 milliards de dollars - le succès de ces ICO prouvera que les entrepreneurs peuvent effectivement lever des fonds directement auprès des investisseurs, souvent avec de meilleures conditions que les introductions en bourse traditionnelles. Au fil du temps, je crois que de plus en plus de projets choisiront le modèle ICO direct au lieu des voies de financement traditionnelles. Concernant la façon d'investir dans ce thème, j'ai quelques réflexions : Si mon jugement est correct, la cible d'investissement la plus directe est Coinbase. Cette entreprise exploite sa position dominante dans l'espace de trading de crypto-monnaies pour s'étendre à de nouveaux marchés. Ce n'est pas seulement Charles Schwab dans le monde crypto, mais une combinaison de Charles Schwab, Goldman Sachs et le NYSE. En même temps, un marché ICO sain profitera également aux grandes blockchains programmables telles qu'Ethereum et Solana, car de nombreux projets ICO sont construits sur ces plateformes. À plus grande échelle, la résurgence des ICO sera une autre étape importante pour l'espace des crypto-monnaies. Les crypto-monnaies ont maintenant plus de potentiel qu'il y a quelques années parce que nous avons le récit des stablecoins et de la tokenisation. Ce récit devient encore plus convaincant lorsque vous ajoutez les milliards de dollars levés par les ICO. Cette tendance suggère une stratégie de marché plus large : par exemple, investir dans des fonds indiciels qui incluent un panier d'actifs crypto ou d'actions crypto. En d'autres termes, ne vous enlisez pas dans le choix d'un cheval particulier, mais pariez plutôt que toute la course s'améliorera de plus en plus. Ce match devient de plus en plus passionnant.
Partager
PANews2025/11/13 09:00