本研究探討開發人員如何與 ChatGPT 進行多輪互動,分析了 645 個來自真實編碼對話的提示。它將開發人員的訊息分為七種角色—從介紹任務到優化查詢和提供反饋—並使用馬可夫模型來映射他們的對話流程。結果顯示,大多數對話始於任務定義,隨後是迭代性的後續跟進或優化,以改進 ChatGPT 的回應。這些發現揭示了開發人員如何通過分層、以反饋為驅動的交流而非單次查詢,與 AI 共同演化解決方案。本研究探討開發人員如何與 ChatGPT 進行多輪互動,分析了 645 個來自真實編碼對話的提示。它將開發人員的訊息分為七種角色—從介紹任務到優化查詢和提供反饋—並使用馬可夫模型來映射他們的對話流程。結果顯示,大多數對話始於任務定義,隨後是迭代性的後續跟進或優化,以改進 ChatGPT 的回應。這些發現揭示了開發人員如何通過分層、以反饋為驅動的交流而非單次查詢,與 AI 共同演化解決方案。

分析 ChatGPT 對話中開發者提示的流程

2025/11/13 01:30

摘要

1 引言

2 資料收集

3 研究問題1:開發人員在初始提示中向ChatGPT提出哪些類型的軟體工程查詢?

4 研究問題2:開發人員如何在多輪對話中向ChatGPT提出查詢?

5 研究問題3:分享行為的特徵是什麼?

6 討論

7 有效性威脅

8 相關工作

9 結論與未來工作

參考文獻

\

研究問題2:開發人員如何在多輪對話中向ChatGPT提出查詢?

==動機:== 圖3和圖4中呈現的結果顯示,DevGPT-PRs(33.2%)和DevGPT-Issues(26.9%)中有相當大一部分包含多輪對話。在單輪對話中,開發人員在初始提示中提出與軟體工程相關的查詢,並從ChatGPT獲得一個回應,提供了清晰直接的交流。然而,多輪對話的動態引入了複雜性。這些互動超越了簡單的查詢和回應,涉及一系列可能會精煉、擴展或澄清初始查詢的交流。

\ 這種分層通信引發了關於開發人員在多輪對話中表達查詢策略的問題。因此,我們提出研究問題2,研究開發人員在多輪對話中提示的性質。為了進行全面分析,我們進一步引入兩個子研究問題:

研究問題2.1:開發人員提示在多輪對話中扮演什麼角色? 這個問題旨在對相應多輪對話中每個提示的結構角色進行分類。

研究問題2.2:多輪對話中的流程模式是什麼? 基於研究問題2.1的答案所提出的分類法,這個問題探討多輪對話中已識別提示角色的頻繁轉換模式。上述子研究問題的答案將為研究人員提供關於開發人員通過多輪互動使用ChatGPT的動態和實踐的見解。

\ 4.1 方法

在研究問題2.1中,我們考慮所有189個多輪對話中的提示,即來自DevGPT-PRs的64個對話和來自DevGPT-Issues的125個對話。採用類似於研究問題1的方法,我們使用開放式編碼手動標記多輪對話中的645個提示(來自DevGPT-PRs的236個提示和來自DevGPT-Issues的409個提示),分三輪進行:

– 在第一輪中,五位共同作者獨立標記從多輪DevGPT-PRs和DevGPT-Issues數據集中隨機選擇的20個對話,包括40個對話和123個提示。討論後,我們開發了一個包含七個不同標籤的編碼手冊。

– 在第二輪中,基於現有的編碼手冊,兩位註釋者獨立標記了來自多輪DevGPT-PRs和DevGPT-Issues數據集的另外20個對話,共144個提示。兩位註釋者達到了0.89的評分者間一致性分數,以Cohen's kappa係數衡量,代表幾乎完全一致(Landis和Koch,1977)。然後註釋者討論並完善了編碼手冊。

\ – 最後,第二輪的兩位註釋者各自獨立標記了剩餘的數據。在研究問題2.2中,我們使用馬爾可夫模型(Gagniuc,2017)通過繪製馬爾可夫轉換圖來分析對話流程模式。馬爾可夫轉換圖是一個有向圖,展示了

各種狀態或節點之間的概率轉換。在我們的案例中,圖中的每個節點代表研究問題2.1中開發的特定類別,節點之間的有向邊表示基於我們收集的多輪對話從一個分類法轉換到另一個的可能性。為了從馬爾可夫轉換圖中提取有意義的見解,我們提出以下後處理步驟:

  1. 我們通過移除概率低於0.05的轉換來修剪圖,確保專注於統計上顯著的關係。

  2. 我們通過移除沒有入邊和出邊的節點(除了起始和結束節點)來精簡圖結構。這一步確保簡化,因為我們只保留基本組件。

  3. 我們系統地將馬爾可夫轉換圖重組為流程圖,以增強其可解釋性,提供更容易理解的流程模式表示。

    \ 4.2 結果

    4.2.1 研究問題2.1 開發人員提示在多輪對話中扮演什麼角色? 表4呈現了我們提出的分類法,用於分類多輪對話中的提示。我們的分析顯示,在拉取請求和問題中,多輪對話包含三種主要類型的提示:提出後續問題的提示(M1)、介紹初始任務的提示(M2)和從先前提示精煉的提示(M3)。來自DevGPT-PRs的一個提示和來自DevGPT-Issues的六個提示被歸類為"其他",因為它們的性質是隨意對話或缺乏足夠的細節來確定其角色。

    \ 以下,我們更詳細地描述每個類別。

    ==(M1) 迭代跟進:== 在多輪DevGPT-PRs的33%和DevGPT-Issues的40%的提示中,開發人員發布直接基於ChatGPT先前回應或正在進行的上下文的查詢,例如在ChatGPT生成代碼後進行調試和修復解決方案。當初始任務呈現ChatGPT可能無法在單次互動中完全解決的複雜挑戰時,通常會出現這種迭代跟進。因此,開發人員參與指定後續請求的提示,使ChatGPT能夠納入人類反饋並迭代增強提出的解決方案。

    \ ==(M2) 揭示初始任務:== 我們發現,類似比例的提示,即多輪DevGPT-PRs中的26%和多輪DevGPT-Issues中的29%,用於向ChatGPT介紹初始任務。這種分佈突顯了在多輪對話中,與單輪對話不同,在單輪對話中,唯一的提示專用於概述主要任務,而在多輪對話中有相當數量的提示服務於其他目的。

    \ ==(M3) 精煉提示:== 除了迭代跟進(M1)外,開發人員還傾向於通過提供帶有額外上下文或約束的精煉請求提示來改進ChatGPT提出的解決方案。目標是提高先前提示中發布的相同查詢的回應質量。精煉提示佔多輪DevGPT-PRs中提示的17%和DevGPT-Issues中的14%。

    \ ==(M4) 提供信息:== 在多輪DevGPT-PRs的8%和DevGPT-Issues的6%的提示中,開發人員不向ChatGPT發布任何請求,而是與ChatGPT分享知識或上下文。

    \ ==(M5) 揭示新任務== 我們觀察到,多輪DevGPT-PRs的7%和DevGPT-Issues的4%的提示向ChatGPT發布了一個新任務,該任務與先前提示中涉及的任務不同。這個類別與迭代跟進(M1)有明顯區別,因為新任務與ChatGPT先前的回應無關,也不基於它們,而是針對不同的目標。例如,開發人員最初請求ChatGPT生成與Django查詢集對應的SQL,然後在後續提示中要求為不同的查詢集生成SQL,從而將對話焦點轉移到一個全新的任務,沒有先前的相關性。

    \ ==(M6) 負面反饋:== 在多輪對話中,少數(DevGPT-PRs中的6%和DevGPT-Issues中的2%)提示僅包含針對ChatGPT先前回應的負面反饋,而沒有提供任何信息讓ChatGPT改進或進一步解決。例如,"你的代碼不正確","同樣的錯誤仍然存在",和"...不起作用"。這個類別強調了開發人員尋求告知ChatGPT其缺點的情況,而不尋求進一步的幫助或澄清。

    \ (M7) 要求澄清: 多輪DevGPT-PRs中的4%和DevGPT-Issues中的5%的提示要求ChatGPT詳細說明其回應。這些詳細說明請求旨在確保解決方案的全面性,例如,"我還需要做其他事情嗎?"。它們還包括驗證ChatGPT處理特定任務的能力,或查詢以驗證在回應中是否考慮了某些條件。此外,開發人員可能會詢問為什麼ChatGPT忽略了某些替代方案,表明對提出的解決方案有更深入的參與,並希望了解ChatGPT提出解決方案背後的理由。

    4.2.2 研究問題2.2 多輪對話中的流程模式是什麼?

    圖5呈現了在研究問題2.1的結果基礎上,對標註對話應用後處理步驟後的馬爾可夫轉換圖所得到的流程圖。該流程圖適用於DevGPT-PRs和DevGPT-Issues中的多輪對話。如圖5所示,多輪對話通常以呈現初始任務(M2)或上下文信息(M4)開始。

    \ 我們詳細的後續分析顯示,DevGPT-PRs中81%的多輪對話和DevGPT-Issues中90%的多輪對話以概述初始任務開始。相反,DevGPT-PRs中約13%的多輪對話和DevGPT-Issues中3%的多輪對話在第二個提示中介紹初始任務。在極端情況下,初始任務在第七輪才被披露,或者在某些情況下,初始任務從未被明確呈現—相反,這些對話只向ChatGPT呈現信息,而沒有直接說明任務。

    \ 至於完整流程,我們基於圖5識別了以下模式:

  4. 開始 → 揭示初始任務 → 迭代跟進 → 結束

  5. 開始 → 揭示初始任務 → 精煉提示 → (迭代跟進) → 結束

  6. 開始 → 揭示初始任務 → 揭示新任務 → 結束

  7. 開始 → 提供信息 → 揭示初始任務 → ... → 結束

  8. 開始 → 揭示初始任務 → 要求澄清 → 結束

  9. 開始 → 揭示初始任務 → 負面反饋 → 結束

    \ 流程模式(1)到(3)顯示了多輪對話中最常見的開發人員-ChatGPT互動流程。初始任務在初始提示中披露,隨後是旨在通過迭代跟進、提示精煉或揭示新任務來改進ChatGPT回應的提示。

    模式(4)展示了由開發人員首先提供信息給ChatGPT開始的互動流程。然後,初始任務被揭示,接著是類似於(1)到(3)的模式。模

免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 service@support.mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡

Bitwise CIO:為什麼我們都低估了 Coinbase 的新 IPO 平台?

Bitwise CIO:為什麼我們都低估了 Coinbase 的新 IPO 平台?

作者:Matt Hougan,Bitwise 首席投資官 編譯:AididioJP,Foresight News 投資加密貨幣背後的核心理念是它們將重塑金融業的基礎設施。到目前為止,我們可以列舉三個已取得實質進展的領域:比特幣正在重塑黃金作為通脹對沖的角色。穩定幣正在重塑美元。代幣化正在重塑交易和結算。儘管這些變化仍處於早期階段,但趨勢已經相當明顯。我相信最終大多數資產將被代幣化,大多數美元將通過穩定幣流通,而比特幣將像黃金一樣被廣泛接受。這些是數萬億美元的機會,足以推動加密貨幣市場一代人的牛市。但就在本週一,我們看到了第四個重要領域:資本形成。我相信這將成為2026年加密貨幣領域的關鍵主題。接下來,我將解釋具體發生了什麼,為什麼這如此重要,以及如果我的判斷正確,如何抓住這個投資機會。首先,讓我們回顧一些背景。資本形成是金融部門最重要的功能之一。通過這個過程,企業家能夠籌集資金,創辦新公司,開發產品,並創造就業機會。不幸的是,當前的系統不僅僵化且效率低下,而且對個人投資者極不友好。機構資金流向頂級風險投資公司,然後再投資於最佳初創企業。這些公司長期保持私有狀態,不斷為早期股東積累價值。當它們最終上市時,股票主要賣給其他機構投資者。散戶投資者只能參與最後階段。這個系統成本高昂且監管複雜,導致IPO數量比過去顯著減少。加密貨幣在2017年和2018年試圖通過首次代幣發行(ICO)熱潮改變這一點。ICO允許普通人在項目上市前進行投資,直接連接企業家和散戶投資者。但老實說,結果是一場徹底的災難。由於缺乏監管,絕大多數ICO最終被證明是騙局。騙子從毫無戒心的公眾那裡籌集了數十億美元,然後捲款而逃。情況惡化到美國證券交易委員會(SEC)不得不介入的地步,甚至威脅對推廣者提出刑事指控。2018年的打擊結束了ICO狂熱,並使加密貨幣市場陷入長期寒冬。那麼,現在有什麼不同?大多數經歷過2017-2018年ICO熱潮的人認為它是一場徹底的失敗,完全暴露了加密貨幣領域的不透明性質。然而,少數人看到了其中的潛力。儘管ICO存在諸多問題,但它們確實證明了一點:加密貨幣可以快速為新項目籌集資金。與傳統IPO的高成本、繁瑣程序和傾向於有利於富人相比,ICO確實更便宜、更快速、更公平。美國證券交易委員會(SEC)現任主席Paul Atkins就是看到這種潛力的人之一。他對ICO項目的支持並不令人驚訝:在加入SEC之前,他曾擔任Token Alliance的聯合主席,該組織致力於促進ICO代幣的創新。他還曾在專注於代幣化的公司Securitize的董事會任職。今年7月,Atkins公開呼籲建立新的監管框架和風險防範系統,為高質量ICO創造條件。他認為,只要能解決ICO 1.0版本的問題,我們就可以期待迎來由加密貨幣引領的資本形成繁榮。本週一,Coinbase在這個方向上邁出了重要一步,宣布推出其ICO平台。從現在開始,Coinbase將每月推出一個經過嚴格審查的加密貨幣項目。這使投資者能夠在項目啟動前參與投資,並使項目團隊能夠探索新的籌資渠道。Coinbase將執行嚴格標準,包括團隊背景調查、信息披露要求,以及確保內部人士在項目啟動後六個月內不能出售代幣。簡而言之,通過自我監管,他們旨在解決2017-2018年ICO時代的許多問題。我的預測和展望 我預測到2026年,將通過像Coinbase這樣的平台至少有六個數十億美元規模的ICO。雖然與傳統IPO市場相比這仍然很小——2024年美國有176個IPO,共籌集了330億美元——但這些ICO的成功將證明企業家確實可以直接從投資者那裡籌集資金,而且條件往往比傳統IPO更好。隨著時間的推移,我相信越來越多的項目將選擇直接ICO模式而非傳統融資路徑。關於如何投資這個主題,我有幾點想法:如果我的判斷正確,最直接的投資目標是Coinbase。這家公司正在利用其在加密貨幣交易領域的主導地位擴展到新市場。它不僅是加密世界的Charles Schwab,而是Charles Schwab、Goldman Sachs和NYSE的結合體。同時,健康的ICO市場也將使像Ethereum和Solana這樣的大型可編程區塊鏈受益,因為許多ICO項目都建立在這些平台上。從更廣泛的角度來看,ICO的復興將是加密貨幣領域的另一個重要里程碑。加密貨幣現在比幾年前有更多潛力,因為我們有穩定幣和代幣化的敘事。當你加上通過ICO籌集的數十億美元時,這個敘事變得更加引人注目。這一趨勢暗示了更廣泛的市場策略:例如,投資包含一籃子加密資產或加密股票的指數基金。換句話說,不要陷入選擇特定賽馬的困境,而是押注整個比賽會越來越好。這場比賽正變得越來越精彩。
分享
PANews2025/11/13 09:00