Eine empirische Studie und Replikation zeigen, dass Entwickler häufig die Wirksamkeit von Test- und Code-Review-Techniken falsch einschätzen. Diese Fehleinschätzungen – oftEine empirische Studie und Replikation zeigen, dass Entwickler häufig die Wirksamkeit von Test- und Code-Review-Techniken falsch einschätzen. Diese Fehleinschätzungen – oft

Warum Entwickler immer wieder die falschen Testmethoden wählen

2025/12/15 05:09

:::info Autoren:

  1. Sira Vegas
  2. Patricia Riofr´ıo
  3. Esperanza Marcos
  4. Natalia Juristo

:::

Abstract

1 Einleitung

2 Ursprüngliche Studie: Forschungsfragen und Methodik

3 Ursprüngliche Studie: Bedrohungen der Validität

4 Ursprüngliche Studie: Ergebnisse

5 Replizierte Studie: Forschungsfragen und Methodik

6 Replizierte Studie: Bedrohungen der Validität

7 Replizierte Studie: Ergebnisse

8 Diskussion

9 Verwandte Arbeiten

10 Schlussfolgerungen und Referenzen

Abstract

Ein wiederkehrendes Problem in der Softwareentwicklung ist die falsche Entscheidungsfindung bei den zu verwendenden Techniken, Methoden und Werkzeugen. Meistens basieren diese Entscheidungen auf den Wahrnehmungen der Entwickler. Ein Faktor, der die Wahrnehmung der Menschen beeinflusst, ist die Erfahrung aus der Vergangenheit, aber es ist nicht der einzige. In dieser Forschung wollen wir herausfinden, wie gut die Wahrnehmungen der Fehlererkennungseffektivität verschiedener Techniken mit ihrer tatsächlichen Effektivität ohne vorherige Erfahrung übereinstimmen.

\ Dazu führen wir eine empirische Studie und eine Replikation durch. Während der ursprünglichen Studie führen wir ein kontrolliertes Experiment mit Studenten durch, die zwei Testtechniken und eine Code-Review-Technik anwenden. Am Ende des Experiments nehmen sie an einer Umfrage teil, um herauszufinden, welche Technik sie als am effektivsten wahrnehmen. Die Ergebnisse zeigen, dass die Wahrnehmungen der Teilnehmer falsch sind und dass diese Diskrepanz in Bezug auf die Qualität kostspielig ist.

\ Um weitere Einblicke in die Ergebnisse zu gewinnen, wiederholen wir das kontrollierte Experiment und erweitern die Umfrage um Fragen zu den Meinungen der Teilnehmer zu den Techniken und Programmen. Die Ergebnisse der replizierten Studie bestätigen die Erkenntnisse der ursprünglichen Studie und deuten darauf hin, dass die Wahrnehmungen der Teilnehmer möglicherweise nicht auf ihren Meinungen über Komplexität oder Präferenzen für Techniken basieren, sondern darauf, wie gut sie glauben, die Techniken angewendet zu haben.

1. Einleitung

Eine zunehmend beliebte Praxis heutzutage ist es, dass Softwareentwicklungsunternehmen Entwicklern erlauben, ihre eigene technologische Umgebung zu wählen. Dies bedeutet, dass verschiedene Entwickler unterschiedliche Produktivitätswerkzeuge verwenden können (Programmiersprache, IDE usw.). Softwaretechnik (SE) ist jedoch eine menschenintensive Disziplin, bei der falsche Entscheidungen potenziell die Qualität der resultierenden Software beeinträchtigen können. In SE basieren Entscheidungen darüber, welche Methoden, Techniken und Werkzeuge in der Softwareentwicklung verwendet werden sollen, typischerweise eher auf den Wahrnehmungen und/oder Meinungen der Entwickler als auf Beweisen, wie von Dyb˚a et al. [19] und Zelkowitz et al. [55] vorgeschlagen.

\ Empirische Beweise sind jedoch möglicherweise nicht verfügbar, da bestimmte Methoden, Techniken oder Werkzeuge möglicherweise nicht in einem bestimmten Umfeld oder überhaupt nicht untersucht wurden. Alternativ sind Entwickler möglicherweise einfach nicht mit solchen Studien vertraut, laut Vegas & Basili [49]. Auf dieser Grundlage ist es wichtig zu entdecken, wie gut die Wahrnehmungen der Entwickler (Überzeugungen) mit der Realität übereinstimmen und, wenn nicht, herauszufinden, was hinter dieser Diskrepanz steckt, wie von Devanbu et al. [14] festgestellt. Laut Psychologie spielt Erfahrung eine Rolle bei den Wahrnehmungen der Menschen. Dies wurde auch von Devanbu et al. [14] in SE beobachtet.

\ Diese Forschung zielt jedoch darauf ab, herauszufinden, wie gut Wahrnehmungen mit der Realität übereinstimmen, wenn keine vorherige Erfahrung mit der verwendeten Technologie vorhanden ist. Dies macht aus mehreren Gründen Sinn: 1) Erfahrung ist nicht der einzige Faktor, der die Wahrnehmungen der Entwickler beeinflusst; 2) Entwicklungsteams bestehen in der Regel aus einer Mischung von Personen mit und ohne Erfahrung; und 3) es ist nicht klar, welche Art von Erfahrung die Wahrnehmungen beeinflusst. Zum Beispiel schließen Dieste et al. [17], dass akademische und nicht berufliche Erfahrung die externe Qualität des von Entwicklern generierten Codes bei der Anwendung von Test-Driven Development beeinflussen könnte.

\ Wir wollen untersuchen, ob die Wahrnehmungen über die Wirksamkeit von drei Fehlererkennungstechniken mit der Realität übereinstimmen, und wenn nicht, was hinter diesen Wahrnehmungen steckt. Nach unserem besten Wissen ist dies das erste Papier, das dieses Problem empirisch bewertet. Zu diesem Zweck haben wir eine empirische Studie und eine Replikation mit Studenten durchgeführt. Während der ursprünglichen Studie haben wir (als Teil eines kontrollierten Experiments) die Wirksamkeit von zwei Testtechniken und einer Code-Review-Technik gemessen, wenn sie von den Teilnehmern angewendet wurden. Anschließend haben wir die als am effektivsten wahrgenommene Technik (durch eine Umfrage ermittelt) mit der tatsächlichen verglichen.

\ Zusätzlich haben wir die Kosten der Diskrepanz zwischen Wahrnehmungen und Realität in Bezug auf den Verlust an Effektivität analysiert. Zu den wichtigsten Ergebnissen gehören:

– Verschiedene Personen nehmen unterschiedliche Techniken als effektiver wahr. Keine Technik wird als effektiver wahrgenommen als die anderen. – Die Wahrnehmungen von 50% der Teilnehmer (11 von 23) sind falsch.

– Falsche Wahrnehmung von Techniken kann die Effektivität im Durchschnitt um 31 Prozentpunkte reduzieren.

\ Diese Erkenntnisse führten uns dazu, das Ziel der Studie in einer Replikation zu erweitern, um zu untersuchen, was hinter den Wahrnehmungen der Teilnehmer stehen könnte. Dazu untersuchten wir ihre Meinungen zu den von ihnen angewendeten Techniken und den getesteten Programmen in einer Replikation des kontrollierten Experiments. Zu den wichtigsten Ergebnissen gehören:

– Die Ergebnisse der Replikation bestätigen die Erkenntnisse der ursprünglichen Studie.

– Die Teilnehmer denken, dass die Wirksamkeit der Technik ausschließlich von ihrer Leistung abhängt und nicht von möglichen Schwächen der Technik selbst. – Die Meinungen über die Komplexität der Technik und die Präferenzen für Techniken scheinen keine Rolle bei der wahrgenommenen Wirksamkeit zu spielen. Diese Ergebnisse sind für Entwickler und Forscher nützlich. Sie legen nahe:

– Entwickler sollten sich der Grenzen ihres Urteils bewusst werden.

– Es sollten Werkzeuge entwickelt werden, die den Entwicklern Feedback darüber geben, wie effektiv Techniken sind.

– Die beste Kombination von anzuwendenden Techniken sollte bestimmt werden, die gleichzeitig leicht anwendbar und effektiv ist. – Es sollten Instrumente entwickelt werden, um empirische Ergebnisse für Entwickler verfügbar zu machen.

\ Das mit den hier vorgestellten Studien verbundene Material ist unter https://github.com/GRISE-UPM/Misperceptions zu finden. Der Artikel ist wie folgt organisiert. Abschnitt 2 beschreibt die ursprüngliche Studie. Abschnitt 3 stellt ihre Bedrohungen der Validität dar. Abschnitt 4 diskutiert die Ergebnisse. Abschnitt 5 beschreibt die replizierte Studie basierend auf den Änderungen, die an der ursprünglichen Studie vorgenommen wurden. Abschnitt 6 stellt ihre Bedrohungen der Validität dar. Abschnitt 7 berichtet über die Ergebnisse dieser replizierten Studie. Abschnitt 8 diskutiert unsere Erkenntnisse und ihre Auswirkungen. Abschnitt 9 zeigt verwandte Arbeiten. Schließlich skizziert Abschnitt 10 die Schlussfolgerungen dieser Arbeit.

\ \

:::info Dieses Papier ist auf arxiv verfügbar unter der CC BY-NC-ND 4.0 Lizenz.

:::

\

Haftungsausschluss: Die auf dieser Website veröffentlichten Artikel stammen von öffentlichen Plattformen und dienen ausschließlich zu Informationszwecken. Sie spiegeln nicht unbedingt die Ansichten von MEXC wider. Alle Rechte verbleiben bei den ursprünglichen Autoren. Sollten Sie der Meinung sein, dass Inhalte die Rechte Dritter verletzen, wenden Sie sich bitte an service@support.mexc.com um die Inhalte entfernen zu lassen. MEXC übernimmt keine Garantie für die Richtigkeit, Vollständigkeit oder Aktualität der Inhalte und ist nicht verantwortlich für Maßnahmen, die aufgrund der bereitgestellten Informationen ergriffen werden. Die Inhalte stellen keine finanzielle, rechtliche oder sonstige professionelle Beratung dar und sind auch nicht als Empfehlung oder Billigung von MEXC zu verstehen.

Das könnte Ihnen auch gefallen

"Wollen Donbass nicht aufgeben": Selenskyj wehrt sich weiter gegen Gebietsabtretungen

"Wollen Donbass nicht aufgeben": Selenskyj wehrt sich weiter gegen Gebietsabtretungen

In Berlin kommen am Montag etliche internationale Staats- und Regierungschefs zu Beratungen über eine Beendigung des russischen Angriffskriegs gegen die Ukraine
Teilen
N-tv2025/12/16 13:11
Solanas (SOL) jüngste Rally mag beeindrucken, aber Investoren, die auf lebensverändernde ROI abzielen, schauen woanders hin

Solanas (SOL) jüngste Rally mag beeindrucken, aber Investoren, die auf lebensverändernde ROI abzielen, schauen woanders hin

Der Beitrag Solanas (SOL) jüngste Rally mag beeindrucken, aber Investoren, die nach lebensverändernder Kapitalrendite (ROI) suchen, schauen woanders hin erschien auf BitcoinEthereumNews.com. Solanas (SOL) neueste Rally hat Investoren von überall angezogen, aber die größere Geschichte für zukunftsorientierte Investoren ist, wohin die nächsten Wellen lebensverändernder Renditen gehen werden. Während Solana weiterhin hohe Nutzungsraten des Ökosystems und Netzwerkauslastung verzeichnet, wird langsam die Bühne für Mutuum Finance (MUTM) bereitet. MUTM wird in seinem schnell wachsenden Vorverkauf mit 0,035 $ bewertet. Eine Preissteigerung von 14,3% ist das, was die Investoren in der nächsten Phase erwarten können. Über 15,85 Millionen Dollar wurden bereits gesammelt, während der Vorverkauf weiter an Dynamik gewinnt. Im Gegensatz zu den meisten Token, die auf kurzfristigen Hype-Wellen surfen, entwickelt sich Mutuum Finance zu einer nutzungsorientierten Wahl mit mehr Wertpotenzial und damit zu einer zunehmend besseren Option für Investoren, die mehr als nur Preisbewegungen suchen. Solana hält Gewinne nahe 234 $ während die Spekulation anhält Solana (SOL) wird derzeit bei 234,08 $ gehandelt und hält seine 24-Stunden-Spanne um 234,42 $ bis 248,19 $, was den jüngsten Trend veranschaulicht. Der Token hat starke Sieben-Tage-Gewinne von fast 13% verzeichnet, weit über den meisten seiner Mitbewerber, da er durch steigendes Volumen und institutionelle Käufe unterstützt wird. Der Widerstand liegt bei 250-260 $, und die Unterstützungsstufe scheint bei 220-230 $ zu liegen, und somit sind dies bedeutende Niveaus für potenzielle Ausbrüche oder Rückgänge. Allerdings wird die neue DeFi-Kryptowährung Mutuum Finance von Marktbeobachtern als potenziell aufstrebender betrachtet, da sie sich noch im Vorverkauf befindet. Mutuum Finance Phase 6 Vorverkauf Mutuum Finance befindet sich derzeit in der Vorverkaufsphase 6 und bietet Token für 0,035 $ an. Der Vorverkauf verlief sehr schnell, und Investoren haben über 15,85 Millionen Dollar aufgebracht. Das Projekt strebt auch einen USD-gebundenen Stablecoin auf der Ethereum-Blockchain für bequeme Zahlungen und als Bewahrer langfristigen Werts an. Mutuum Finance ist eine Dual-Lending-, Mehrzweck-DeFi-Plattform, die sowohl Kreditnehmern als auch Kreditgebern zugutekommt. Sie bietet das Netzwerk für den Einzelhandel sowie...
Teilen
BitcoinEthereumNews2025/09/18 06:23
Doekhi will Verband wechseln: WM-Traum von Berliner Fußball-Star landet vor höchstem Gericht

Doekhi will Verband wechseln: WM-Traum von Berliner Fußball-Star landet vor höchstem Gericht

Das kleine Land Suriname kämpft noch um ein Ticket für die Fußball-WM. Im kommenden Jahr muss das Nationalteam in den Playoffs ran und hofft dabei auf prominent
Teilen
N-tv2025/12/16 13:03