Auch dieses Jahr sind wir nach Mannheim gereist, um einen Vortrag über Git zu halten. Und auch dieses Mal haben wir das Konferenzprogramm auch als Teilnehmern mitgenommen. Und wieder hat es sich gelohnt. Es waren wieder viele gute und inhaltlich interessante Vorträge dabei.
(René und Bjørn)
(Dave Farley)
Mich muss man ja nun nicht mehr davon überzeugen, dass Continuous Delivery notwendig ist, um innovative Software zu entwickeln. Ich habe das (bei etracker) ja über mehrere Jahre erlebt, und bin, zurückhaltend formuliert, sehr überzeugt. Und genau darum ging es in Daves Keynote: Leute überzeugen, dass Continuous Delivery der richtige Weg ist. Wer Material sucht, um in der eigenen Organisation zu evangelisieren, der sollte sich Dave Farley mal anhören. Er ist motivierend.
Im Mittelpunkt sieht Dave die Cycle Time: Das ist die Zeit, welche die kleinstmögliche Änderung benötigt, bis sie vom Anwender produktiv genutzt wird. Die Cycle Time ist so wichtig, weil sie die Geschwindigkeit des Lernens bestimmt. Die These von Dave: Ohne Continuous Delivery und Agile/Lean wird man eine brauchbare Cycle Time nicht erreichen können.
If you start optimizing cycle time now, you will start inventing all of agile and continuous delivery.
Sehr prägnant das Statement zum manuellen Testen:
Human Beings doing regression testing is waste!
Use Human Being for exploratory testing.
Have you used Amazon recently? Which version did you use? Amazon releases every 11.6 Seconds.
Womit verbringen wir unsere Zeit? Wieviel % davon verbringen wir mit Innovation?
(Peter Rossbach)
Guter Überblick über das Tooling, das Docker heute bereitstellt.
(Christian Binder)
Als wir Git entdeckten, hätten wir nicht erwartet, dass ein paar Jahre später Konferenzvorträge von Microsoft gehalten werden, in denen Git ungefähr ein dutzend Mal auf den Slides auftaucht. Das war heute so :-)
Microsofts Entwicklung entstammt dem klassischen Software-Enginnering, das für seltene Releases optimiert ist (DVD’s brennen). Inspirationsquelle für neue Wege war das Google Engineering System. Heute entwickeln 35-Feature-Teams Visual-Studio in einem viel agileren Prozess.
Die Teams arbeiten in hoher Autonomie. Einige Dinge werden aber als Randbedingungen fest vorgegeben (Alignment), z. B.
Ein hoher Qualitätslevel ist wichtig. Active Defects werden kontinuierlich und je Team kontrolliert. Trotz Autonomie der Teams führt daran kein Weg vorbei.
3-Wöchige Sprints. Teams dürfen feingranularer arbeiten. Aber die Integrationspunkte sind für alle gleich.
Die Trennung zwischen QA and Dev wurde aufgehoben. Testen ist in der Verantwortung der Teams. Es keine dedizierten Testing Engineers mehr sondern nur noch die Rolle Software Engineer.
Nicht bewährt hat sich das Konzept von regelmäßigen Stabilisierungssprints. Der Speaker sprach sogar von einem “Epic Fail”. Es lädt ein, Defekte bis zum Stabilisierungssprint zu parken.
Ein anderes Anti-Pattern ist es Burndown-Charts durch Manager überwachen zu lassen. Einziges Ergebnis: Geschönte Burndowns.
Teams sind grundsätzlich Cross Discipline und werden lange intakt gehalten. Es gibt geschlossene Team-Rooms mit Rückzugsräumen um die Team-Rooms herum.
Planning in erfolgt 3 Zeithorizonten (Sprint 3-Week, Season 5 Monate, Vision 18 Monate). Das Season-Planning rolliert und wird alle 6 Monate aktualisiert.
Das Deployment erfolgt nach dem Sprint, parallel zum Beginn des nächsten Sprints.
Viele Teams nutzen Kanban-Boards.
Es wird mit Git versioniert. Es gibt viel Traffic auf dem Repo. Pull-Requests sind mit einem Quality Gate verbunden. Code-Review sind obligatorisch für alle.
Feature-Toggles werden großflächig eingesetzt.
Überall aufgehängte Monitore zeigen den Status der Pipeline sichtbar.
Dein Code wird nach 3 Wochen von Hunderttausenden von Nutzern verwendet.
(Alexander Schwartz, @ahus1)
Arbeiten ohne Wartungsfenster.
(Dirk Ehms @d_ehms)
Ziel war eine große Migration ohne Downtimes, zu einer neuen Version des Application Servers Glassfish. Wichtig dabei: Kontinuierlich die Abwärtskompatipibilität der Codeänderungen überprüfen. Es werden dazu Maven-Profile genutzt, um unterschiedliche Builds zu ermöglichen. Schön dargestellt: Blue/Green-Rollouts.
(Christian Deger @cdeger, Wolf Schlegel @wolfwolf)
Wirklich große Miration von Monolith zu Microservices, von .net/Window zu JVM/Linux , und von Devs und ps zu DevOps.
Scala ist die Sprache der Wahl.
Vorgehen in Scheiben (vertikale Schnitte inkl. UI).
Services und Teams sind um Business-Capabilities herum organisiert. Nicht nach Layers.
You invent it. You build it. You run it.
T-Shaped Skill für Entwickler ist gefordert. Ein Team muss alle Rollen abdecken.
Mantra: Shared Nothing. Teams haben hohe Eigenständigkeit. Sharing schafft Abhängigkeiten. Achtung: Bevor man Sharing in Betracht zieht, versucht man erstmal Copy&Paste. Weil Microservices klein sind, ist das nicht so schlimm. Erst wenn etwas wirklich dafür reif ist, wird es als “internal Open-Source” geteilt.
Wir entscheiden schnell und lokal. Wir haben kein Kommittee mehr, das lange nachdenkt.
Hilfreich: Shadow-Traffic und Feature-Toggles.
Nicht DevOps: Wenn Infrastruktur-Anforderungen doch immer wieder von denselben Leuten im Team erledigt werden und liegen bleiben, wenn diese im Urlaub sind. Abhilfe: Aufgaben bewußt rollierend vergeben.
Kein Infrastruktur-Team. Übergreifende Themen werden durch Gilden abgebildet mit. Diese erledigen die Aufgaben aber nicht selbst, sondern erstellen Tasks für die Teams. Die Teams dürfen 20% ihrer Zeit für solche Tasks nutzen.
(Dr. Jeremias Rössler @roesslerj)
Abgrenzung Feature vs. Bug ist gar nicht immer so klar, wie es auf den ersten Blick scheint.
Wenn man keine Spezifikation hat, gibt es keine Fehler, nur Überraschungen.
Beim Sourcecode macht man Reviews auf Diffs, also auf jene Zeilen, die sich ändern. Warum nicht auch für User-Interfaces?
Konzept Behavioral Diff: Verhalten bei einem Testlauf protokollieren und dann mit den Ergebnissen für die neue Version vergleichen. Danach bestätigt man, dass die Änderungen so gewollt sind (oder eben nicht). Wichtig dabei natürlich: Die Läufe müssen deterministisch sein.
Ein interessantes Konzept. Persönlich glaube ich aber, dass das nur dann funktioniert, wenn die Diffs so dargestellt werden, dass sie schnell beurteilt werden können. Das ist, gerade für User-Interfaces, keine leichte Aufgabe.
Im zweiten Teil beschäftigt sich der Vortrag mit randomisierten Tests (Monkey Tests). Problem: Um in endlicher Zeit zu guten Ergebnissen zu kommen braucht es “intelligentere” Affen, die nicht völlig willürlich klicken. Grundidee: Ein manuell aufgezeichneter Test wird zufällig variiert (Genetischer Algorithmus, der z. B. auf Branch-Coverage optimiert). Auf diese Weise bekommt man aus wenigen manuell erstellen Läufen eine breite Abdeckung.
Im dritten Teil werden die Konzepte kombiniert, so dass man Änderungen im Verhalten auf eine breiten Menge von Tests beobachten kann. Klingt für mich spannend, ich bin aber nicht sicher, ob man mit der entstehenden Menge an Output in der Praxis wirklich gut umgehen kann.
(Dr. Thomas Schank @DrTom21, Max Albrecht @EINS78)
Es geht um das Problem mit zu viele False Negatives. Das sind fehlgeschlagene Tests, die nur auf ein Problem in der Testumgebung zurückzuführen sind, und keine Code-Korrektur erfordern.
Bei Integrationstest gibt es, leider, eine gewisse Wahrscheinlichkeit, dass Tests willkürlich scheitern. Die Wahrscheinlichkeit des Scheiterns der Suite steigt exponentiell mit der Anzahl von Tests. Was hilft: Gezieltes wiederholen gescheiterter Tests, um zu prüfen ob der Fehler reproduziert werden kann.
Klassische CI-Systeme (z. B. Jenkins) können das nicht gut, weil sie zu wenig wissen, über das was sie testen.
Krass: Die beiden haben eine eingenes CI entwickelt, um besser mit den Tests umgehen zu können. (Cider-CI).
The Source is the Truth.
Konfiguration im Sourcecode als YAML-File.
Tree-id als fingerprint des Sourcecodes. Ermöglich Reproduzierbarkeit und ist Basis für Bisection.
Scripts mit Dependencies statt Jobs mit Before- und After-Hooks. Dependenies werden im Web-UI auch grafisch dargestellt.
Fazit: Komplexe Integrationstests sind wegen der False-Negatives immer schwierig. Mit gezielter Wiederholung kann man das in den Griff kriegen. Beeindruckend, was die Beiden in wenigen Monaten neben der eigentlich Projektarbeit auf die Beine gestellt haben.
(Dave Farley @davefarley77)
Acceptance Test is kind of an automated version of the definition of done.
Jede Anforderungen aus der Definition of Done soll durch einen Akzeptanztest abgedeckt werden.
Die Akzeptanztests gehören den Entwicklern.
Language of the Domain. Nicht jeder muss einen Test programmieren können, aber Fachexperten sollten sie lesen können.
Es ist nicht effizient, die Umgebung für jeden Test einzeln aufzusetzen und zu starten. Wir wollen viele, sogar sehr viele, Akzeptanztests laufen lassen. Das System muss so sein, dass die Anwendung eimal aufgesetzt wird und dann viele Tests dort parallel ausführen kann.
Wichtig ist dazu die Isolation der Tests. Wie findet man die richtigen Grenzen und das passende Gleichgewicht zwischen Integration und Entkopplung für die Tests?
Ansatz: Funktionale Isolation.
Auf jeden Fall vermeiden: Abhängigkeiten zwischen Tests. Jeder Test muss einzeln laufen können.
Nützlich zur Isolation:
Alias your Testing Entities
Jeder Lauf erzeugt seine eigenen Entities, die nicht von anderen Tests oder anderen Läufen desselben Tests genutzt werden, z. B. “Buch-testxyz-1234” für Test “xyz” im Lauf “1234”.
Ebenfalls hilfreich zur Isolation: Test Doubles. Das sind Fake-Services, die unsere Tests mit passenden Eingangsdaten versorgen. (Ähnlich Mocks in Unit Tests).
Domain Specific Language zur Beschreibung von Tests sind sehr empfehlenswert, um Tests als Mittel der Kommunikation nutzten zu können.
Für viele Systeme ist es wichtig, das zeitliche Verhalten kontrollieren zu können. Eine Time-Travel-Funktion in der Test-DSL ist dann notwendig. Stichwort: Clock as a Services.
Oft ist eine Sonderbehandlung für destruktive Tests erforderlich. Andere Tests erforden sehr spezielle Umgebungen. Hierzu nutzt man deklaratives Tagging der Tests.
Production-like Test Environments: Auch hier gilt es wieder ein Gleichgewicht zu finden zwischen produktionsnaher Umgebung, einfachem Setup und schnellen Tests.
Keine Produktionsdaten für Akzeptanztests. Zu schwerfällig.
Sehr schöne Zussamenfassung von Do’s und Dont’s für Tests.
(Michael Jerger)
Thema: Viele CM-Tools versuchen deklarativ zu sein. Keines kommt aber ohne programmatische Möglichkeiten aus. Vielleicht sollte man das Problem direkt programmatisch angehen. Mit Pallet und Clojure kann man das.
DevOps kommt niemals ohne Programmierung aus.
(Dirk Lehmann @doergn)
Tägliche Softwareauslieferungen bei https://twogo.com
Der klassische Prozess mit Q-Gates und 229 zu erfüllenden Produktstandards passt nicht mehr so richtig gut zur Cloud-Strategie.
Alliierte und Freunde im Konzern sind wichtig, um die notwendigen Veränderungen herbeizuführen.
Ich kenne die Regeln. Ich werde sie nicht brechen. Ich werde sie aber biegen. Manchmal bis es knackt.
Berichten in Deltas macht die Bürokratie handhabbarer.
Vertrauen vs. Kontrolle: Große Unternehmen haben oft viel Vertrauen durch Kontrolle ersetzt. Das schränkt die Beweglichkeit ein.
Welches Interesse hätten wir (das Produktteam), dem Produkt zu schaden?
Inzwischen arbeiten bei SAP viele Projekte im DevOps-Modus.