Danylo Mikula de la Medidata Solutions a condus trecerea de la procesele manuale la fluxurile de lucru declarative – reducând timpul de aprovizionare a clusterelor cu 97%
Pentru multe echipe de inginerie din întreprinderi, Kubernetes a trecut de mult de etapa inovației și s-a stabilit în categoria infrastructurii critice de zi cu zi. Totuși, menținerea eficientă a acestei infrastructuri – în special pe mai multe clustere și medii – rămâne o provocare care încetinește livrarea funcționalităților și crește riscul operațional.

La Medidata Solutions, un furnizor de top de soluții SaaS și analiză de date care sprijină cercetarea clinică, această provocare a fost deosebit de acută. Gestionarea infrastructurii hibride în medii on-premises și cloud – incluzând aproximativ o duzină de clustere Kubernetes și mii de mașini virtuale – aprovizionarea unui cluster pregătit pentru producție era un proces îndelungat care putea dura săptămâni de efort coordonat, implicând configurare manuală dispersată pe mai multe echipe. Actualizările aplicațiilor de infrastructură erau adesea amânate deoarece istoricul configurațiilor nu era centralizat, creând întârzieri și, uneori, breșe de securitate.
Lucrurile s-au schimbat când Danylo Mikula, un arhitect DevOps & Infrastructură cu peste un deceniu de experiență în industriile reglementate, s-a alăturat echipei de inginerie a platformei la sfârșitul anului 2023 și a început să transforme modul în care era gestionată infrastructura. Mandatul, așa cum îl descrie Danylo, era înșelător de simplu.
"Scopul nu era să introducem unelte noi în numele modernizării. Era să facem infrastructura existentă mai ușor de operat, întreținut și scalat – fără a crește personalul sau complexitatea."
– Danylo Mikula, arhitect DevOps & Infrastructură, Medidata Solutions
De la pașii manuali la fluxurile de lucru declarative
Esența transformării s-a centrat pe consolidarea proceselor fragmentate într-un model bazat pe GitOps. În loc ca inginerii să aplice configurații manual la fiecare cluster, implementările s-au mutat în depozite cu control de versiuni, Argo CD gestionând sincronizarea.
Blocajele pe care le-a întâlnit existau în fiecare etapă. Rețeaua de containere necesita coordonare între echipele de inginerie a platformei și rețelele, cu configurarea dispersată pe stațiile de lucru ale inginerilor individuali. Aplicațiile de infrastructură erau implementate manual, cu fișierele de valori rezidente pe mașinile locale. Gestionarea secretelor urma abordări manuale tradiționale, iar procesele de implementare evoluaseră organic în timp fără coordonare centralizată. Prin consolidarea fiecărei faze în diagrame Helm cu control de versiuni și suprascrieri specifice mediului, Danylo a redus timpul per etapă de la zile la minute.
Arhitectura construită de Danylo a urmat o filozofie „definește o dată, implementează peste tot". Un depozit central conținea definiții de servicii partajate care generau automat implementări specifice clusterului, în timp ce fiecare mediu păstra doar suprascrierile sale unice. „În loc să copiem fișiere de configurare pe o duzină de clustere," explică Danylo, „am creat un sistem în care adăugarea unui nou serviciu însemna scrierea unei singure definiții și lăsarea automatizării să gestioneze restul." Această abordare a acoperit zeci de componente de infrastructură – de la depozite de date și sisteme de mesagerie până la instrumente de securitate și monitorizare – reducând dramatic riscul de derivă a configurației.
Distribuția secretelor a urmat același principiu: în loc de injectare manuală per cluster, integrarea Vault prin Vault Secrets Operator a automatizat sincronizarea, asigurând că modificările circulau printr-un proces controlat cu trasee de audit adecvate.
Rezultatul a fost o schimbare fundamentală în modul de gestionare a infrastructurii. Timpul de aprovizionare a scăzut la aproximativ 30 de minute – o îmbunătățire a eficienței de 97,6%. Actualizările au devenit consistente și repetabile, iar integrarea noilor ingineri a necesitat mai puține cunoștințe tribale.
"Am avut mai multe echipe care contribuiau la aceleași medii, iar consistența a fost întotdeauna o preocupare. Munca ne-a ajutat să trecem la un proces previzibil cu o sursă comună de adevăr. Îmbunătățirile nu au fost doar tehnice – au facilitat colaborarea."
– Monik Gandhi, director, inginerie Cloud
Factorul uman în schimbarea tehnică
Colegii subliniază că succesul schimbării nu a fost pur tehnic. GitOps nu era familiar tuturor la început, iar o parte din efort a implicat făcând abordarea comprehensibilă și utilizabilă pentru inginerii care petrecuseră ani în fluxuri de lucru imperative.
"Arhitectura era puternică, dar ceea ce s-a remarcat a fost modul în care a fost facilitată adoptarea. A lua timp pentru a ghida inginerii prin model a însemnat că oricine din echipă putea acum să implementeze sau să modifice infrastructura fără a avea nevoie de ani de context acumulat. Oamenii au înțeles nu doar „cum", ci și „de ce"."
– Labhesh Potdar, manager, inginerie Cloud
Ca rezultat, actualizările infrastructurii – tratate anterior ca fiind riscante – au devenit de rutină. Echipele au câștigat încredere în executarea actualizărilor programate deoarece istoricul implementărilor era vizibil și reproductibil.
Securitatea ca efect secundar
Îmbunătățirile de securitate au fost la fel de semnificative. Anterior, menținerea programelor consistente de patch-uri era provocatoare deoarece configurațiile de implementare erau distribuite în întreaga organizație în loc să fie centralizate. Tranzițiile echipelor au făcut natural continuitatea configurației mai dificilă.
Cu toate configurațiile acum cu control de versiuni, echipa putea în sfârșit să mențină programe consistente de actualizare și să urmărească exact ce rula unde. Integrarea cu HashiCorp Vault a asigurat că secretele erau gestionate consistent în întreaga infrastructură cu rotație adecvată și controale de acces – esențială pentru o companie SaaS din domeniul sănătății care operează în medii reglementate.
Lecții cheie pentru liderii din inginerie
Modelele tehnice utilizate în transformare nu sunt noi în sine – Helm, Argo CD și Vault sunt instrumente bine cunoscute. Conform lui Danylo, impactul a provenit din modul în care au fost structurate și introduse: incremental, cu atenție la experiența dezvoltatorului și obiceiurile organizaționale.
Pentru alți lideri din inginerie care iau în considerare o schimbare similară, Danylo evidențiază trei lecții:
Începeți cu designul depozitului. Structura folderelor și convențiile de denumire influențează mentenabilitatea pe termen lung. A obține acest lucru corect devreme economisește refactorizare semnificativă mai târziu.
Automatizați doar ceea ce echipele pot înțelege și suporta. Adoptarea contează mai mult decât sofisticarea. Un sistem mai simplu pe care inginerii îl folosesc efectiv este mai valoros decât unul elegant pe care îl evită.
Lăsați spațiu pentru tranziție gradată. Mutarea totului deodată este rareori sustenabilă. Adoptarea incrementală permite echipelor să construiască încredere și să identifice problemele înainte ca acestea să se agraveze.
Privind înainte
Munca a poziționat echipa platformei Medidata să scaleze infrastructura fără creșteri proporționale ale efortului manual. Pe măsură ce numărul de clustere și aplicații crește, modelul declarativ devine mai valoros – nu doar pentru viteză, ci și pentru auditabilitate, integrare și consistență pe termen lung.
Focusul acum, spune Danylo, este pe extinderea aceleiași abordări declarative la observabilitate – construind SLI-uri măsurabile și alertare automatizată care fac fiabilitatea o practică obiectivă mai degrabă decât o chestiune de intuiție.
"GitOps nu a rezolvat fiecare problemă – dar a făcut părțile de rutină ale infrastructurii mai puțin fragile și mai previzibile. În organizațiile mari de inginerie, doar asta poate debloca eficiență semnificativă."
– Danylo Mikula
Danylo Mikula este arhitect DevOps & Infrastructură la Medidata Solutions cu peste zece ani de experiență în furnizarea de soluții de inginerie cloud și platforme în industriile reglementate. Munca sa se concentrează pe traducerea principiilor DevOps în practici de fiabilitate măsurabile și repetabile, punând accent pe fluxuri de lucru declarative, infrastructură ca cod și guvernanță bazată pe observabilitate. A contribuit cu cercetări privind modelele de adoptare GitOps la conferințe științifice internaționale. Mai multe despre proiectele și munca sa tehnică pot fi găsite pe site-ul său personal, prezentând experiența sa practică și abordarea dezvoltării produselor.



