Cloudythings Blog

Field notes on resilient, modern platform engineering.

We write about SRE practice, Kubernetes operations, GitOps pipelines, microVM innovation, and the tooling that keeps platforms reliable. Every article is penned by hands-on engineers across our collective.

March 05, 2024 at 09:37 AM EST 12 min read

FinOps-Driven SLOs: Balancing Reliability and Cloud Spend

How to align SLO targets with cloud economics using cost telemetry, Kubernetes right-sizing, and value-stream dashboards.

SLOsFinOpsKubernetesObservability

February 06, 2024 at 09:29 AM EST 12 min read

Idempotent Migration Trains for Platform Modernization

A battle-tested pattern for orchestrating multi-month platform migrations with GitOps, idempotent runbooks, and progressive guardrails.

Platform EngineeringIdempotencyMigrationGitOps

May 30, 2023 at 09:53 AM EST 11 min read

Compliant Data Strategies for Ephemeral Environments

Techniques for keeping ephemeral environments production-realistic without violating GDPR, HIPAA, or financial regulations.

Ephemeral EnvironmentsData PrivacyComplianceDevOps

May 02, 2023 at 10:07 AM EST 12 min read

Observability-Driven GitOps Supply Chains

Combining Argo CD, Keptn, and evidence-driven observability to turn supply-chain checks into fast, reliable deploy gates.

GitOpsSupply Chain SecurityObservabilityCI/CD

April 04, 2023 at 09:34 AM EST 12 min read

eBPF Superpowers for SRE Operability

Using eBPF to level up incident response, capacity planning, and zero-trust enforcement across Kubernetes and Linux fleets.

eBPFSREObservabilitySecurity

March 07, 2023 at 09:49 AM EST 12 min read

Distroless Machine Learning Pipelines Without the Headaches

Applying distroless principles, attestation, and reproducibility to ML model serving and training so security and data science stop fighting.

DistrolessMachine LearningSupply Chain SecurityKubernetes

February 07, 2023 at 10:21 AM EST 11 min read

Building Platform Environment Catalogs that Developers Actually Use

Marrying Backstage, GitOps, and policy-as-code to give teams self-service environments without sacrificing control.

Platform EngineeringGitOpsBackstageEphemeral Environments

January 10, 2023 at 09:37 AM EST 12 min read

Adaptive Alerting for Hybrid SRE Teams

Blending SLO burn rates, anomaly detection, and human factors so globally distributed SRE teams get paged for the right reasons.

SREAlertingSLOsObservability

August 23, 2022 at 09:23 AM EST 11 min read

Signing More Than Containers: Sigstore for IaC, Pipelines, and Policies

Extend Sigstore beyond container images to secure Terraform plans, Kubernetes manifests, and pipeline automations without burning out developers.

SigstoreSupply Chain SecurityInfrastructure as CodeCI/CD

July 26, 2022 at 09:41 AM EST 10 min read

Observability Scorecards that Actually Change Behavior

Designing scorecards that blend SLOs, on-call health, and platform fundamentals so teams invest in what reliability truly needs.

ObservabilitySRESLOsPlatform Engineering