Question 1

Wie teste ich meine DAGs vor der Bereitstellung in der Produktion?

Accepted Answer

Verwenden Sie die DagBag-Klasse, um DAGs in Unit-Tests zu laden und zu validieren. Testen Sie einzelne Task-Funktionen separat mit pytest. Führen Sie DAGs in einer lokalen Airflow-Instanz mit catchup=False aus, um den Ausführungsfluss zu verifizieren.

Question 2

Was ist der Unterschied zwischen Operatoren und Sensoren?

Accepted Answer

Operatoren führen Aktionen aus, wie das Ausführen von Python-Code oder das Ausführen von Abfragen. Sensoren sind spezielle Operatoren, die auf externe Bedingungen wie Dateiverfügbarkeit, API-Antworten oder andere DAG-Abschlüsse warten, bevor sie fortfahren.

Question 3

Wie übergebe ich Daten zwischen Tasks in Airflow?

Accepted Answer

Verwenden Sie XCom für kleine Daten, indem Sie Werte aus Task-Funktionen zurückgeben. Die TaskFlow API behandelt XCom automatisch. Für große Daten speichern Sie in externem Speicher wie S3 und übergeben Referenzen zwischen Tasks.

Question 4

Warum werden meine Tasks bei Fehlern nicht wiederholt?

Accepted Answer

Stellen Sie sicher, dass retries und retry_delay in default_args oder einzelnen Task-Definitionen gesetzt sind. Überprüfen Sie, dass der Task nicht während der Planungsphase fehlschlägt. Verifizieren Sie retry_exponential_backoff für progressive Verzögerungserhöhungen.

Question 5

Wie handhabe ich DAG-Abhängigkeiten von anderen DAGs?

Accepted Answer

Verwenden Sie ExternalTaskSensor, um auf spezifische Tasks in vorgelagerten DAGs zu warten. Konfigurieren Sie execution_date_fn, um die korrekten Ausführungsdaten zwischen abhängigen DAGs abzugleichen.

Question 6

Welche Trigger-Regel sollte ich für Bereinigungs-Tasks verwenden?

Accepted Answer

Verwenden Sie TriggerRule.ALL_DONE für Bereinigung, die unabhängig vom Erfolg oder Fehler upstream ausgeführt werden muss. Verwenden Sie TriggerRule.ALL_SUCCESS für Tasks, die nur ausgeführt werden sollen, wenn alle upstream-Tasks erfolgreich waren.

airflow-dag-patterns

Teste es

Sicherheitsaudit

Qualitätsbewertung

Was du bauen kannst

Data-Engineering-Teams, die ETL-Pipelines erstellen

Analytics-Teams, die Berichtserstellung orchestrieren

ML-Ingenieure, die Modelle planmäßig trainieren

Probiere diese Prompts

Bewährte Verfahren

Vermeiden

Häufig gestellte Fragen

Entwicklerdetails