Question 1

Comment tester mes DAG avant de les déployer en production ?

Accepted Answer

Utiliser la classe DagBag pour charger et valider les DAG dans les tests unitaires. Tester les fonctions de tâches individuelles séparément avec pytest. Exécuter les DAG dans une instance Airflow locale avec catchup=False pour vérifier le flux d'exécution.

Question 2

Quelle est la différence entre les opérateurs et les capteurs ?

Accepted Answer

Les opérateurs effectuent des actions comme exécuter du code Python ou des requêtes. Les capteurs sont des opérateurs spéciaux qui attendent des conditions externes comme la disponibilité de fichiers, des réponses d'API ou l'achèvement d'autres DAG avant de continuer.

Question 3

Comment passer des données entre les tâches dans Airflow ?

Accepted Answer

Utiliser XCom pour les petites données en retournant des valeurs depuis les fonctions de tâches. L'API TaskFlow gère XCom automatiquement. Pour les données volumineuses, stocker dans un stockage externe comme S3 et passer des références entre les tâches.

Question 4

Pourquoi mes tâches ne se retentent-elles pas en cas d'échec ?

Accepted Answer

S'assurer que retries et retry_delay sont définis dans default_args ou les définitions de tâches individuelles. Vérifier que la tâche n'échoue pas pendant la phase de planification. Vérifier retry_exponential_backoff pour des augmentations progressives de délai.

Question 5

Comment gérer les dépendances de DAG vers d'autres DAG ?

Accepted Answer

Utiliser ExternalTaskSensor pour attendre que des tâches spécifiques dans des DAG en amont se terminent. Configurer execution_date_fn pour faire correspondre les dates d'exécution correctes entre les DAG dépendants.

Question 6

Quelle règle de déclenchement dois-je utiliser pour les tâches de nettoyage ?

Accepted Answer

Utiliser TriggerRule.ALL_DONE pour le nettoyage qui doit s'exécuter quel que soit le succès ou l'échec en amont. Utiliser TriggerRule.ALL_SUCCESS pour les tâches qui ne doivent s'exécuter que si toutes les tâches en amont ont réussi.

airflow-dag-patterns

Tester

Audit de sécurité

Score de qualité

Ce que vous pouvez construire

Équipes Data Engineering construisant des pipelines ETL

Équipes Analytics orchestrant la génération de rapports

Ingénieurs ML entraînant des modèles selon un calendrier

Essayez ces prompts

Bonnes pratiques

Éviter

Foire aux questions

Détails du développeur