Question 1

什麼是 dbt 中的 medallion 架構？

Accepted Answer

medallion 架構將模型組織成層：staging（原始資料清理）、intermediate（商業邏輯）和 marts（最終分析表格）。這種分離確保乾淨的資料在您的管線中一致地流動。

Question 2

我應該何時使用增量 materialization？

Accepted Answer

對於超過 100 萬列的表格或當來源資料持續增長時，使用增量模型。增量模型只處理新的或變更的記錄，顯著減少運算時間和成本。

Question 3

我應該為我的模型新增哪些測試？

Accepted Answer

在所有主鍵上新增 not_null 和 unique 測試，在外鍵上新增 relationship 測試，在必要欄位上新增 not_null，在狀態或類型欄位上新增 accepted_values。使用 dbt_utils.expression_is_true 進行自訂驗證。

Question 4

如何在 delete+insert 和 merge 增量策略之間選擇？

Accepted Answer

對於大多數倉儲，預設使用 delete+insert。當您需要使用延遲到達的資料更新現有記錄時使用 merge。對於 BigQuery 或類似平台的分區基礎工作流，使用 insert_overwrite。

Question 5

ephemeral 模型的目的是什麼？

Accepted Answer

Ephemeral 模型是不會 materialize 為表格的中間 CTEs。將它們用於總是會被其他模型參考的可重複使用邏輯，減少倉儲中的表格數量。

Question 6

如何有效地為我的 dbt 專案建立文件？

Accepted Answer

在 YAML 檔案中為每個模型和欄位新增說明。使用 description 欄位解釋商業邏輯、資料來源和預期值。產生 dbt docs 並為您的團隊提供瀏覽服務。

dbt-transformation-patterns

測試它