生物學研究會產生複雜的資料集,這些資料難以追蹤、查詢和重現。LaminDB 提供了一個統一的框架來管理生物學資料,具有自動譜系追蹤、基於本體論的註釋,以及與工作流程管理器的無縫整合。
下載技能 ZIP
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
開啟並開始使用
測試它
正在使用「lamindb」。 How do I track my notebook analysis with LaminDB?
預期結果:
- 在筆記本開頭使用 ln.track() 開始譜系擷取
- 正常匯入資料並執行分析
- 完成時呼叫 ln.finish() 來結束追蹤
- 使用 artifact.view_lineage() 查看譜系以了解資料血統
正在使用「lamindb」。 Can you help me validate my experimental metadata?
預期結果:
- 定義具有必要欄位和資料類型的綱要
- 使用您的綱要建立 DataFrameCurator 或 AnnDataCurator
- 使用 curator.validate() 檢查資料完整性
- 使用 .cat.standardize() 修正拼寫錯誤並對應同義詞
正在使用「lamindb」。 How do I connect LaminDB to my cloud storage?
預期結果:
- 安裝擴充套件:pip install 'lamindb[aws]' 或 'lamindb[gcp]'
- 設定儲存空間:lamin init --storage s3://your-bucket
- 透過環境變數或設定檔設定憑證
- LaminDB 自動處理快取和同步
安全審計
安全This is a pure documentation skill containing only markdown files with code examples for LaminDB biological data management. All 607 static findings are false positives. The analyzer incorrectly flagged markdown code formatting (backticks, code blocks), documentation about cloud storage configuration (AWS, GCP credentials), and library usage patterns (ln.Artifact) as security issues. No executable code, scripts, credential harvesting, or malicious patterns exist.
風險因素
⚙️ 外部命令 (3)
📁 檔案系統存取 (2)
🌐 網路存取 (2)
品質評分
你能建構什麼
註釋 scRNA-seq 資料
使用 Cell Ontology 的受控詞彙來驗證和標準化細胞類型註釋
建立資料湖倉
跨多個生物學資料集建立統一查詢介面,並具有自動版本控制
追蹤模型譜系
將訓練資料成品連結到 MLflow 或 W&B 實驗,以實現完整可重現性
試試這些提示
幫助我設定本地 LaminDB。我想要安裝它、進行身份驗證,並初始化一個本地實例來管理我的單細胞資料集。
我有帶有細胞類型標籤的 scRNA-seq 資料。展示如何使用 Bionty 透過 Cell Ontology 驗證和標準化這些標籤。
我使用 Nextflow 流程來進行 bulk RNA-seq 分析。展示如何整合 LaminDB 來追蹤哪個程式碼產生了哪些輸出檔案。
我有數百個按實驗和批次組織的 Parquet 檔案。展示如何查詢專案 X 中所有組織=PBMC 且條件=treated 的成品,而不需要載入所有檔案。
最佳實務
- 每個分析筆記本都以 ln.track() 開始並以 ln.finish() 結束,以實現自動譜系擷取
- 及早定義綱要並驗證資料,以在進行廣泛分析之前發現問題
- 使用階層式成品金鑰如 'project/experiment/batch/file.h5ad' 來組織
避免
- 為修改的版本建立新的成品金鑰,而非使用內建版本控制
- 未先篩選就載入大型資料集 - 先查詢中繼資料以減少 I/O
- 跳過本體論標準化,導致類似術語的查詢不一致