技能 lamindb

🧬

lamindb

Name: lamindb
Author: K-Dense-AI

安全 ⚙️ 外部命令📁 檔案系統存取🌐 網路存取🔑 環境變數

使用 LaminDB 管理生物學資料

也可從以下取得: davila7

生物學研究會產生複雜的資料集，這些資料難以追蹤、查詢和重現。LaminDB 提供了一個統一的框架來管理生物學資料，具有自動譜系追蹤、基於本體論的註釋，以及與工作流程管理器的無縫整合。

支援: Claude Codex Code(CC)

📊 71 充足

下載技能 ZIP

在 Claude 中上傳

前往設定 → 功能 → 技能 → 上傳技能

開啟並開始使用

測試它

正在使用「lamindb」。 How do I track my notebook analysis with LaminDB?

預期結果:

在筆記本開頭使用 ln.track() 開始譜系擷取
正常匯入資料並執行分析
完成時呼叫 ln.finish() 來結束追蹤
使用 artifact.view_lineage() 查看譜系以了解資料血統

正在使用「lamindb」。 Can you help me validate my experimental metadata?

預期結果:

定義具有必要欄位和資料類型的綱要
使用您的綱要建立 DataFrameCurator 或 AnnDataCurator
使用 curator.validate() 檢查資料完整性
使用 .cat.standardize() 修正拼寫錯誤並對應同義詞

正在使用「lamindb」。 How do I connect LaminDB to my cloud storage?

預期結果:

安裝擴充套件：pip install 'lamindb[aws]' 或 'lamindb[gcp]'
設定儲存空間：lamin init --storage s3://your-bucket
透過環境變數或設定檔設定憑證
LaminDB 自動處理快取和同步

安全審計

安全

v4 • 1/17/2026

This is a pure documentation skill containing only markdown files with code examples for LaminDB biological data management. All 607 static findings are false positives. The analyzer incorrectly flagged markdown code formatting (backticks, code blocks), documentation about cloud storage configuration (AWS, GCP credentials), and library usage patterns (ln.Artifact) as security issues. No executable code, scripts, credential harvesting, or malicious patterns exist.

已掃描檔案

6,559

分析行數

發現項

審計總數

風險因素

⚙️ 外部命令 (3)

references/annotation-validation.md:21-32 SKILL.md:49-61 references/setup-deployment.md:9-21

📁 檔案系統存取 (2)

references/core-concepts.md:12-24 SKILL.md:195-226

🌐 網路存取 (2)

references/integrations.md:46-72 SKILL.md:383-387

🔑 環境變數 (2)

references/integrations.md:49-50 references/setup-deployment.md:205-206

審計者: claude 查看審計歷史 →

品質評分

架構

100

可維護性

內容

社群

100

安全

規範符合性

你能建構什麼

註釋 scRNA-seq 資料

使用 Cell Ontology 的受控詞彙來驗證和標準化細胞類型註釋

建立資料湖倉

跨多個生物學資料集建立統一查詢介面，並具有自動版本控制

追蹤模型譜系

將訓練資料成品連結到 MLflow 或 W&B 實驗，以實現完整可重現性

試試這些提示

開始使用

幫助我設定本地 LaminDB。我想要安裝它、進行身份驗證，並初始化一個本地實例來管理我的單細胞資料集。

註釋資料

我有帶有細胞類型標籤的 scRNA-seq 資料。展示如何使用 Bionty 透過 Cell Ontology 驗證和標準化這些標籤。

追蹤譜系

我使用 Nextflow 流程來進行 bulk RNA-seq 分析。展示如何整合 LaminDB 來追蹤哪個程式碼產生了哪些輸出檔案。

查詢資料

我有數百個按實驗和批次組織的 Parquet 檔案。展示如何查詢專案 X 中所有組織=PBMC 且條件=treated 的成品，而不需要載入所有檔案。

最佳實務

每個分析筆記本都以 ln.track() 開始並以 ln.finish() 結束，以實現自動譜系擷取
及早定義綱要並驗證資料，以在進行廣泛分析之前發現問題
使用階層式成品金鑰如 'project/experiment/batch/file.h5ad' 來組織

避免

為修改的版本建立新的成品金鑰，而非使用內建版本控制
未先篩選就載入大型資料集 - 先查詢中繼資料以減少 I/O
跳過本體論標準化，導致類似術語的查詢不一致

常見問題

LaminDB 支援哪些資料格式？

LaminDB 支援 DataFrame（Parquet、CSV）、AnnData（單細胞）、MuData（多模態）、SpatialData 和 TileDB-SOMA 陣列。

我需要伺服器才能使用 LaminDB 嗎？

不需要。LaminDB 可在本地使用 SQLite 進行開發。擴展到雲端儲存並搭配 PostgreSQL 供生產團隊使用。

LaminDB 如何與 Nextflow 整合？

在程序腳本中使用 ln.track() 來記錄輸入和輸出。LaminDB 自動為每個步驟擷取溯源資訊。

有哪些生物學本體論可用？

基因（Ensembl）、蛋白質（UniProt）、細胞類型（CL）、組織（Uberon）、疾病（Mondo）、表型（HPO）和途徑（GO）。

我可以在沒有網際網路的情況下使用 LaminDB 嗎？

本地操作可以。初始本體論下載和雲端儲存存取需要網際網路。快取本體論到本地以供離線使用。

LaminDB 與資料庫有何不同？

LaminDB 結合了資料庫功能（查詢、篩選）與版本化檔案儲存，以及專為科學資料工作流程設計的譜系追蹤。

開發者詳情

作者

K-Dense-AI

授權

Apache-2.0 license

儲存庫

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/lamindb

引用

main

檔案結構

📁 references/

📄 annotation-validation.md

📄 core-concepts.md

📄 data-management.md

📄 integrations.md

📄 ontologies.md

📄 setup-deployment.md

📄 evaluation_output.json

📄 SKILL.md