技能 gtars
🧬

gtars

安全 ⚙️ 外部命令📁 檔案系統存取

分析基因組區間和覆蓋軌跡

也可從以下取得: davila7

處理和分析基因組區間數據以進行生物資訊學研究。Gtars 提供高效能工具,用於重疊檢測、覆蓋分析和基因組序列的機器學習標記化。

支援: Claude Codex Code(CC)
📊 71 充足
1

下載技能 ZIP

2

在 Claude 中上傳

前往 設定 → 功能 → 技能 → 上傳技能

3

開啟並開始使用

測試它

正在使用「gtars」。 查找我的 ChIP-seq 峰與基因啟動子的重疊

預期結果:

  • 重疊的峰:找到 1,234 個區域
  • 峰分佈:45% 在啟動子區域,30% 在增強子,25% 在基因間區
  • 結果已保存到 peaks_in_promoters.bed

正在使用「gtars」。 從 ATAC-seq 數據生成覆蓋軌跡

預期結果:

  • 覆蓋軌跡已生成:atac_coverage.bw
  • 分辨率:10bp
  • 覆蓋的總鹼基:21 億
  • 識別的峰值可及性區域:150,000

安全審計

安全
v4 • 1/17/2026

All 209 static findings are false positives. The static analyzer incorrectly flagged markdown documentation syntax as security risks. No malicious code present. This is a legitimate genomic analysis toolkit.

9
已掃描檔案
3,532
分析行數
2
發現項
4
審計總數
審計者: claude 查看審計歷史 →

品質評分

45
架構
100
可維護性
85
內容
21
社群
100
安全
91
規範符合性

你能建構什麼

峰重疊分析

通過比較 ChIP-seq 峰來識別重疊的調控元件並註釋變異。

覆蓋可視化

從 ATAC-seq 或 ChIP-seq 數據生成覆蓋軌跡,以用於基因組瀏覽器可視化。

基因組機器學習預處理

將基因組區域轉換為離散標記,以用於在 DNA 序列上訓練變壓器模型。

試試這些提示

基本重疊查詢
使用 gtars 從我的 peaks.bed 文件構建 IGD 索引,並使用 promoters.bed 查詢重疊。
覆蓋生成
使用 gtars uniwig 以 10bp 分辨率從我的 ATAC-seq 片段生成 BigWig 覆蓋軌跡。
機器學習標記化
從我的 training_regions.bed 創建 TreeTokenizer 並將基因組坐標標記化以用於機器學習模型輸入。
片段處理
使用 gtars fragsplit 按細胞條形碼拆分我的 fragments.tsv 並輸出到特定集群的目錄。

最佳實務

  • 處理大型基因組文件時使用記憶體映射模式(mmap=True)以獲得更好的效能。
  • 構建一次 IGD 索引並重複使用它進行多次重疊查詢。
  • 在批處理中明確指定線程數以實現可預測的資源使用。

避免

  • 不要在未啟用記憶體映射模式的情況下處理 GB 級別的文件。
  • 當有並行處理可用時,避免順序運行多個 gtars 命令。
  • 在與外部管道集成時不要跳過格式驗證。

常見問題

Gtars 支援哪些文件格式?
Gtars 支援 BED 用於區間、Wig/BigWig 用於覆蓋軌跡、FASTA 用於參考基因組,以及 TSV 用於片段文件。
使用 gtars 需要安裝 Rust 嗎?
Python 綁定可以在沒有 Rust 的情況下工作。只有從源碼安裝時,CLI 才需要 Rust/Cargo。
Gtars 與 bedtools 相比如何?
Gtars 提供類似的區間操作,具有 Rust 的效能,還有專門的 ML 標記化和 BigWig 支援。
Gtars 能處理染色體級別的文件嗎?
是的,記憶體映射模式可以以最少的 RAM 使用量處理染色體級別的文件。
什麼是 IGD 索引?
整合基因組數據庫是一種數據結構,用於在大型基因組區間集合上進行快速重疊查詢。
Gtars 與 geniml 兼容嗎?
是的,gtars 是 geniml 的基礎,並提供基因組 ML 工作流程的核心預處理操作。