スキル geo-database
🧬

geo-database

低リスク 🌐 ネットワークアクセス⚙️ 外部コマンド📁 ファイルシステムへのアクセス

NCBI GEO遺伝子発現データへのアクセス

こちらからも入手できます: davila7

研究者は分析のために遺伝子発現データセットに効率的にアクセスする必要があります。このスキルにより、数百万のゲノムクスサンプルを含むNCBIのGEOデータベースへのクエリ、ダウンロード、分析が可能になります。

対応: Claude Codex Code(CC)
⚠️ 68 貧弱
1

スキルZIPをダウンロード

2

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

3

オンにして利用開始

テストする

「geo-database」を使用しています。 糖尿病の遺伝子発現データセットをで検索してください

期待される結果:

  • 'diabetes AND Homo sapiens'に一致する1,247件のデータセットが見つかりました
  • 上位の結果:
  • - GSE12345:2型糖尿病遺伝子発現(47サンプル)
  • - GSE67890:糖尿病性腎症研究(32サンプル)
  • - GSE11111:インスリン応答タイムコース(24サンプル)

「geo-database」を使用しています。 GSE12345をダウンロードしてメタデータを抽出してください

期待される結果:

  • GSE12345_series_matrix.txt.gz(145 MB)をダウンロードしました
  • データセットの概要:
  • - タイトル:糖尿病性vs正常腎のトランスクリプトームプロファイリング
  • - サンプル:20件(糖尿病性10件、対照10件)
  • - プラットフォーム:GPL570(Affymetrix Human Genome U133 Plus 2.0)
  • - 生物種:Homo sapiens
  • - 提交日:2023-06-15

セキュリティ監査

低リスク
v4 • 1/17/2026

Documentation-only skill for accessing NCBI GEO database. Static analysis flagged 256 pattern-based issues but all are false positives. The 'backtick execution' findings are markdown code block syntax, not actual shell commands. Network operations are legitimate NCBI API access. FTP downloads target public GEO data repositories. Optional API key usage follows NCBI best practices. No executable code present - only documentation.

3
スキャンされたファイル
1,878
解析された行数
3
検出結果
4
総監査数

リスク要因

🌐 ネットワークアクセス (3)
⚙️ 外部コマンド (3)
📁 ファイルシステムへのアクセス (1)
監査者: claude 監査履歴を表示 →

品質スコア

41
アーキテクチャ
100
保守性
87
コンテンツ
29
コミュニティ
90
セキュリティ
74
仕様準拠

作れるもの

疾患における遺伝子発現の分析

健康的組織と疾患組織のサンプル間の遺伝子発現データをダウンロードして比較し Biomarker を特定します。

複数研究間のメタ分析

複数のGEO研究のデータを組み合わせて、遺伝子発現変化の検出における統計的検出力,增加します。

予測モデルの構築

GEO発現データを使用して、薬物反応予測または患者層別化のための機械学習モデルをトレーニングします。

これらのプロンプトを試す

GEOデータセットの検索
GEOで過去5年間のヒト乳癌遺伝子発現データセットを検索してください。サンプル数と使用されたプラットフォームを含む上位5件の結果を表示してください。
発現データのダウンロード
GSE12345の発現行列とメタデータをダウンロードしてください。ファイルを./data/に保存し、サンプル数と遺伝子数を含むデータセットの概要を表示してください。
差次的発現分析
GSE12345で処理サンプルと対照サンプルを比較して差次的発現分析を実施してください。limmaまたはt-testを使用し、最も有意な遺伝子の上位10件を表示してください。
バッチ処理
次の3つのGEOシリーズをダウンロードして処理してください:GSE100001、GSE100002、GSE100003。発現データを抽出し、研究メタデータを含む概要テーブルを作成してください。

ベストプラクティス

  • NCBI E-utilitiesを使用する場合は必ずメールアドレスを設定してください(NCBIポリシーで必要です)
  • NCBIから бесплатно APIキーを取得してレート制限を増加させてください(10リクエスト/秒 vs 3リクエスト/秒)
  • ダウンロードしたGEOファイルをローカルにキャッシュして繰り返しダウンロードを避けてください

回避

  • Entire GEOデータベースをダウンロードせず、アクセスioned番号で選択的にアクセスしてください
  • 共有コードまたはバージョン管理されたコードにAPIキーをハードコードしないでください
  • 発現データを解釈する際にサンプルメタデータを無視しないでください

よくある質問

GEOアクセスにAPIキーが必要ですか?
APIキーはオプションですが推奨されます。キーなし:1秒あたり3リクエスト。キーあり:1秒あたり10リクエスト。 бесплатноキーはncbi.nlm.nih.gov/account/で取得してください。
GSE、GSM、GPLの違いは何ですか?
GSEは完全な研究(シリーズ)、GSMは個々のサンプル、GPLはマイクロアレイまたはシークエンシングプラットフォームです。完全なデータセットにはGSEを使用してください。
なぜ一部のシリーズで発現データがありませんか?
古い提交には行列ファイルがない場合があります。完全なデータにはファミリーSOFTファイルをダウンロードするか、個々のサンプルテーブルをパースしてください。
非常に大きなGEOデータセットをどのように処理すればよいですか?
バルクデータにはFTPダウンロードを使用し、チャンクで処理し、スパース発現データにはスパース行列を使用してメモリ効率を上げてしてください。
GEOデータを臨床研究に使用できますか?
はい、GEOデータはパブリックドメインです。必ず元の研究を引用し、臨床応用前にデータ品質を確認してください。
発現データにはどのようなファイル形式を使用すべきですか?
シリーズ行列ファイルは発現値で最も高速です。完全なメタデータにはSOFTを使用してください。XMLベースの処理ニーズにはMINiMLを使用してください。

開発者の詳細

ファイル構成