geo-database
NCBI GEO 유전자 발현 데이터 접근
또한 다음에서 사용할 수 있습니다: davila7
연구자들은 분석을 위해 유전자 발현 데이터셋에 대한 효율적인 접근이 필요합니다. 이 스킬은 수백만 개의 유전체학 샘플을 포함하는 NCBI의 GEO 데이터베이스에서 데이터 조회, 다운로드 및 분석을 가능하게 합니다.
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"geo-database" 사용 중입니다. Search for diabetes gene expression datasets in humans
예상 결과:
- Found 1,247 datasets matching 'diabetes AND Homo sapiens'
- Top results:
- - GSE12345: Type 2 diabetes gene expression (47 samples)
- - GSE67890: Diabetic nephropathy study (32 samples)
- - GSE11111: Insulin response time course (24 samples)
"geo-database" 사용 중입니다. Download GSE12345 and extract metadata
예상 결과:
- Downloaded GSE12345_series_matrix.txt.gz (145 MB)
- Dataset summary:
- - Title: Transcriptome profiling of diabetic vs normal kidney
- - Samples: 20 (10 diabetic, 10 control)
- - Platform: GPL570 (Affymetrix Human Genome U133 Plus 2.0)
- - Organism: Homo sapiens
- - Submission date: 2023-06-15
보안 감사
낮은 위험Documentation-only skill for accessing NCBI GEO database. Static analysis flagged 256 pattern-based issues but all are false positives. The 'backtick execution' findings are markdown code block syntax, not actual shell commands. Network operations are legitimate NCBI API access. FTP downloads target public GEO data repositories. Optional API key usage follows NCBI best practices. No executable code present - only documentation.
위험 요인
🌐 네트워크 접근 (3)
⚙️ 외부 명령어 (3)
📁 파일 시스템 액세스 (1)
품질 점수
만들 수 있는 것
질환에서 유전자 발현 분석
건강 조직과 질환 조직 샘플 간의 유전자 발현 데이터를 다운로드하고 비교하여 바이오마커를 식별합니다.
연구 간 메타 분석
여러 GEO 연구의 데이터를 결합하여 유전자 발현 변화를 탐지하기 위한 통계적 검정력을 증가시킵니다.
예측 모델 구축
GEO 발현 데이터를 활용하여 약물 반응 예측 또는 환자分层을 위한 머신러닝 모델을 훈련시킵니다.
이 프롬프트를 사용해 보세요
지난 5년간의 인간 유방암 유전자 발현 데이터셋을 GEO에서 검색하세요. 샘플 수와 사용된 플랫폼이 포함된 상위 5개 결과를 보여주세요.
GSE12345의 발현 매트릭스와 메타데이터를 다운로드하세요. 파일을 ./data/에 저장하고 샘플 수와 유전자 수를 포함한 데이터셋 요약을 보여주세요.
GSE12345에서 처리군과 대조군 샘플을 비교하여 차등 발현 분석을 수행하세요. limma 또는 t-test를 사용하고 가장 유의미한 상위 10개 유전자를 보여주세요.
다음 3개의 GEO 시리즈를 다운로드하고 처리하세요: GSE100001, GSE100002, GSE100003. 발현 데이터를 추출하고 연구 메타데이터가 포함된 요약 테이블을 생성하세요.
모범 사례
- NCBI E-utilities 사용 시 항상 이메일 설정 (NCBI 정책에서 요구)
- 증가된 비율 제한을 위해 NCBI에서 무료 API 키 얻기 (10 req/s vs 3 req/s)
- 반복 다운로드 피하기 위해 다운로드한 GEO 파일을 로컬에 캐시
피하기
- 전체 GEO 데이터베이스를 다운로드하지 말고 접근 번호로 선택적으로 접근하세요
- 공유되거나 버전 관리되는 코드에 API 키를 하드코딩하지 마세요
- 발현 데이터 해석 시 샘플 메타데이터를 무시하지 마세요
자주 묻는 질문
GEO 접근에 API 키가 필요한가요?
GSE, GSM, GPL의 차이점은 무엇인가요?
일부 시리즈에서 발현 데이터가 누락된 이유는 무엇인가요?
매우 큰 GEO 데이터셋을 어떻게 처리하나요?
임상 연구에 GEO 데이터를 사용할 수 있나요?
발현 데이터에 어떤 파일 형식을 사용해야 하나요?
개발자 세부 정보
작성자
K-Dense-AI라이선스
MIT
리포지토리
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/geo-database참조
main
파일 구조