geo-database
NCBI GEO에서 유전자 발현 데이터 검색 및 다운로드
또한 다음에서 사용할 수 있습니다: K-Dense-AI
유전자 발현 데이터셋을 찾고 처리하려면 복잡한 데이터베이스 구조와 파일 형식을 탐색해야 합니다. 이 스킬은 GEO 마이크로어레이 및 RNA-seq 데이터를 검색, 다운로드, 분석하기 위한 즉시 사용 가능한 코드 패턴을 제공합니다.
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"geo-database" 사용 중입니다. 50개 이상의 샘플이 있는 인간 폐암 데이터셋을 GEO에서 검색
예상 결과:
- GEO DataSets에서 234개 일치하는 데이터셋 발견
- 최상위 결과: GSE31210 - 폐선암종의 유전자 발현 프로파일
- 생물종: Homo sapiens, 플랫폼: GPL570, 샘플: 246개
- 전체 메타데이터를 가져오고 발현 데이터를 다운로드하는 Python 코드 제공
"geo-database" 사용 중입니다. GSE54460을 다운로드하고 샘플 그룹화 표시
예상 결과:
- 시리즈 매트릭스 파일 다운로드 완료 (압축 시 45MB)
- 시리즈에는 3개 조건에 걸친 106개 샘플 포함
- 그룹: 정상 전립선(17개), 원발성 종양(51개), 전이성(38개)
- 발현 매트릭스: 22,283개 프로브 x 106개 샘플, 분석 준비 완료
보안 감사
안전This skill provides documentation and code examples for accessing NCBI's Gene Expression Omnibus database. All 258 static findings are false positives caused by pattern matching against markdown code blocks (triple backticks), bioinformatics terminology (SAM samples, ch2 channels), legitimate NCBI API URLs, and GEO accession number patterns.
위험 요인
⚙️ 외부 명령어 (163)
🌐 네트워크 접근 (28)
📁 파일 시스템 액세스 (2)
🔑 환경 변수 (2)
품질 점수
만들 수 있는 것
암 유전자 발현 데이터셋 다운로드
유방암 RNA-seq 연구를 검색하고, 발현 매트릭스를 다운로드하며, 차등 발현 분석을 위한 데이터를 준비합니다.
발표된 연구 데이터 접근
논문의 GEO 접근 번호에서 보조 데이터를 검색하여 발표된 분석을 재현하거나 확장합니다.
유전자 발현 메타 분석 파이프라인 구축
여러 관련 연구를 일괄 다운로드하고 플랫폼 간 발현 데이터를 결합하여 메타 분석을 수행합니다.
이 프롬프트를 사용해 보세요
지난 2년간의 인간 유방암 RNA-seq 데이터셋을 GEO에서 검색하고 메타데이터를 가져오는 방법을 보여주세요.
GSE123456에서 GEOparse를 사용하여 발현 매트릭스를 다운로드하고 샘플 정보를 보여주세요.
GPL570 플랫폼의 발현 데이터가 있습니다. 프로브 ID를 基因 심볼로 매핑하는 것을 도와주세요.
GSE123456을 처리군과 대조군 샘플과 함께 다운로드했습니다. 차등 발현 분석 워크플로우를 설정해주세요.
모범 사례
- NCBI 정책을 준수하기 위해 E-utilities 사용 전 항상 Entrez.email 설정
- 반복 다운로드 및 비율 제한 존중을 위해 다운로드한 GEO 파일을 로컬에 캐시
- 제출 이후 基因 심볼이 업데이트되었을 수 있으므로 플랫폼 어노테이션이 최신인지 확인
피하기
- 지연 없이 빠르게 반복 요청 - 이는 NCBI 비율 제한을 위반하며 차단될 수 있음
- 모든 발현 값이 비교 가능하다고 가정 - 원시, 정규화 또는 로그 변환 데이터인지 확인
- 여러 연구 또는 플랫폼의 데이터를 결합할 때 배치 효과 무시