scikit-learn
安全 76应用 scikit-learn 构建机器学习模型
作成者 davila7
通过 scikit-learn 指导快速构建机器学习模型。涵盖分类、回归、聚类、预处理、管道和模型评估,提供可直接使用的示例。
scanpy
安全 80使用 scanpy 分析单细胞 RNA 测序数据
作成者 davila7
单细胞 RNA 测序分析需要复杂的工作流程来进行质量控制、聚类和可视化。此技能提供完整的 scanpy 工作流程,包括 UMAP 生成、Leiden 聚类、标记基因识别和细胞类型注释。
pymc-bayesian-modeling
安全 79使用PyMC构建贝叶斯模型
作成者 davila7
本技能提供使用PyMC进行贝叶斯统计建模的工具���它支持构建层次模型、使用NUTS进行MCMC采样、执行变分推理,以及使用LOO/WAIC指标比较模型,以进行原则性的不确定性量化。
polars
安全 70掌握 Polars 实现高性能数据分析
作成者 davila7
Pandas 工作流在大数据集上运行缓慢且内存消耗大。本技能提供关于 Polars 的专家指导,Polars 是一个基于 Apache Arrow 构建的极速 DataFrame 库,通过惰性求值、并行处理和直观的表达式 API 提供 10-100 倍性能提升。
plotly
安全 70使用 Plotly 创建交互式数据可视化
作成者 davila7
创建图表和数据可视化非常耗时。Plotly 提供了一个 Python 库,支持 40 多种图表类型,包括散点图、热力图、3D 图表和地理地图。生成可直接发布的高质量交互式可视化,并导出为 HTML 或静态图像。
pdf-processing-pro
低リスク 73提取和处理PDF文档
作成者 davila7
手动处理PDF文档太耗时。本工具包提供生产就绪的脚本,用于提取文本、处理表单、提取表格,并对扫描文档执行OCR,支持批处理。
pdf-processing
安全 69提取和处理 PDF 文档
作成者 davila7
PDF 文档包含有价值的数据,但难以通过编程方式处理。此技能提供使用 Python 库(如 pdfplumber 和 pypdf)从 PDF 中提取文本、表格和表单数据的代码模式。
matplotlib
低リスク 74创建科学图表和图形
作成者 davila7
在 Python 中创建出版质量的可视化需要了解 matplotlib API、样式选项和最佳实践。此技能提供模板、代码示例和故障排除指南,用于生成专业的图表、图形和 3D 可视化,适用于研究和数据分析。
matchms
安全 70分析质谱数据
作成者 davila7
质谱产生复杂的光谱数据,需要专门的处理。Matchms提供了一个完整的Python工具包,用于使用成熟的相似性度量方法从光谱数据中加载、过滤、比较和识别化合物。
get-available-resources
安全 71检测科学计算的系统资源
作成者 davila7
科学计算任务需要适当的硬件资源才能高效运行。此技能可自动检测CPU核心、GPU可用性、内存和磁盘空间,以推荐最佳计算策略和库选择。
geopandas
安全 71处理地理空间矢量数据进行空间分析
作成者 davila7
分析地理数据需要专用工具来处理矢量几何、坐标系和空间关系。GeoPandas 扩展了 pandas,使其能够对几何类型进行空间操作,从而实现高效的地理空间数据处理。
fda-database
低リスク 73查询 FDA 数据库获取监管数据
作成者 davila7
访问全面的 FDA 监管数据,包括药品、医疗器械、食品召回和物质信息。使用官方 openFDA API 搜索不良事件、标签、批准和召回信息。
exploratory-data-analysis
安全 82分析科学数据文件
作成者 davila7
科学家需要在分析前了解不同科学数据文件的结构和质量。此技能可自动检测文件类型、提取元数据、执行统计分析和生成200多种科学格式的综合markdown报告。
excel-analysis
安全 70使用 Pandas 分析 Excel 电子表格
作成者 davila7
手动 Excel 分析需要数小时的重复工作。此技能提供即用的 pandas 模式,可在几秒钟内读取、分析和可视化电子表格数据。
dnanexus-integration
安全 70构建和部署 DNAnexus 基因组学流程
作成者 davila7
在 DNAnexus 上管理基因组数据和构建分析流程需要学习复杂的 API 和模式。此技能为 DNAnexus 云平台上的应用开发、数据管理和工作流执行提供全面指导。
diffdock
安全 81使用AI预测蛋白质-配体结合构象
作成者 davila7
使用最先进的扩散模型预测蛋白质和小分子配体之间的3D结合构象。为基于结构的药物发现和虚拟筛选提供置信度评分预测。
deeptools
安全 78使用 deepTools 分析 NGS 数据
作成者 davila7
处理下一代测序数据用于 ChIP-seq、RNA-seq 和 ATAC-seq 实验。将 BAM 文件转换为归一化的覆盖轨道并生成出版物质量的可视化图表,包括热图、相关性图和剖面图。
datamol
安全 70使用 Python 分析分子和计算药物特性
作成者 davila7
在 Python 中处理分子数据需要复杂的 RDKit 代码。Datamol 提供了简单的函数用于 SMILES 解析、特性计算和化合物分析。
datacommons-client
安全 71从 Data Commons 查询公共统计信息
作成者 davila7
从多个全球来源获取人口、经济和健康数据需要复杂的 API。此技能提供完整指南,教您如何使用 Data Commons Python 客户端通过统一的知识图谱查询人口统计、失业率、GDP 数据和其他公共数据集。
dask
安全 70使用Dask扩展pandas和NumPy以超越内存限制
作成者 davila7
处理超出可用RAM的大型数据集会导致内存错误和性能下降。Dask提供并行计算抽象,可将pandas和NumPy操作扩展到在笔记本电脑或集群上处理TB级数据。