scikit-learn
安全 76使用 scikit-learn 構建機器學習模型
由 davila7
使用 scikit-learn 指南快速構建機器學習模型。包括分類、回歸、聚類、預處理、流水線和模型評估,配有可直接使用的示例。
scanpy
安全 80使用 scanpy 分析單細胞 RNA-seq 資料
由 davila7
單細胞 RNA-seq 分析需要複雜的工作流程來進行品質控制、聚類和視覺化。此技能提供完整的 scanpy 工作流程,包括 UMAP 生成、Leiden 聚類、標記基因識別和細胞類型註釋。
pymc-bayesian-modeling
安全 79使用 PyMC 建立貝葉斯模型
由 davila7
此技能提供使用 PyMC進行貝葉斯統計建模的工具。它支援建立層次模型、使用 NUTS 執行 MCMC 抽樣、進行變分推論,以及使用 LOO/WAIC 度量比較模型,以實現有原則的不確定性量化。
polars
安全 70掌握 Polars 實現高效能資料分析
由 davila7
Pandas 工作流程在大型資料集上速度慢且記憶體密集。本技能提供 Polars 的專家指導,Polars 是建立在 Apache Arrow 上的高速 DataFrame 函式庫,透過延遲求值、平行處理和直觀的表達式 API,提供 10-100 倍的效能提升。
plotly
安全 70使用 Plotly 建立互動式資料視覺化
由 davila7
建立圖表和視覺化既耗時又費力。Plotly 提供一個 Python 函式庫,包含 40 多種圖表類型,包括散點圖、熱力圖、3D 圖表和地理地圖。產生出版品質的互動式視覺化,並匯出為 HTML 或靜態圖片。
pdf-processing-pro
低風險 73擷取與處理 PDF 文件
由 davila7
手動處理 PDF 文件非常耗時。本工具包提供可立即使用的腳本,用於擷取文字、處理表單、擷取表格,以及對掃描文件執行 OCR,並支援批次處理。
pdf-processing
安全 69提取和處理 PDF 文件
由 davila7
PDF 文件包含有價值的數據,但難以程式化處理。此技能提供程式碼模式,使用 Python 庫(如 pdfplumber 和 pypdf)從 PDF 中提取文字、表格和表單數據。
matplotlib
低風險 74建立科學圖表和圖形
由 davila7
在 Python 中建立可發表品質的視覺化需要了解 matplotlib API、樣式選項和最佳實踐。此技能提供範本、程式碼範例和疑難排解指導,用於產生專業的圖表、圖形和用於研究和資料分析的 3D 視覺化。
matchms
安全 70分析質譜數據
由 davila7
質譜會產生複雜的光譜數據,需要專業的處理。Matchms 提供了一個完整的 Python 工具包,用於加載、篩選、比較和識別光譜數據中的化合物,採用成熟的相似度度量方法。
get-available-resources
安全 71偵測科學計算的系統資源
由 davila7
科學計算任務需要適當的硬體資源才能高效運行。此技能會自動偵測 CPU 核心數、GPU 可用性、記憶體和磁碟空間,以推薦最佳的計算策略和函式庫選擇。
geopandas
安全 71處理地理空間向量資料進行空間分析
由 davila7
分析地理資料需要專門的工具來處理向量幾何、坐標系統和空間關係。GeoPandas 擴展了 pandas,能夠對幾何類型執行空間操作,實現高效的地理空間資料處理。
fda-database
低風險 73查詢 FDA 資料庫以獲取監管數據
由 davila7
存取全面的 FDA 監管數據,包括藥物、醫療器材、食品召回和物質資訊。使用官方 openFDA API 搜尋不良事件、標籤、核准和召回資訊。
exploratory-data-analysis
安全 82分析科學數據文件
由 davila7
科學家需要在下載分析前了解多樣化科學數據文件的結構和品質。此技能可自動偵測檔案類型、提取中繼資料、執行統計分析,並為 200 多種科學格式產生全面的 markdown 報告。
excel-analysis
安全 70使用 Pandas 分析 Excel 試算表
由 davila7
手動分析 Excel 需要花費數小時的重複工作。此技能提供現成的 pandas 模式,可在幾秒鐘內讀取、分析和視覺化試算表資料。
dnanexus-integration
安全 70建置與部署 DNAnexus 基因體學流程
由 davila7
在 DNAnexus 上管理基因體學資料並建置分析流程需要學習複雜的 API 與模式。本技能提供在 DNAnexus 雲端平台上進行應用程式開發、資料管理與工作流程執行的完整指導。
diffdock
安全 81使用 AI 預測蛋白質-配體結合姿態
由 davila7
使用最先進的擴散模型預測蛋白質與小分子配體之間的 3D 結合姿態。為基於結構的藥物發現和虛擬篩選活動生成具有信心評分的預測結果。
deeptools
安全 78使用 deepTools 分析 NGS 資料
由 davila7
處理下一代測序資料,適用於 ChIP-seq、RNA-seq 和 ATAC-seq 實驗。將 BAM 檔案轉換為正規化的覆蓋率軌跡,並產生發表品質的視覺化圖表,包括熱圖、相關性圖和輪廓圖。
datamol
安全 70使用 Python 分析分子並計算藥物屬性
由 davila7
在 Python 中處理分子資料需要複雜的 RDKit 程式碼。Datamol 提供簡單的函數用於 SMILES 解析、屬性計算和化合物分析。
datacommons-client
安全 71查詢 Data Commons 的公開統計資料
由 davila7
從多個全球來源存取人口統計、經濟和健康資料需要瀏覽複雜的 API。此技能提供使用 Data Commons Python 用戶端查詢人口統計、失業率、GDP 數據及其他公開資料集的完整指南,透過統一的知識圖譜進行查詢。
dask
安全 70使用 Dask 擴展 pandas 和 NumPy 超越記憶體限制
由 davila7
處理超過可用 RAM 的大型資料集會導致記憶體錯誤和效能緩慢。Dask 提供平行運算抽象,可擴展 pandas 和 NumPy 操作,在筆記型電腦或叢集上處理 TB 級資料。