スキル gemini-computer-use
🖥️

gemini-computer-use

安全 🌐 ネットワークアクセス⚙️ 外部コマンド

Авт��матизация браузерных задач с помощью Gemini AI

Этот навык позволяет AI-агентам управлять веб-браузерами для автоматизации задач, таких как заполнение форм, извлечение данных и веб-тестирование, через модель Gemini 2.5 Computer Use с Playwright.

対応: Claude Codex Code(CC)
🥉 74 ブロンズ
1

スキルZIPをダウンロード

2

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

3

オンにして利用開始

テストする

「gemini-computer-use」を使用しています。 python scripts/computer_use_agent.py --prompt 'Find the heading on example.com' --start-url 'https://example.com'

期待される結果:

Агент переходит на example.com, делает скриншот, AI анализирует его и возвращает: 'Основной заголовок: Example Domain'

「gemini-computer-use」を使用しています。 python scripts/computer_use_agent.py --prompt 'Click the login button' --start-url 'https://mysite.com'

期待される結果:

Агент определяет кнопку входа из скриншота, выполняет действие клика, возвращает обновлённый скриншот с формой входа

セキュリティ監査

安全
v1 • 3/6/2026

All 52 static findings are false positives. The skill is a legitimate browser automation tool using Gemini 2.5 Computer Use API with Playwright. Environment variable access is secure (API keys via os.getenv), network calls are to Google's legitimate API, and external command patterns are documentation examples in markdown/code blocks.

4
スキャンされたファイル
475
解析された行数
5
検出結果
1
総監査数

高リスクの問題 (1)

Environment Variable Access
Code accesses environment variables for API key configuration. This is SECURE pattern - keys are read from os.getenv, not hardcoded.
中リスクの問題 (1)
Shell Command Documentation
Static scanner flagged backticks in markdown and code blocks as shell execution. These are legitimate documentation and user command examples.
低リスクの問題 (1)
Hardcoded Default URL
Default start URL is hardcoded as google.com. This is a standard default for browser automation testing.

リスク要因

🌐 ネットワークアクセス (2)
⚙️ 外部コマンド (1)
監査者: claude

品質スコア

64
アーキテクチャ
100
保守性
85
コンテンツ
24
コミュニティ
88
セキュリティ
91
仕様準拠

作れるもの

Автоматическое заполнение веб-форм

Автоматическое заполнение форм путём предоставления целевого URL и значений полей AI-агенту.

Извлечение веб-данных

Навигация по веб-сайтам и извлечение структурированных данных на основе понимания содержимого страницы AI.

Тестирование в браузере

Запуск автоматизированных браузерных тестов, которые могут адаптироваться к изменениям UI с помощью интерпретации AI.

これらのプロンプトを試す

Базовая навигация по странице
Перейдите на {url} и сообщите мне название основного заголовка на странице.
Отправка формы
Перейдите на {url}, заполните поле email значением {email} и нажмите кнопку отправки. Сообщите любое сообщение об успехе.
Многоэтапный рабочий процесс
Найдите {query} в {search_engine}, нажмите на первый результат и извлеките контактный email, если он виден.
Извлечение данных
Перейдите на {url}, прокрутите страницу и перечислите все названия продуктов и цены в формате таблицы.

ベストプラクティス

  • Запускайте в изолированном профиле браузера или контейнере для отделения от конфиденциальных данных
  • Используйте параметр --exclude для блокировки рискованных действий, таких как загрузка файлов
  • Настройте лимиты ходов для предотвращения бесконечных циклов агента

回避

  • Не предоставляйте реальные учётные данные AI без подтверждения пользователя
  • Избегайте запуска на рабочих веб-сайтах без ограничения частоты запросов
  • Не полагайтесь только на AI для критических финансовых транзакций

よくある質問

Как получить ключ Gemini API?
Зарегистрируйтесь в Google AI Studio и включите предварительную версию Computer Use. Добавьте свой ключ в переменную окружения GEMINI_API_KEY.
Этот навык работает с любым веб-сайтом?
Большинство веб-сайтов работают, но некоторые имеют обнаружение ботов или требуют аутентификацию, которую AI не может обойти.
Безопасна ли автоматиз��ция браузера?
Это безопасно при запуске в изолированных средах. Навык включает запросы подтверждения безопасности для рискованных действий.
Какой браузер используется?
По умолчанию используется встроенный в Playwright Chromium. Вы можете настроить Chrome, Edge или другие исполняемые файлы Chromium.
Как ограничить действия AI?
Используйте параметр --exclude для блокировки определённых действий, таких как navigate, click_at или type_text_at.
Можно запускать в headless-режиме?
Да, добавьте флаг --headless для запуска без видимого окн�� браузера.

開発者の詳細

作成者

am-will

ライセンス

MIT

参照

main

ファイル構成