GeminiCLIの導入から使用まで

AI

 GeminiCLIがすごいという記事を読んで、使いたくなったので使ってみることにしました。
 MCPサーバに興味はあったのですが、多忙のために億劫になっていました。
 GeminiCLIは自分の仕事にもつかえそうだと感じたので、とりあえず導入してみて、使ってみた感想などを書きたいと思います。

環境

Windows11Home

やりたいこと

 GeminiCLIの導入(インストールから起動まで)
 何ができるのか(簡単なホームページを作らせてみる)

説明書

 導入に当たっては、GitHub – google-gemini/gemini-cli: An open-source AI agent that brings the power of Gemini directly into your terminal.のREADMEを参考にしました。

導入編 

①前提条件を満たす

 GeminiCLIのREADMEを参照したところ、インストールには、
   Node.js
が必要とのことでしたので、Node.js — どこでもJavaScriptを使おうからダウンロードしてインストールします。
 ダウンロードからインストールまで、特に難しいところはありませんでした。

「Node.jsをインストールする」を選択

 OSとアーキテクチャを選択してインストーラーをダウンロード。
 当環境では、node-v22.17.0-x64.msi をダウンロードしてインストールしました。
 インストールも、次へを押すだけの簡単な作業でした。

②PowerShell(管理者モード)からnode.jsの動作を確認

 PowerShellの管理者モード起動方法

 node.jsが正常に起動しているか確認。
 node は正常に動作するのに、npm や npx が動作しません。
 私の環境では、PowerShellのポリシー制約がかかっており、実行ポリシーを変更する必要がありましたので次の修正を行いました。

PS C:\ > node --version
v22.17.0
PS C:\ > npm --version
npm : このシステムではスクリプトの実行が無効になっているため、ファイル D:\tool\nodejs\npm.ps1 を読み込むことができません。
PS C:\ > npx --version
npx : このシステムではスクリプトの実行が無効になっているため、ファイル D:\tool\nodejs\npx.ps1 を読み込むことができません。

# ポリシーを変更する必要があります

# powershell 上で現在のアカウント上でポリシーの変更を行う
#  ローカル作成したスクリプトの実行を可能にする
#  インターネットからダウンロードしたファイル(デジタル署名があるもの)の実行を可能にする
PS C:\ > Set-ExecutionPolicy -Scope CurrentUser -ExecutionPolicy RemoteSigned 

# npm や npx が動作することを確認
PS C:\ > npm --version
10.9.2
PS C:\ > npx --version
10.9.2

③geminiCLIの一時インストール

 次のコマンドで仮想環境を使った一時インストールを行います。
 この方法を使うと、プロジェクトはキャッシュ内に保存され、永続的にパッケージが保存されません。

# パッケージの一時インストール
PS C:\ > npx https://github.com/google-gemini/gemini-cli
Need to install the following packages:
github:google-gemini/gemini-cli
Ok to proceed? (y) y

実行するとGeminiCLIが起動します。

Defaultを選択

ログインの方法を聞かれるので、「Login with Google」を選択

Node.jsがファイヤーウォールを超えようとしてくるので、許可してあげましょう。

ブラウザからGoogleアカウントを選択します。
いちいちパスワードを入れなくていいのは楽でいいですね。しかもセキュア。

なるほど、遠隔操作によってGeminiCLIがインストールされているかもしれませんからね、GeminiCLIのログインだとユーザに対して明示しているのですね。
等とブツブツ言いながらインストール続行。

ログインが成功したようです。

問題なくGeminiCLIがインストールできることがわかったので、ターミナルを一度終了させて、Gemini CLIを正規インストールします。

④GeminiCLIのインストール、起動

 次のコマンドでインストールを行います。
 アカウントの認証は終わっているので、スムーズに進みます。

# gemini cli関連ライブラリのインストール
PS C:\ > npm install -g @google/gemini-cli

added 431 packages in 11s  # 431個のパッケージを入れたよ

123 packages are looking for funding
  run `npm fund` for details

# geminicliの起動
PS C:\ > gemini

 無事起動しました。

 GeminiCLIの起動には管理者権限は不要です。

実行編

 さっそくGeminiCLIを使ってみます。
 思い付きで、d:\mcp フォルダにホームページを作成させてみることにしました。
 チョコミントを食べながら作っていたので、題材も思い付きですw

 モダンって入れておくと、いい感じのホームページを作ってくれる気がしています。
 現代風っていう意味らしいですね(最近知りました)

 逐一確認してくれる。
 優秀なエージェント部下を持った気分です。よろしい、やりたまえ。

 テストだと、カレントディレクトリにIMGファイルも入れがちですが、ちゃんとimageフォルダも作るのですね。
 君は見どころがあるねぇ

 フォルダに書き込み権限がないというエラーが返ってきています。
 どこでも書き込めたら危険ですからね。安全設計というわけですね。
 面倒ですが、闇雲にPC内のデータを変更されると危険ですので、この辺りは必要な仕様だと感じます。
 Usersフォルダ内に作るのですね。よろしい。

 コピーライトまで書いている様子。
 どんなページができるのか楽しみです。

 テストページだと、CSSもindex.html内に作ることが多いのですが、最初からファイル分割するのですか。
 ファイル分割すると、ブラウザキャッシュに残るので編集しにくいんですよね。(独り言)

 チョコミントアイスは、SVGファイルで作るのですね。
 生成AIと紐づいているので、textToimageで作ると思っていたのですが、AIリソースの節約かもしれません。

 完成したみたいです。
 ここまで、私がブツブツ言いながら1分位かかったように感じます。 
 作成したホームページはこんな感じでした。

 SVGのチョコミントも、思っていたよりいい感じです。このまま使えるレベルではありませんが、一行のプロンプトでこれだけ作ってくれるなら、機能としては充分優秀だと思います。
 私は一切ソースに触れることなく、ここまで作ってくれました。
 ちなみに「今すぐ購入」を押しても、どこにもリンクしていませんw

感想

 今回一番驚いたのは導入部分で、こんなに簡単にローカル環境で内でMCP環境を構築できると思わなかったので、驚きました。
 CLIを使った感想は、英語中心のコンソールではあるものの、GUIライクなUIで、非常に使いやすいと感じました。
 しかし、小さなプロジェクトではいいかもしれませんが、中規模以上のプロジェクトでは、AIに修正コーディングをさせるのは、ちょっと危険な香りもしています。(複雑になってくると、いらないところを直したり指示に従わなかったりするんですよね)
 現時点では、まだAIによる自動修正は現実的ではないと感じています。
 今後、AIの性能向上や、UIをプロンプト化する技術、プロンプトの規則化が進んでいけば、AIによるアプリ開発が現実味を帯びるかもしれません。(AIプロンプト言語になるとノーコードとは言えませんね)