OllamaをインストールしてローカルLLMを試す

ローカルLLMを試したときの覚書。
Gemini 3.5 Flashと対話。

環境: Mac mini 2024 メモリ24GB, Tahoe 26.5

Ollamaの詳細は前の記事を参考に。
参考: ローカルLLMを簡単構築できるOllamaとは?


1. Ollama(オラマ)のインストール

公式にある通り下記コマンドを実行。
参考: Download Ollama on macOS
% curl -fsSL https://ollama.com/install.sh | sh

確認。
% ollama --version

ollama version is 0.24.0

Ollama サーバーの起動確認。
% lsof -nP -iTCP:11434 -sTCP:LISTEN

COMMAND  PID  USER   FD   TYPE             DEVICE SIZE/OFF NODE NAME
ollama  1107 daiki    4u  IPv4 0x2344cb061504ec77      0t0  TCP 127.0.0.1:11434 (LISTEN)

動作確認。
% curl http://127.0.0.1:11434/api/tags

{"models":[]}%


2. モデル「gemma4(ジェマ4)」を試す

利用可能なモデルは公式サイトで確認。
参考: https://ollama.com/library

gemma4を試してみる。
参考: Gemma 4 モデルの概要  |  Google AI for Developers
% ollama run gemma4:e4b

プロンプトが入力できるので試してみる。
「/bye」で終了する。

インストールされたモデル一覧。
% ollama list

NAME          ID              SIZE      MODIFIED
gemma4:e4b    c6eb396dbd59    9.6 GB    2 minutes ago

モデルの詳細表示。
% ollama show gemma4:e4b

  Model
    architecture        gemma4
    parameters          8.0B
    context length      131072
    embedding length    2560
    quantization        Q4_K_M
    requires            0.20.0

  Capabilities
    completion
    vision
    audio
    tools
    thinking

  Parameters
    temperature    1
    top_k          64
    top_p          0.95

  License
    Apache License
    Version 2.0, January 2004
    ...

3.WindowsからLAN内のローカルLLMへ問合せ

Mac miniのGUIデスクトップのステータスバーに表示されているOllamaをクリックして、Settings...を選択。
「Expose Ollama to the network」をオンにする。

Listenしているポートを確認。
% lsof -nP -iTCP:11434 -sTCP:LISTEN

ollama  1876 daiki    3u  IPv6 0x14ab69f659091ae0      0t0  TCP *:11434 (LISTEN)

WindowsのPowerShareからOllamaへ利用できるモデルを問い合わせ。
> curl.exe http://macmini2024:11434/v1/models

{"object":"list","data":[{"id":"gemma4:e4b","object":"model","created":1780292637,"owned_by":"library"}]}

gemma4へ問い合わせ実行。
> curl.exe http://macmini2024:11434/api/chat -H "Content-Type: application/json" -d '{"model":"gemma4:e4b","messages":[{"role":"user","content":"日本語で短く自己紹介してください"}],"stream":false}'

{"model":"gemma4:e4b","created_at":"2026-06-02T00:37:10.189361Z","message":{"role":"assistant","content":"こんにちは。\n\n私はAIアシスタントです。お話し相手になったり、何かを知りたいことについてお答えしたり、文章作成のお手伝いをしたりすることができます。\n\n何かお手伝いできることがありましたら、何でもお気軽にお申し付けください。どうぞよろしくお願いします!","thinking":"Thinking Process:\n\n1.  **Analyze the Request:** The user asks for a short self-introduction in Japanese (\"日本語で短く自己紹介してください\").\n2.  **Determine the Persona:** The response must be delivered from the perspective of an AI (specifically, a large language model).\n3.  **Identify Key Components of an AI Introduction (in Japanese):**\n    *   Greeting (挨拶): Hello.\n    *   Name/Identity (名前/正体): I am a language model. (Optional: State the name, if appropriate, but general identity is safer.)\n    *   Purpose/Function (役割): What can I do? (Answer questions, write text, chat, etc.)\n    *   Availability/Attitude (姿勢): I am ready to help.\n4.  **Drafting the Content (Internal Japanese Draft):**\n    *   *Greeting:* こんにちは。 (Kon'nichiwa.)\n    *   *Identity:* 私はAIです。 (Watashi wa AI desu.)\n    *   *Function:* あなたのお手伝いをします。質問に答えますし、文章を書くこともできます。 (Anata no otetsudai o shimasu. Shitsumon ni kotaemasu shi, bunshō o kaku koto mo dekimasu.)\n    *   *Call to Action:* 何かあれば、気軽に声をかけてください。 (Nani ka areba, kigaru ni koe o kakete kudasai.)\n5.  **Refining and Condensing (Making it natural and polite - Keigo appropriate for a general setting):** Combine these elements into a smooth, polite, and brief response.\n\n    *   *Target Tone:* Polite, helpful, clear, and concise.\n\n6.  **Final Japanese Output Selection:** (This is the selected response.)"},"done":true,"done_reason":"stop","total_duration":11873438000,"load_duration":3505205834,"prompt_eval_count":23,"prompt_eval_duration":110705292,"eval_count":448,"eval_duration":8099928278}


次はGemini, GPT, Gemma4などを簡単に切り替えて使える仕組みを考える。


▼ 関連知事