ローカルLLMを簡単構築できるOllamaとは?
API経由のAI利用の利用料金がだいぶ高くなってきたのでローカルLLMを試したいと調査しているときの覚書。 Gemini 3.5 Flashと対話。 環境: Mac mini 2024 メモリ24GB, Tahoe 26.5 メインはWindows PCを利用しており、Mac miniはネットワーク経由で利用する前提。 Gemini先生に聞いたらOllamaを利用するといいと言われたので、Ollamaとは?から調べる。 1. Ollamaとは? Ollamaは、ローカル環境(macOS、Windows、Linux、Docker)でLLMを動作させるための軽量かつ拡張性の高いフレームワークおよびサーバー。 公式サイト: Ollama 概要一覧 アーキテクチャ: 主にGoと言語モデル推論ライブラリであるC++ベースの llama.cpp(および後述するApple Silicon向けの MLX バックエンドなど)を組み合わせて開発されている。 インターフェース: CLI(コマンドライン)、ローカルREST API(http://localhost:11434)、およびOpenAI互換のAPIエンドポイントを提供する。 最近の動向: 2026年に入り、ローカル実行のみならず「Ollama Pro/Max」といった、より大規模なモデルをクラウド上で並行実行できるハイブリッド型サービスも展開している。 Ollama自体にはモデルを再学習(ファインチューニング)する機能はない。 2. 歴史とライセンス Ollamaは2023年半ばにJeffrey Morgan氏らによって初期バージョンが公開された。 当時、ローカルでLLM(Llamaなど)を動作させるには、専門知識が必要だったが、Ollamaはそれらを「シングルバイナリで1コマンドで動かす」という体験に変え、一気にコミュニティに普及した。 参考: Ollama - Wikipedia ライセンス概要 Ollama本体のライセンス: MIT License で提供されており、商用利用を含めて自由度が高いOSSとなっている。 モデルのライセンス: Ollama経由でダウンロードして実行するモデル(Llama 3、Gemma、Qwen、DeepSeekなど)は、それぞれのベンダーが定め...