Ollama让本地运行大模型简单到极致:

上手步骤

1. 安装:curl -fsSL https://ollama.com/install.sh | sh

2. 运行:ollama run llama3.1

3. 就这样。开始对话。

高级用法

  • API兼容OpenAI格式——现有代码改一行endpoint即用
  • Modelfile自定义——调参数/改系统提示/设温度
  • 多模型切换——ollama run mistral秒切
  • GPU自动利用——有N卡自动用CUDA加速

完全免费开源。搭配Open WebUI有完整ChatGPT界面。开发者/隐私需求必装。

编译来源:Hacker News (2026)