新模型介绍
-
Gemma 2 2B:这是 Google DeepMind 推出的一款全新的,参数量为 20 亿的模型。
ollama run gemma2:2b
0.3.1更新内容
-
新增了对 min_p 采样选项的支持。
-
现在,ollama create 命令能够在导入特定模型时,自动侦测并设置所需的停止参数。
-
在 Windows 系统上,如果缺少必要文件,Ollama 会显示更为清晰的错误提示。
-
修正了使用 /save 命令时,参数保存不正确的问题。
-
现在,如果进行了工具调用,兼容 OpenAI API 的返回值中会包含结束原因为 tool_calls。
-
使用 ollama pull 命令下载模型时,性能和可靠性得到了提升。
-
Ollama 的 Linux 安装脚本针对不支持的 CUDA 版本,会给出更为明确的错误提示。
0.3.2更新内容
-
解决了使用 ollama pull 时,下载进度无法继续的问题。
-
修正了在旧版中运行 phi3 时出现报错的问题。
0.3.3 更新内容
-
现在,/api/embed 接口将返回包括总时长、加载时长和提示评估次数在内的统计信息。
-
在与 OpenAI 兼容的 /v1/embeddings API 中新增了使用指标。
-
解决了当提供上下文时,/api/generate 接口只会返回空字符串的问题。
-
修正了 /api/generate 接口在返回上下文信息时的错误。
-
现在,/show modefile 命令能够正确地显示 MESSAGE 指令。


