0.1.39 版本更新说明:
新增模型
Phi-3 Medium:这是微软推出的一款先进、轻量级的开源模型,参数量为140亿。
Llama 3 导入功能
现在,您可以从Safetensors格式导入并量化Llama 3及其微调模型至Ollama平台。操作步骤如下:
首先,使用Git克隆一个包含Safetensors模型的Hugging Face仓库:
git clone https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct cd Meta-Llama-3-8B-Instruct
然后,在该目录下创建一个名为Modelfile
的配置文件,用于定义模型的模板和参数:
FROM . TEMPLATE """{{ if .System }}<|start_header_id|>system<|end_header_id|> {{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|> {{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|> {{ .Response }}<|eot_id|>""" PARAMETER stop <|start_header_id|> PARAMETER stop <|end_header_id|> PARAMETER stop <|eot_id|>
使用以下命令创建并量化模型:
ollama create --quantize q4_0 -f Modelfile my-llama3 ollama run my-llama3
更新内容概览
- 提升生成速度:在Apple Silicon Macs和NVIDIA显卡上提高了令牌生成的速度。
- 修复宽字符问题:解决了中文、韩文、日文和俄文等宽字符语言的显示问题。
- 新增环境变量:引入了新的环境变量
OLLAMA_NOHISTORY=1
,运行ollama run
时设置此变量可禁用历史记录功能。 - 错误修复:解决了在Windows系统中使用
ollama create -f Modelfile
命令时出现的错误。