2.12.1 版本更新说明:
新功能
功能(aio):添加 Intel 配置文件
增强 autogptq 后端以支持 VL 模型
功能(assistant):助手和 AssistantFiles API
功能:为 Transformer 后端添加 Openvino 运行时,以及 Openvino 和 CUDA 的流式支持
功能:为 Transformer 添加 Token Stream 支持,修复:缺少 OpenVINO 包的问题
功能(welcome):添加简单的欢迎页面
修复(build):改进 CI 日志记录,并修正 Makefile 中的一些构建失败模式
功能(webui):添加部分功能,显示与模型关联的后端
功能(swagger):添加 Swagger API 文档
功能(build):调整并行构建的 make 任务数量
功能:首次改进日志记录
修复(llama.cpp):为 llama.cpp 设置更好的默认值
修复
修复:降级 torch
修复(aio):正确检测 Intel 系统
修复(swagger):不指定主机
修复(tools):在模板中正确渲染工具响应
修复(grammar):尊重用户输入中的 JSON 模式和语法
修复(hermes-2-pro-mistral):为 toolcall 添加停用词
修复(functions):在从字符串中选取时保持尊重
修复:在入口点脚本中使用 exec 来修复信号处理
修复(hermes-2-pro-mistral):修正停用词
修复(welcome):稳定的模型列表
修复(ci):手动标记最新的镜像
修复(seed):如果设置为 -1,则每个请求生成随机种子
修复回归问题
文档和示例
文档(aio-usage):更新文档以展示示例