vLLM for Python3.11

Linux

64位

very Large Language Model 0.4.0 正式版

查看最新版本

操作系统: Linux

最近更新: 2024-08-06

使用许可: 开源

语言: 不支持中文

文件大小: 109.88 MB

0.4.0 版本更新说明：

模型

新模型：Command+R, Qwen2 MoE, DBRX, XVerse, Jais。

新的视觉语言模型：LLaVA。

生产特性

自动前缀缓存，支持长系统提示在请求之间自动缓存。使用 --enable-prefix-caching 标志来启用它。

在 OpenAI 服务器中支持任意 JSON，使用 --use-delay 标志来改进多个请求之间的首个令牌生成时间，以及 EOS 抑制。

在分块预填充调度器和投机解码方面取得了进展。

自定义的 all-reduce 内核在进行了更多的鲁棒性修复后已重新启用。

由于其存在的缺陷，已替换 cupy 依赖。

硬件

改进了对 AWS Inferentia 的 Neuron 支持。

基于 CMake 的构建系统，以提高可扩展性。

生态系统

广泛的服务基准测试重构。

使用统计信息收集

来自 undefined 的其他软件查看全部

EagleGet 2.1.6.70 正式版 01-04 更新

Chromium 122.0.6227.0 正式版 01-04 更新

Chromium 122.0.6227.0 正式版 01-04 更新

Chromium 122.0.6227.0 正式版 01-04 更新

Signal 7.33.0 正式版 11-15 更新

Signal 7.33.0 正式版 11-15 更新

Discord 1.0.9162 正式版 09-08 更新

Discord 0.0.318 正式版 09-08 更新

Discord 0.0.67 正式版 09-08 更新

Steam 最新版正式版 06-04 更新

最近更新软件·Linux 软件更新列表

[开发] Apifox 2.6.32 ARM64

11-21

[开发] Apifox 2.6.32 64位

11-21

[应用软件] 腾讯文档 3.8.11 ARM64

11-21

[应用软件] 腾讯文档 3.8.11 64位

11-21

[网络] 小鱼易连 3.10.0.23021 ARM64/麒麟,鲲鹏

11-21

[网络] 小鱼易连 3.10.0.23021 ARM64/麒麟,鲲鹏

11-21

[网络] Brave Browser 1.73.91 ARM64

11-21

[网络] Brave Browser 1.73.91 64位

11-21

[应用软件] Slack 4.41.97 64位

11-21

[开发] Cursor 0.42.5 64位

11-20

新软件·Linux 新软件列表

[开发] Cursor 0.42.5 64位

11-20

[系统工具] VMware Workstation 17.6.1 64位

11-19

[网络] 微信 4.0.0 龙芯

11-11

[网络] 微信 4.0.0 ARM64

11-11

[网络] 微信 4.0.0 64位

11-11

[开发] Another Redis Desktop Manager 1.7.0 ARM64

11-10

[网络] 115浏览器 27.0.6.9 64位

11-09

[开发] Python 3.13 3.13.0 64位

11-07

[开发] Python 3.12 3.12.7 64位

11-07

[开发] Python 3.11 3.11.10 64位

11-07