vLLM for Python3.11+cu118

Linux

64位

very Large Language Model 0.5.2 正式版

查看最新版本

操作系统: Linux

最近更新: 2024-09-15

使用许可: 开源

语言: 不支持中文

文件大小: 140.59 MB

0.5.2 版本更新说明：

计划中的重大变更：

我们计划在未来几个版本中移除束搜索（beam search）。此版本会在请求中启用束搜索时发出警告。如果您在vLLM中确实有使用束搜索的有效场景，请在RFC中提出您的担忧。

本次发布已转向与Python版本无关的wheel包。单个wheel包可安装于vLLM所支持的所有Python版本上。

模型支持

新增PaliGemma模型、Fuyu-8B模型

支持软调优提示

新增添加多模态插件的指南

硬件

AMD平台：统一CUDA_VISIBLE_DEVICES的使用

性能优化

针对广播大型对象增加ZeroMQ回退方案

简化代码以支持管道并行

针对Ada Lovelace架构关闭CUTLASS的scaled_mm功能

在带有偏置的FP8层使用CUTLASS内核

新特性

在基于KV缓存的模型中为推测性解码启用奖励令牌

实现带有Top-1提议者的Medusa算法

实验性vLLM命令行界面，用于服务和查询OpenAI兼容服务器

其他

在CI中添加多节点支持

基准测试：新增H100套件

[CI/构建]为tgi、tensorrt-llm和lmdeploy添加夜间基准测试

构建夜间wheel包

来自 undefined 的其他软件查看全部

EagleGet 2.1.6.70 正式版 01-04 更新

Chromium 122.0.6227.0 正式版 01-04 更新

Chromium 122.0.6227.0 正式版 01-04 更新

Chromium 122.0.6227.0 正式版 01-04 更新

Signal 7.33.0 正式版 11-15 更新

Signal 7.33.0 正式版 11-15 更新

Discord 1.0.9162 正式版 09-08 更新

Discord 0.0.318 正式版 09-08 更新

Discord 0.0.67 正式版 09-08 更新

Steam 最新版正式版 06-04 更新

最近更新软件·Linux 软件更新列表

[网络] 小鱼易连 3.10.0.23021 ARM64/麒麟,鲲鹏

刚刚

[网络] 小鱼易连 3.10.0.23021 ARM64/麒麟,鲲鹏

刚刚

[网络] Brave Browser 1.73.91 ARM64

刚刚

[网络] Brave Browser 1.73.91 64位

刚刚

[应用软件] Slack 4.41.97 64位

刚刚

[开发] Cursor 0.42.5 64位

昨天 21:26

[应用软件] WPS 365 12.8.2.18605 龙芯

昨天 21:26

[应用软件] WPS 365 12.8.2.18605 ARM64

昨天 21:23

[应用软件] WPS 365 12.8.2.18605 MIPS64EL

昨天 21:23

[应用软件] WPS Office 12.1.0.17900 64位

昨天 21:21

新软件·Linux 新软件列表

[开发] Cursor 0.42.5 64位

昨天 21:26

[系统工具] VMware Workstation 17.6.1 64位

11-19

[网络] 微信 4.0.0 龙芯

11-11

[网络] 微信 4.0.0 ARM64

11-11

[网络] 微信 4.0.0 64位

11-11

[开发] Another Redis Desktop Manager 1.7.0 ARM64

11-10

[网络] 115浏览器 27.0.6.9 64位

11-09

[开发] Python 3.13 3.13.0 64位

11-07

[开发] Python 3.12 3.12.7 64位

11-07

[开发] Python 3.11 3.11.10 64位

11-07