vLLM for Python3.11+cu118

Linux

64位

very Large Language Model 0.6.1 正式版

操作系统: Linux

最近更新: 2024年09月15日

使用许可: 开源

语言: 不支持中文

文件大小: 161.98 MB

0.6.1 版本更新说明：

模型支持

增加了对Pixtral（mistralai/Pixtral-12B-2409）的支持。

增加了对Llava-Next-Video，Qwen-VL ，Qwen2-VL 的支持。

增加了LLaVA 和 InternVL2 模型的多输入支持。

性能增强

对awq_gemm和awq_dequantize进行了内存优化，吞吐量提升2倍。

生产引擎

支持在API服务器中加载和卸载LoRA。

为批量运行器添加进度报告功能。

添加对NVIDIA ModelOpt静态缩放检查点的支持。

其他

更新Docker镜像以使用Python 3.12，以获得小幅性能提升。

增加了CODE_OF_CONDUCT.md 文件。

同类软件查看全部AI生成软件

vLLM for Python3.9+cu118 0.6.1 正式版 09-15 更新

vLLM for Python3.8+cu118 0.6.1 正式版 09-15 更新

vLLM for Python3.12+cu118 0.6.1 正式版 09-15 更新

vLLM for Python3.10+cu118 0.6.1 正式版 09-15 更新

vLLM for Python3.12 0.5.4 正式版 08-06 更新

vLLM for Python3.11 0.5.4 正式版 08-06 更新

vLLM for Python3.10 0.5.4 正式版 08-06 更新

vLLM for Python3.9 0.5.4 正式版 08-06 更新

vLLM for Python3.8 0.5.4 正式版 08-06 更新

最近更新软件 - Linux 软件更新列表

[开发] Cursor 0.42.5 64位

昨天 21:26

[应用软件] WPS 365 12.8.2.18605 龙芯

昨天 21:26

[应用软件] WPS 365 12.8.2.18605 ARM64

昨天 21:23

[应用软件] WPS 365 12.8.2.18605 MIPS64EL

昨天 21:23

[应用软件] WPS Office 12.1.0.17900 64位

昨天 21:21

[应用软件] WPS 365 12.8.2.18605 64位

昨天 21:17

[应用软件] 妙笔 2.5.8.7566 64位

昨天 07:19

[网络] Zoom 6.2.10.4983 64位

昨天 07:09

[设计] Lunacy 10.6 ARM64

昨天 06:44

[设计] Lunacy 10.6 64位

昨天 06:44

新软件 - Linux 新软件列表

[开发] Cursor 0.42.5 64位

昨天 21:26

[系统工具] VMware Workstation 17.6.1 64位

11-19

[网络] 微信 4.0.0 龙芯

11-11

[网络] 微信 4.0.0 ARM64

11-11

[网络] 微信 4.0.0 64位

11-11

[开发] Another Redis Desktop Manager 1.7.0 ARM64

11-10

[网络] 115浏览器 27.0.6.9 64位

11-09

[开发] Python 3.13 3.13.0 64位

11-07

[开发] Python 3.12 3.12.7 64位

11-07

[开发] Python 3.11 3.11.10 64位

11-07