福生无量摸鱼天尊

福生无量摸鱼天尊

vllm

2 篇文章

2025-09-26

vllm

摸鱼天尊

2025/09/26

vllm v1 源码解析 —— 单机八卡推理

单机八卡，我们按照PP + TP的方式来进行方案说明，使用的是vllm框架，主要命令和函数如下： python single_node_multi_gpu_demo.py --mode pipeline_parallel --tensor-parallel 4 --pipeline-parallel

121

0

0
vllm

摸鱼天尊

2025/09/23

vllm v1 源码解析 —— Core

一个client建立之后就会建立一个core engine，这些配置会通过QMZ IPC发送给core engine。 Core engine Architecture Worker and Executor MultiprocExecutor 在MultiprocExecutor类中，可以清晰的找

20

0

0

github项目解析
2 篇文章



vibe coding
3 篇文章



github源码解析
0 篇文章



基本操作
1 篇文章



agent
6 篇文章



code cli
1 篇文章



context engineering
2 篇文章



ACM
1 篇文章



算法
3 篇文章



算法竞赛
3 篇文章



vllm
2 篇文章



AMD算子挑战赛
2 篇文章



github
1 篇文章



inference
7 篇文章



LLM
10 篇文章



CUDA入门到入土
6 篇文章



cuda/Triton
11 篇文章



MLsys24
1 篇文章



paper
2 篇文章



blog
3 篇文章



默认分类
1 篇文章