LLM API Benchmark MCP Server 使用教程

Loouis 发布于 2025-06-26 收录于 AI IT

本文介绍了如何配置和使用llm-api-benchmark-mcp-server，一个允许LLM Agent在自然语言指令下测量LLM API吞吐性能的工具，并详细说明了在Roo Code中设置和进行并发性能测试的步骤。

LLM API 性能测试工具使用指南

Loouis 发布于 2025-02-13 收录于 AI

文章提供了 Linux 和 Windows 平台上的快速开始指南，包括下载、配置和运行工具的命令示例。

Loouis 发布于 2025-02-08 收录于 AI

本文对比了使用xformers与flash attention 2作为后端注意力机制时，vllm的性能差距。

Loouis 发布于 2024-12-03 收录于 AI IT

本文记录如何在 1C1G 的 VPS 上，使用 Ollama 运行 LLM 。

Loouis 发布于 2024-11-23 收录于 AI

本文对比了 VLLM, SGLang 和 LMDeploy 三个大模型推理引擎在短输入长输出场景下的吞吐速度，单位为输出 token/s。

Loouis 发布于 2024-10-30 收录于 IT

「本文介绍如何通过一键脚本配置 UFW 防火墙，限制 Docker 容器服务的网络访问，提升网站安全性。」