Tabby:Copilot平替

Tabby是一个自托管 AI 编码助手。 GitHub Copilot 的开源/本地替代方案。

1、主要特性

  • 自包含,不需要 DBMS 或云服务
  • 用于可视化、配置模型和 MLOps 的 Web UI。
  • OpenAPI 接口,易于与现有基础架构(例如 Cloud IDE)集成。
  • 消费级 GPU 支持(具有各种优化的 FP-16 权重加载)。

2、Tabby演示

3、Docker安装Tabby

# Create data dir and grant owner to 1000 (Tabby run as uid 1000 in container)
mkdir -p data/hf_cache && chown -R 1000 data

docker run \
  -it --rm \
  -v ./data:/data \
  -v ./data/hf_cache:/home/app/.cache/huggingface \
  -p 5000:5000 \
  -e MODEL_NAME=TabbyML/J-350M \
  tabbyml/tabby

要使用 GPU 后端 (triton) 获得更快的推理速度:

docker run \
  --gpus all \
  -it --rm \
  -v ./data:/data \
  -v ./data/hf_cache:/home/app/.cache/huggingface \
  -p 5000:5000 \
  -e MODEL_NAME=TabbyML/J-350M \
  -e MODEL_BACKEND=triton \
  tabbyml/tabby

注意:要使用 GPU,你需要安装 NVIDIA Container Toolkit。 我们还建议使用带有 CUDA 11.8 或更高版本的 NVIDIA 驱动程序。

然后,可以使用 /v1/completions 端点查询服务器:

curl -X POST http://localhost:5000/v1/completions -H 'Content-Type: application/json' --data '{
    "prompt": "def binarySearch(arr, left, right, x):\n    mid = (left +"
}'

我们还在管理面板 localhost:5000/_admin 中提供了一个交互式练习环境:


原文链接:Tabby - Github

BimAnt翻译整理,转载请标明出处