SmolVLM Inference Server

A simple FastAPI inference server for the SmolVLM-Instruct MultiModal LLM.

Env

MODEL_ID: HuggingFaceTB/SmolVLM-Instruct
DEFAULT_PROMPT: "Describe the image"

Container

podman run \
    --device nvidia.com/gpu=all \
    --shm-size 1g \
    --name smolvlm-server \
    -p 8000:8000 \
    --rm \
    -v /opt/cache/huggingface:/root/.cache/huggingface \
    metaloom/smolvlm-server:latest

Spec

{
  "prompt": "Describe the image",
  "image_url": "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/SmolVLM.png",
  "image_data": "dGVzd…"
}

Build

./build.sh

Test

./test.sh

Development

pip3 install -r requirements.txt
pip3 install flash-attn --no-build-isolation

uvicorn main:app --reload

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.gitignore		.gitignore
Containerfile		Containerfile
LICENSE.txt		LICENSE.txt
README.md		README.md
build.sh		build.sh
main.py		main.py
requirements.txt		requirements.txt
run.sh		run.sh
test.sh		test.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

SmolVLM Inference Server

Env

Container

Spec

Build

Test

Development

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

metaloom/smolvlm-inference-server

Folders and files

Latest commit

History

Repository files navigation

SmolVLM Inference Server

Env

Container

Spec

Build

Test

Development

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages