jan/extensions/inference-nitro-extension/resources/models/stable-zephyr-3b/model.json

{
    "sources": [
      {
        "url": "https://huggingface.co/TheBloke/stablelm-zephyr-3b-GGUF/resolve/main/stablelm-zephyr-3b.Q8_0.gguf",
        "filename": "stablelm-zephyr-3b.Q8_0.gguf"
      }
    ],
    "id": "stable-zephyr-3b",
    "object": "model",
    "name": "Stable Zephyr 3B Q8",
    "version": "1.0",
    "description": "StableLM Zephyr 3B is a best model for low-end machine.",
    "format": "gguf",
    "settings": {
      "ctx_len": 4096,
      "prompt_template": "<|user|>\n{prompt}<|endoftext|>\n<|assistant|>",
      "llama_model_path": "stablelm-zephyr-3b.Q8_0.gguf",
      "ngl": 32
    },
    "parameters": {
      "temperature": 0.7,
      "top_p": 0.95,
      "stream": true,
      "max_tokens": 4096,
      "stop": ["<|endoftext|>"],
      "frequency_penalty": 0,
      "presence_penalty": 0
    },
    "metadata": {
      "author": "StabilityAI",
      "tags": ["3B", "Finetuned", "Tiny"],
      "size": 2970000000
    },
    "engine": "nitro"
  }