jan/extensions/inference-nitro-extension/resources/models/gemma-2-2b/model.json

{
  "sources": [
    {
      "filename": "gemma-2-2b-it-Q4_K_M.gguf",
      "url": "https://huggingface.co/bartowski/gemma-2-2b-it-GGUF/resolve/main/gemma-2-2b-it-Q4_K_M.gguf"
    }
  ],
  "id": "gemma-2-2b-it",
  "object": "model",
  "name": "Gemma 2 2B Q4",
  "version": "1.0",
  "description": "Gemma is built from the same technology with Google's Gemini.",
  "format": "gguf",
  "settings": {
    "ctx_len": 8192,
    "prompt_template": "<bos><start_of_turn>user\n{prompt}<end_of_turn>\n<start_of_turn>model\n<end_of_turn>\n<start_of_turn>model\n",
    "llama_model_path": "gemma-2-2b-it-Q4_K_M.gguf",
    "ngl": 27
  },
  "parameters": {
    "temperature": 0.7,
    "top_p": 0.95,
    "stream": true,
    "max_tokens": 8192,
    "stop": [
      "<end_of_turn>"
    ],
    "frequency_penalty": 0,
    "presence_penalty": 0
  },
  "metadata": {
    "author": "Google",
    "tags": [
      "2B",
      "Tiny",
      "Conversational",
      "Text-generation",
      "Featured"
    ],
    "size": 1710000000
  },
  "engine": "nitro"
}