jan/extensions at 05b9d4e9fdc59d46cc761b334331bf9a40c499c8 - jan

History

Akarshan Biswas 81d6ed3785

feat: support per-model overrides in llama.cpp load() (#5820 )

* feat: support per-model overrides in llama.cpp load()

Extend the `load()` method in the llama.cpp extension to accept optional
`overrideSettings`, allowing fine-grained per-model configuration.

This enables users to override provider-level settings such as `ctx_size`,
`chat_template`, `n_gpu_layers`, etc., when loading a specific model.

Fixes: #5818 (Feature Request - Jan v0.6.6)

Use cases enabled:
- Different context sizes per model (e.g., 4K vs 32K)
- Model-specific chat templates (ChatML, Alpaca, etc.)
- Performance tuning (threads, GPU layers)
- Better memory management per deployment

Maintains full backward compatibility with existing provider config.

* swap overrideSettings and isEmbedding argument

2025-07-21 08:59:50 +05:30

assistant-extension

chore(deps-dev): bump rimraf in /extensions/assistant-extension

2025-06-30 08:51:12 +00:00

conversational-extension

test: migrate jest to vitest

2025-07-10 21:14:21 +07:00

download-extension

feat: proxy support for the new downloader (#5795 )

2025-07-17 23:10:21 +07:00

llamacpp-extension

feat: support per-model overrides in llama.cpp load() (#5820 )