fix: disable rag & stream settings from tensorrt model.json (#2351)

2024-03-14 19:04:31 +07:00 · 2024-03-14 19:04:31 +07:00 · aab8ee84af
commit aab8ee84af
parent 8120ad2a03
3 changed files with 11 additions and 7 deletions
--- a/extensions/tensorrt-llm-extension/models.json
+++ b/extensions/tensorrt-llm-extension/models.json
@ -33,10 +33,10 @@
    "description": "LlamaCorn is a refined version of TinyLlama-1.1B, optimized for conversational quality, running on consumer devices through TensorRT-LLM",
    "format": "TensorRT-LLM",
    "settings": {
-      "ctx_len": 2048
+      "ctx_len": 2048,
+      "text_model": false
    },
    "parameters": {
-      "stream": true,
      "max_tokens": 4096
    },
    "metadata": {
--- a/extensions/tensorrt-llm-extension/src/index.ts
+++ b/extensions/tensorrt-llm-extension/src/index.ts
@ -19,6 +19,7 @@ import {
  systemInformations,
  LocalOAIEngine,
  fs,
+  MessageRequest,
 } from '@janhq/core'
 import models from '../models.json'

@ -144,4 +145,10 @@ export default class TensorRTLLMExtension extends LocalOAIEngine {
    )
    return Promise.resolve()
  }
+
+  inference(data: MessageRequest): void {
+    // TensorRT LLM Extension supports streaming only
+    if (data.model) data.model.parameters.stream = true
+    super.inference(data)
+  }
 }
--- a/web/screens/Chat/ChatInput/index.tsx
+++ b/web/screens/Chat/ChatInput/index.tsx
@ -244,16 +244,13 @@ const ChatInput: React.FC = () => {
                  <li
                    className={twMerge(
                      'flex w-full cursor-pointer items-center space-x-2 px-4 py-2 text-muted-foreground hover:bg-secondary',
-                      activeThread?.assistants[0].model.settings.vision_model &&
-                        activeThread?.assistants[0].model.settings
-                          .text_model === false
+                      activeThread?.assistants[0].model.settings.text_model ===
+                        false
                        ? 'cursor-not-allowed opacity-50'
                        : 'cursor-pointer'
                    )}
                    onClick={() => {
                      if (
-                        !activeThread?.assistants[0].model.settings
-                          .vision_model ||
                        activeThread?.assistants[0].model.settings
                          .text_model !== false
                      ) {