fix: wrong engine handling (#2363)

2024-03-14 23:59:42 +07:00 · 2024-03-14 23:59:42 +07:00 · 58e12f35c9
commit 58e12f35c9
parent e40d0481b7
1 changed files with 3 additions and 1 deletions
--- a/extensions/tensorrt-llm-extension/src/index.ts
+++ b/extensions/tensorrt-llm-extension/src/index.ts
@ -129,6 +129,8 @@ export default class TensorRTLLMExtension extends LocalOAIEngine {
  }

  async onModelInit(model: Model): Promise<void> {
+    if (model.engine !== this.provider) return
+
    if ((await this.installationState()) === 'Installed')
      return super.onModelInit(model)
    else {
@ -138,7 +140,6 @@ export default class TensorRTLLMExtension extends LocalOAIEngine {
          message: 'EXTENSION_IS_NOT_INSTALLED::TensorRT-LLM extension',
        },
      })
-      return
    }
  }

@ -162,6 +163,7 @@ export default class TensorRTLLMExtension extends LocalOAIEngine {
  }

  inference(data: MessageRequest): void {
+    if (!this.isRunning) return
    // TensorRT LLM Extension supports streaming only
    if (data.model) data.model.parameters.stream = true
    super.inference(data)