FIX: Mixtral models have system role support. (#703)

Using assistant role for system produces an error because they expect alternating roles like user/assistant/user and so on. Prompts cannot start with the assistant role.
2024-07-04 13:23:03 -03:00 · 2024-07-04 13:23:03 -03:00 · 442681a3d3
parent eab2f74b58
commit 442681a3d3
5 changed files with 16 additions and 64 deletions
--- a/lib/completions/dialects/dialect.rb
+++ b/lib/completions/dialects/dialect.rb
@ -13,7 +13,6 @@ module DiscourseAi
            [
              DiscourseAi::Completions::Dialects::ChatGpt,
              DiscourseAi::Completions::Dialects::Gemini,
-              DiscourseAi::Completions::Dialects::Mistral,
              DiscourseAi::Completions::Dialects::Claude,
              DiscourseAi::Completions::Dialects::Command,
              DiscourseAi::Completions::Dialects::OpenAiCompatible,
--- a/lib/completions/dialects/mistral.rb
+++ b/lib/completions/dialects/mistral.rb
@ -1,59 +0,0 @@
-# frozen_string_literal: true
-
-module DiscourseAi
-  module Completions
-    module Dialects
-      class Mistral < Dialect
-        class << self
-          def can_translate?(model_name)
-            %w[
-              mistralai/Mixtral-8x7B-Instruct-v0.1
-              mistralai/Mistral-7B-Instruct-v0.2
-              mistral
-            ].include?(model_name)
-          end
-        end
-
-        def tokenizer
-          llm_model&.tokenizer_class || DiscourseAi::Tokenizer::MixtralTokenizer
-        end
-
-        def tools
-          @tools ||= tools_dialect.translated_tools
-        end
-
-        def max_prompt_tokens
-          return llm_model.max_prompt_tokens if llm_model&.max_prompt_tokens
-
-          32_000
-        end
-
-        private
-
-        def system_msg(msg)
-          { role: "assistant", content: "<s>#{msg[:content]}</s>" }
-        end
-
-        def model_msg(msg)
-          { role: "assistant", content: msg[:content] }
-        end
-
-        def tool_call_msg(msg)
-          tools_dialect.from_raw_tool_call(msg)
-        end
-
-        def tool_msg(msg)
-          tools_dialect.from_raw_tool(msg)
-        end
-
-        def user_msg(msg)
-          content = +""
-          content << "#{msg[:id]}: " if msg[:id]
-          content << msg[:content]
-
-          { role: "user", content: content }
-        end
-      end
-    end
-  end
-end
--- a/spec/lib/completions/endpoints/hugging_face_spec.rb
+++ b/spec/lib/completions/endpoints/hugging_face_spec.rb
@ -94,7 +94,12 @@ RSpec.describe DiscourseAi::Completions::Endpoints::HuggingFace do
  let(:hf_mock) { HuggingFaceMock.new(endpoint) }

  let(:compliance) do
-    EndpointsCompliance.new(self, endpoint, DiscourseAi::Completions::Dialects::Mistral, user)
+    EndpointsCompliance.new(
+      self,
+      endpoint,
+      DiscourseAi::Completions::Dialects::OpenAiCompatible,
+      user,
+    )
  end

  describe "#perform_completion!" do
--- a/spec/lib/completions/endpoints/vllm_spec.rb
+++ b/spec/lib/completions/endpoints/vllm_spec.rb
@ -69,10 +69,17 @@ RSpec.describe DiscourseAi::Completions::Endpoints::Vllm do
  let(:anthropic_mock) { VllmMock.new(endpoint) }

  let(:compliance) do
-    EndpointsCompliance.new(self, endpoint, DiscourseAi::Completions::Dialects::Mistral, user)
+    EndpointsCompliance.new(
+      self,
+      endpoint,
+      DiscourseAi::Completions::Dialects::OpenAiCompatible,
+      user,
+    )
  end

-  let(:dialect) { DiscourseAi::Completions::Dialects::Mistral.new(generic_prompt, model_name) }
+  let(:dialect) do
+    DiscourseAi::Completions::Dialects::OpenAiCompatible.new(generic_prompt, model_name)
+  end
  let(:prompt) { dialect.translate }

  let(:request_body) { model.default_options.merge(messages: prompt).to_json }
--- a/spec/lib/completions/llm_spec.rb
+++ b/spec/lib/completions/llm_spec.rb
@ -3,7 +3,7 @@
 RSpec.describe DiscourseAi::Completions::Llm do
  subject(:llm) do
    described_class.new(
-      DiscourseAi::Completions::Dialects::Mistral,
+      DiscourseAi::Completions::Dialects::OpenAiCompatible,
      canned_response,
      "hugging_face:Upstage-Llama-2-*-instruct-v2",
      gateway: canned_response,