discourse-ai/lib/embeddings/vector_representations/gemini.rb

# frozen_string_literal: true

module DiscourseAi
  module Embeddings
    module VectorRepresentations
      class Gemini < Base
        def id
          5
        end

        def version
          1
        end

        def name
          "gemini"
        end

        def dimensions
          768
        end

        def max_sequence_length
          2048
        end

        def pg_function
          "<=>"
        end

        def pg_index_type
          "vector_cosine_ops"
        end

        def vector_from(text)
          response = DiscourseAi::Inference::GeminiEmbeddings.perform!(text)
          response[:embedding][:values]
        end

        # There is no public tokenizer for Gemini, and from the ones we already ship in the plugin
        # OpenAI gets the closest results. Gemini Tokenizer results in ~10% less tokens, so it's safe
        # to use OpenAI tokenizer since it will overestimate the number of tokens.
        def tokenizer
          DiscourseAi::Tokenizer::OpenAiTokenizer
        end
      end
    end
  end
end
FEATURE: Support for Gemini Embeddings (#382) 2023-12-28 08:28:01 -05:00			`# frozen_string_literal: true`

			`module DiscourseAi`
			`module Embeddings`
			`module VectorRepresentations`
			`class Gemini < Base`
			`def id`
			`5`
			`end`

			`def version`
			`1`
			`end`

Revert "UX: Validate embeddings settings (#455)" (#456) This reverts commit 85fca89e011933a0479abaf4bf0945983fb948b8. 2024-02-01 12:06:51 -05:00			`def name`
			`"gemini"`
			`end`

FEATURE: Support for Gemini Embeddings (#382) 2023-12-28 08:28:01 -05:00			`def dimensions`
			`768`
			`end`

			`def max_sequence_length`
			`2048`
			`end`

			`def pg_function`
			`"<=>"`
			`end`

			`def pg_index_type`
			`"vector_cosine_ops"`
			`end`

			`def vector_from(text)`
			`response = DiscourseAi::Inference::GeminiEmbeddings.perform!(text)`
			`response[:embedding][:values]`
			`end`

			`# There is no public tokenizer for Gemini, and from the ones we already ship in the plugin`
			`# OpenAI gets the closest results. Gemini Tokenizer results in ~10% less tokens, so it's safe`
			`# to use OpenAI tokenizer since it will overestimate the number of tokens.`
			`def tokenizer`
			`DiscourseAi::Tokenizer::OpenAiTokenizer`
			`end`
			`end`
			`end`
			`end`
			`end`