discourse-ai/lib/embeddings/vector_representations/bge_large_en.rb

# frozen_string_literal: true

module DiscourseAi
  module Embeddings
    module VectorRepresentations
      class BgeLargeEn < Base
        class << self
          def name
            "bge-large-en"
          end

          def correctly_configured?
            SiteSetting.ai_cloudflare_workers_api_token.present? ||
              DiscourseAi::Inference::HuggingFaceTextEmbeddings.configured? ||
              (
                SiteSetting.ai_embeddings_discourse_service_api_endpoint_srv.present? ||
                  SiteSetting.ai_embeddings_discourse_service_api_endpoint.present?
              )
          end

          def dependant_setting_names
            %w[
              ai_cloudflare_workers_api_token
              ai_hugging_face_tei_endpoint_srv
              ai_hugging_face_tei_endpoint
              ai_embeddings_discourse_service_api_key
              ai_embeddings_discourse_service_api_endpoint_srv
              ai_embeddings_discourse_service_api_endpoint
            ]
          end
        end

        def vector_from(text, asymetric: false)
          text = "#{asymmetric_query_prefix} #{text}" if asymetric

          if SiteSetting.ai_cloudflare_workers_api_token.present?
            DiscourseAi::Inference::CloudflareWorkersAi
              .perform!(inference_model_name, { text: text })
              .dig(:result, :data)
              .first
          elsif DiscourseAi::Inference::HuggingFaceTextEmbeddings.configured?
            truncated_text = tokenizer.truncate(text, max_sequence_length - 2)
            DiscourseAi::Inference::HuggingFaceTextEmbeddings.perform!(truncated_text).first
          elsif discourse_embeddings_endpoint.present?
            DiscourseAi::Inference::DiscourseClassifier.perform!(
              "#{discourse_embeddings_endpoint}/api/v1/classify",
              inference_model_name.split("/").last,
              text,
              SiteSetting.ai_embeddings_discourse_service_api_key,
            )
          else
            raise "No inference endpoint configured"
          end
        end

        def inference_model_name
          "baai/bge-large-en-v1.5"
        end

        def dimensions
          1024
        end

        def max_sequence_length
          512
        end

        def id
          4
        end

        def version
          1
        end

        def pg_function
          "<#>"
        end

        def pg_index_type
          "halfvec_ip_ops"
        end

        def tokenizer
          DiscourseAi::Tokenizer::BgeLargeEnTokenizer
        end

        def asymmetric_query_prefix
          "Represent this sentence for searching relevant passages:"
        end
      end
    end
  end
end
FEATURE: Bge-large-en embeddings via Cloudflare Workers AI API (#241) * FEATURE: Bge-large-en embeddings via Cloudflare Workers AI API * forgot a file * lint 2023-10-04 12:47:51 -04:00			`# frozen_string_literal: true`

			`module DiscourseAi`
			`module Embeddings`
			`module VectorRepresentations`
			`class BgeLargeEn < Base`
UX: Re-introduce embedding settings validations (#457) * Revert "Revert "UX: Validate embeddings settings (#455)" (#456)" This reverts commit 392e2e8aef7d5b0d988b3c3bc5cc19f1d83c4491. * Resstore previous default 2024-02-01 14:54:09 -05:00			`class << self`
			`def name`
			`"bge-large-en"`
			`end`

			`def correctly_configured?`
			`SiteSetting.ai_cloudflare_workers_api_token.present? \|\|`
			`DiscourseAi::Inference::HuggingFaceTextEmbeddings.configured? \|\|`
			`(`
			`SiteSetting.ai_embeddings_discourse_service_api_endpoint_srv.present? \|\|`
			`SiteSetting.ai_embeddings_discourse_service_api_endpoint.present?`
			`)`
			`end`

			`def dependant_setting_names`
			`%w[`
			`ai_cloudflare_workers_api_token`
			`ai_hugging_face_tei_endpoint_srv`
			`ai_hugging_face_tei_endpoint`
			`ai_embeddings_discourse_service_api_key`
			`ai_embeddings_discourse_service_api_endpoint_srv`
			`ai_embeddings_discourse_service_api_endpoint`
			`]`
			`end`
			`end`

FEATURE: AI Quick Semantic Search (#501) This PR adds AI semantic search to the search pop available on every page. It depends on several new and optional settings, like per post embeddings and a reranker model, so this is an experimental endeavour. --------- Co-authored-by: Rafael Silva <xfalcox@gmail.com> 2024-03-08 11:02:50 -05:00			`def vector_from(text, asymetric: false)`
			`text = "#{asymmetric_query_prefix} #{text}" if asymetric`

FEATURE: HuggingFace Text Embeddings Inference compatibility (#323) * FEATURE: HuggingFace Text Embeddings Inference compatibility * lint 2023-11-28 15:05:26 -05:00			`if SiteSetting.ai_cloudflare_workers_api_token.present?`
			`DiscourseAi::Inference::CloudflareWorkersAi`
			`.perform!(inference_model_name, { text: text })`
			`.dig(:result, :data)`
			`.first`
FEATURE: DNS SRV support for TEI (#363) 2023-12-18 11:21:21 -05:00			`elsif DiscourseAi::Inference::HuggingFaceTextEmbeddings.configured?`
FIX: Handle truncation in HyDE search (#342) 2023-12-07 08:36:56 -05:00			`truncated_text = tokenizer.truncate(text, max_sequence_length - 2)`
			`DiscourseAi::Inference::HuggingFaceTextEmbeddings.perform!(truncated_text).first`
FEATURE: Support for SRV records for Discourse services (#414) This allows admins to configure services with multiple backends using DNS SRV records. This PR also adds support for shared secret auth via headers for TEI and vLLM endpoints, so they are inline with the other ones. 2024-01-10 17:23:07 -05:00			`elsif discourse_embeddings_endpoint.present?`
FEATURE: HuggingFace Text Embeddings Inference compatibility (#323) * FEATURE: HuggingFace Text Embeddings Inference compatibility * lint 2023-11-28 15:05:26 -05:00			`DiscourseAi::Inference::DiscourseClassifier.perform!(`
FEATURE: Support for SRV records for Discourse services (#414) This allows admins to configure services with multiple backends using DNS SRV records. This PR also adds support for shared secret auth via headers for TEI and vLLM endpoints, so they are inline with the other ones. 2024-01-10 17:23:07 -05:00			`"#{discourse_embeddings_endpoint}/api/v1/classify",`
FEATURE: HuggingFace Text Embeddings Inference compatibility (#323) * FEATURE: HuggingFace Text Embeddings Inference compatibility * lint 2023-11-28 15:05:26 -05:00			`inference_model_name.split("/").last,`
			`text,`
			`SiteSetting.ai_embeddings_discourse_service_api_key,`
			`)`
			`else`
			`raise "No inference endpoint configured"`
			`end`
FEATURE: Bge-large-en embeddings via Cloudflare Workers AI API (#241) * FEATURE: Bge-large-en embeddings via Cloudflare Workers AI API * forgot a file * lint 2023-10-04 12:47:51 -04:00			`end`

			`def inference_model_name`
			`"baai/bge-large-en-v1.5"`
			`end`

			`def dimensions`
			`1024`
			`end`

			`def max_sequence_length`
			`512`
			`end`

			`def id`
			`4`
			`end`

			`def version`
			`1`
			`end`

			`def pg_function`
			`"<#>"`
			`end`

			`def pg_index_type`
DEV: Move to single table per embeddings type (#561) Also move us to halfvecs for speed and disk usage gains 2024-08-08 10:55:20 -04:00			`"halfvec_ip_ops"`
FEATURE: Bge-large-en embeddings via Cloudflare Workers AI API (#241) * FEATURE: Bge-large-en embeddings via Cloudflare Workers AI API * forgot a file * lint 2023-10-04 12:47:51 -04:00			`end`

			`def tokenizer`
			`DiscourseAi::Tokenizer::BgeLargeEnTokenizer`
			`end`
FEATURE: AI Quick Semantic Search (#501) This PR adds AI semantic search to the search pop available on every page. It depends on several new and optional settings, like per post embeddings and a reranker model, so this is an experimental endeavour. --------- Co-authored-by: Rafael Silva <xfalcox@gmail.com> 2024-03-08 11:02:50 -05:00
			`def asymmetric_query_prefix`
			`"Represent this sentence for searching relevant passages:"`
			`end`
FEATURE: Bge-large-en embeddings via Cloudflare Workers AI API (#241) * FEATURE: Bge-large-en embeddings via Cloudflare Workers AI API * forgot a file * lint 2023-10-04 12:47:51 -04:00			`end`
			`end`
			`end`
			`end`