FIX: Truncate content for sentiment/toxicity classification (#431)

2024-01-17 15:17:58 -03:00 · 2024-01-17 15:17:58 -03:00 · c70f43f130
parent 5bdf3dc1f4
commit c70f43f130
2 changed files with 19 additions and 11 deletions
--- a/lib/sentiment/sentiment_classification.rb
+++ b/lib/sentiment/sentiment_classification.rb
@ -48,11 +48,14 @@ module DiscourseAi
      end
      def content_of(target_to_classify)
-        if target_to_classify.post_number == 1
+        content =
-          "#{target_to_classify.topic.title}\n#{target_to_classify.raw}"
+          if target_to_classify.post_number == 1
-        else
+            "#{target_to_classify.topic.title}\n#{target_to_classify.raw}"
-          target_to_classify.raw
+          else
-        end
+            target_to_classify.raw
          end
        Tokenizer::BertTokenizer.truncate(content, 512)
      end
      def endpoint
--- a/lib/toxicity/toxicity_classification.rb
+++ b/lib/toxicity/toxicity_classification.rb
@ -59,13 +59,18 @@ module DiscourseAi
      end
      def content_of(target_to_classify)
-        return target_to_classify.message if target_to_classify.is_a?(Chat::Message)
+        content =
          if target_to_classify.is_a?(Chat::Message)
            target_to_classify.message
          else
            if target_to_classify.post_number == 1
              "#{target_to_classify.topic.title}\n#{target_to_classify.raw}"
            else
              target_to_classify.raw
            end
          end
-        if target_to_classify.post_number == 1
+        Tokenizer::BertTokenizer.truncate(content, 512)
          "#{target_to_classify.topic.title}\n#{target_to_classify.raw}"
        else
          target_to_classify.raw
        end
      end
      def endpoint