SOLR-1410: warn if deprecated charset option is used in greek and russian analysis factories

git-svn-id: https://svn.apache.org/repos/asf/lucene/solr/trunk@812760 13f79535-47bb-0310-9956-ffa450edef68
2009-09-09 03:58:12 +00:00 · 2009-09-09 03:58:12 +00:00 · a9ac376937
parent ab5c9889b9
commit a9ac376937
6 changed files with 48 additions and 7 deletions
--- a/CHANGES.txt
+++ b/CHANGES.txt
@ -50,6 +50,14 @@ information, see SOLR-1377.
 If spellcheck.extendedResults=true, the response format for suggestions
 has changed, see SOLR-1071.

+Use of the "charset" option when configuring the following Analysis
+Factories has been deprecated and will cause a warning to be logged.
+In future versions of Solr attempting to use this option will cause an
+error.  See SOLR-1410 for more information.
+ * GreekLowerCaseFilterFactory
+ * RussianStemFilterFactory
+ * RussianLowerCaseFilterFactory
+ * RussianLetterTokenizerFactory

 Versions of Major Components
 ----------------------------
@ -660,12 +668,17 @@ Other Changes

 44. Upgraded to Lucene 2.9-dev r801856 (Mark Miller)

-45. SOLR1276: Added StatsComponentTest (Rafał Kuć, gsingers)
+45. SOLR1276: Added StatsComponentTest (Rafa<EFBFBD>Å‚ Ku<4B>Ä‡, gsingers)

 46. SOLR-1377:  The TokenizerFactory API has changed to explicitly return a Tokenizer 
    rather then a TokenStream (that may be or may not be a Tokenizer).  This change 
    is required to take advantage of the Token reuse improvements in lucene 2.9. (ryan)  
    
+47. SOLR-1410: Log a warning if the deprecated charset option is used
+    on GreekLowerCaseFilterFactory, RussianStemFilterFactory,
+    RussianLowerCaseFilterFactory or RussianLetterTokenizerFactory.
+    (Robert Muir via hossman)
+

 Build
 ----------------------
@ -683,7 +696,7 @@ Build

 Documentation
 ----------------------
- 1. SOLR-789: The javadoc of RandomSortField is not readable (Nicolas Lalevée via koji)
+ 1. SOLR-789: The javadoc of RandomSortField is not readable (Nicolas Lalev<EFBFBD>Ã<EFBFBD>©e via koji)

 2. SOLR-962: Note about null handling in ModifiableSolrParams.add javadoc
    (Kay Kay via hossman)
@ -1122,7 +1135,7 @@ Bug Fixes
 9. SOLR-294: Logging of elapsed time broken on Solaris because the date command
    there does not support the %s output format.  (bill)

-10. SOLR-136: Snappuller - "date -d" and locales don't mix.  (Jürgen Hermann via    bill)
+10. SOLR-136: Snappuller - "date -d" and locales don't mix.  (J<EFBFBD>Ã<EFBFBD>¼rgen Hermann via    bill)

 11. SOLR-333: Changed distributiondump.jsp to use Solr HOME instead of CWD to set path.
 
--- a/src/java/org/apache/solr/analysis/GreekLowerCaseFilterFactory.java
+++ b/src/java/org/apache/solr/analysis/GreekLowerCaseFilterFactory.java
@ -27,9 +27,12 @@ import org.apache.lucene.analysis.el.GreekCharsets;
 import org.apache.lucene.analysis.el.GreekLowerCaseFilter;
 import org.apache.solr.common.SolrException;
 import org.apache.solr.common.SolrException.ErrorCode;
+import org.slf4j.Logger;
+import org.slf4j.LoggerFactory;

 public class GreekLowerCaseFilterFactory extends BaseTokenFilterFactory 
 {
+  @Deprecated
  private static Map<String,char[]> CHARSETS = new HashMap<String,char[]>();
  static {
    CHARSETS.put("UnicodeGreek",GreekCharsets.UnicodeGreek);
@ -39,12 +42,23 @@ public class GreekLowerCaseFilterFactory extends BaseTokenFilterFactory
  
  private char[] charset = GreekCharsets.UnicodeGreek;

+  private static Logger logger = LoggerFactory.getLogger(GreekLowerCaseFilterFactory.class);
  
  @Override
  public void init(Map<String, String> args) {
    super.init(args);
    String charsetName = args.get("charset");
-    if (null != charsetName) charset = CHARSETS.get(charsetName);
+    if (null != charsetName) {
+      charset = CHARSETS.get(charsetName);
+      if (charset.equals(GreekCharsets.UnicodeGreek))
+        logger.warn("Specifying UnicodeGreek is no longer required (default).  "
+            + "Use of the charset parameter will cause an error in Solr 1.5");
+      else
+        logger.warn("Support for this custom encoding is deprecated.  "
+            + "Use of the charset parameter will cause an error in Solr 1.5");
+    } else {
+      charset = GreekCharsets.UnicodeGreek; /* default to unicode */
+    }
    if (null == charset) {
      throw new SolrException(ErrorCode.SERVER_ERROR,
                              "Don't understand charset: " + charsetName);
--- a/src/java/org/apache/solr/analysis/RussianCommon.java
+++ b/src/java/org/apache/solr/analysis/RussianCommon.java
@ -23,8 +23,14 @@ import java.util.HashMap;
 import org.apache.solr.core.SolrConfig;
 import org.apache.solr.common.SolrException;
 import org.apache.solr.common.SolrException.ErrorCode;
+import org.slf4j.Logger;
+import org.slf4j.LoggerFactory;
+
+@Deprecated
 public class RussianCommon {
  
+  private static Logger logger = LoggerFactory.getLogger(RussianCommon.class);
+  
  private static Map<String,char[]> CHARSETS = new HashMap<String,char[]>();
  static {
    CHARSETS.put("UnicodeRussian",RussianCharsets.UnicodeRussian);
@ -37,6 +43,14 @@ public class RussianCommon {
      return RussianCharsets.UnicodeRussian;

    char[] charset = CHARSETS.get(name);
+    
+    if (charset.equals(RussianCharsets.UnicodeRussian))
+      logger.warn("Specifying UnicodeRussian is no longer required (default).  "
+          + "Use of the charset parameter will cause an error in Solr 1.5");
+    else
+      logger.warn("Support for this custom encoding is deprecated.  "
+          + "Use of the charset parameter will cause an error in Solr 1.5");
+    
    if (null == charset) {
      throw new SolrException(ErrorCode.SERVER_ERROR,
                              "Don't understand charset: " + name);
--- a/src/java/org/apache/solr/analysis/RussianLetterTokenizerFactory.java
+++ b/src/java/org/apache/solr/analysis/RussianLetterTokenizerFactory.java
@ -23,7 +23,7 @@ import java.util.Map;
 import org.apache.lucene.analysis.ru.RussianLetterTokenizer;

 public class RussianLetterTokenizerFactory extends BaseTokenizerFactory {
-  
+  @Deprecated
  private char[] charset;
  
  @Override
--- a/src/java/org/apache/solr/analysis/RussianLowerCaseFilterFactory.java
+++ b/src/java/org/apache/solr/analysis/RussianLowerCaseFilterFactory.java
@ -23,7 +23,7 @@ import org.apache.lucene.analysis.TokenStream;
 import org.apache.lucene.analysis.ru.RussianLowerCaseFilter;

 public class RussianLowerCaseFilterFactory extends BaseTokenFilterFactory {
-  
+  @Deprecated
  private char[] charset;
  
  @Override
--- a/src/java/org/apache/solr/analysis/RussianStemFilterFactory.java
+++ b/src/java/org/apache/solr/analysis/RussianStemFilterFactory.java
@ -25,7 +25,7 @@ import org.apache.lucene.analysis.TokenStream;
 import org.apache.lucene.analysis.ru.RussianStemFilter;

 public class RussianStemFilterFactory extends BaseTokenFilterFactory {
-  
+  @Deprecated
  private char[] charset;
  
  public void init(Map<String, String> args) {