SOLR-822: added a useful idiom to get ChatStream and make private CharReader constructor

git-svn-id: https://svn.apache.org/repos/asf/lucene/solr/trunk@758161 13f79535-47bb-0310-9956-ffa450edef68
2025-02-06 18:18:38 +00:00 · 2009-03-25 06:58:57 +00:00 · 2009-03-25 06:58:57 +00:00 · 456937a5fc
commit 456937a5fc
parent 82965b7fa1
6 changed files with 24 additions and 31 deletions
--- a/src/java/org/apache/solr/analysis/CharReader.java
+++ b/src/java/org/apache/solr/analysis/CharReader.java
@ -30,8 +30,13 @@ import java.io.Reader;
 public final class CharReader extends CharStream {

  protected Reader input;
+  
+  public static CharStream get( Reader input ){
+    return input instanceof CharStream ?
+      (CharStream)input : new CharReader(input);
+  }

-  public CharReader( Reader in ){
+  private CharReader( Reader in ){
    input = in;
  }

--- a/src/java/org/apache/solr/analysis/CharStreamAwareCJKTokenizerFactory.java
+++ b/src/java/org/apache/solr/analysis/CharStreamAwareCJKTokenizerFactory.java
@ -19,8 +19,6 @@ package org.apache.solr.analysis;

 import java.io.Reader;

-import org.apache.lucene.analysis.TokenStream;
-
 /**
 *
 * @version $Id$
@ -30,10 +28,6 @@ import org.apache.lucene.analysis.TokenStream;
 public class CharStreamAwareCJKTokenizerFactory extends BaseTokenizerFactory {

  public CharStreamAwareCJKTokenizer create(Reader input) {
-    return new CharStreamAwareCJKTokenizer(
-      input instanceof CharStream ?
-        (CharStream)input :
-        new CharReader(input)
-    );
+    return new CharStreamAwareCJKTokenizer( CharReader.get(input) );
  }
 }
--- a/src/java/org/apache/solr/analysis/CharStreamAwareWhitespaceTokenizerFactory.java
+++ b/src/java/org/apache/solr/analysis/CharStreamAwareWhitespaceTokenizerFactory.java
@ -19,8 +19,6 @@ package org.apache.solr.analysis;

 import java.io.Reader;

-import org.apache.lucene.analysis.TokenStream;
-
 /**
 *
 * @version $Id$
@ -30,10 +28,6 @@ import org.apache.lucene.analysis.TokenStream;
 public class CharStreamAwareWhitespaceTokenizerFactory extends BaseTokenizerFactory {

  public CharStreamAwareWhitespaceTokenizer create(Reader input) {
-    return new CharStreamAwareWhitespaceTokenizer(
-      input instanceof CharStream ?
-        (CharStream)input :
-        new CharReader(input)
-      );
+    return new CharStreamAwareWhitespaceTokenizer( CharReader.get(input) );
  }
 }
--- a/src/java/org/apache/solr/analysis/TokenizerChain.java
+++ b/src/java/org/apache/solr/analysis/TokenizerChain.java
@ -51,7 +51,7 @@ public class TokenizerChain extends SolrAnalyzer {

  public Reader charStream(Reader reader){
    if( charFilters != null && charFilters.length > 0 ){
-      CharStream cs = new CharReader( reader );
+      CharStream cs = CharReader.get( reader );
      for (int i=0; i<charFilters.length; i++) {
        cs = charFilters[i].create(cs);
      }
--- a/src/test/org/apache/solr/analysis/TestCharFilter.java
+++ b/src/test/org/apache/solr/analysis/TestCharFilter.java
@ -24,22 +24,22 @@ import junit.framework.TestCase;
 public class TestCharFilter extends TestCase {

  public void testCharFilter1() throws Exception {
-    CharStream cs = new CharFilter1( new CharReader( new StringReader("") ) );
+    CharStream cs = new CharFilter1( CharReader.get( new StringReader("") ) );
    assertEquals( "corrected offset is invalid", 1, cs.correctOffset( 0 ) );
  }

  public void testCharFilter2() throws Exception {
-    CharStream cs = new CharFilter2( new CharReader( new StringReader("") ) );
+    CharStream cs = new CharFilter2( CharReader.get( new StringReader("") ) );
    assertEquals( "corrected offset is invalid", 2, cs.correctOffset( 0 ) );
  }

  public void testCharFilter12() throws Exception {
-    CharStream cs = new CharFilter2( new CharFilter1( new CharReader( new StringReader("") ) ) );
+    CharStream cs = new CharFilter2( new CharFilter1( CharReader.get( new StringReader("") ) ) );
    assertEquals( "corrected offset is invalid", 3, cs.correctOffset( 0 ) );
  }

  public void testCharFilter11() throws Exception {
-    CharStream cs = new CharFilter1( new CharFilter1( new CharReader( new StringReader("") ) ) );
+    CharStream cs = new CharFilter1( new CharFilter1( CharReader.get( new StringReader("") ) ) );
    assertEquals( "corrected offset is invalid", 2, cs.correctOffset( 0 ) );
  }

--- a/src/test/org/apache/solr/analysis/TestMappingCharFilter.java
+++ b/src/test/org/apache/solr/analysis/TestMappingCharFilter.java
@ -43,7 +43,7 @@ public class TestMappingCharFilter extends BaseTokenTestCase {
  }

  public void testNothingChange() throws Exception {
-    CharStream cs = new MappingCharFilter( normMap, new CharReader( new StringReader( "x" ) ) );
+    CharStream cs = new MappingCharFilter( normMap, CharReader.get( new StringReader( "x" ) ) );
    TokenStream ts = new CharStreamAwareWhitespaceTokenizer( cs );
    List<Token> real = getTokens( ts );
    List<Token> expect = tokens( "x" );
@ -51,7 +51,7 @@ public class TestMappingCharFilter extends BaseTokenTestCase {
  }

  public void test1to1() throws Exception {
-    CharStream cs = new MappingCharFilter( normMap, new CharReader( new StringReader( "h" ) ) );
+    CharStream cs = new MappingCharFilter( normMap, CharReader.get( new StringReader( "h" ) ) );
    TokenStream ts = new CharStreamAwareWhitespaceTokenizer( cs );
    List<Token> real = getTokens( ts );
    List<Token> expect = tokens( "i" );
@ -59,7 +59,7 @@ public class TestMappingCharFilter extends BaseTokenTestCase {
  }

  public void test1to2() throws Exception {
-    CharStream cs = new MappingCharFilter( normMap, new CharReader( new StringReader( "j" ) ) );
+    CharStream cs = new MappingCharFilter( normMap, CharReader.get( new StringReader( "j" ) ) );
    TokenStream ts = new CharStreamAwareWhitespaceTokenizer( cs );
    List<Token> real = getTokens( ts );
    List<Token> expect = tokens( "jj,1,0,1" );
@ -67,7 +67,7 @@ public class TestMappingCharFilter extends BaseTokenTestCase {
  }

  public void test1to3() throws Exception {
-    CharStream cs = new MappingCharFilter( normMap, new CharReader( new StringReader( "k" ) ) );
+    CharStream cs = new MappingCharFilter( normMap, CharReader.get( new StringReader( "k" ) ) );
    TokenStream ts = new CharStreamAwareWhitespaceTokenizer( cs );
    List<Token> real = getTokens( ts );
    List<Token> expect = tokens( "kkk,1,0,1" );
@ -75,7 +75,7 @@ public class TestMappingCharFilter extends BaseTokenTestCase {
  }

  public void test2to4() throws Exception {
-    CharStream cs = new MappingCharFilter( normMap, new CharReader( new StringReader( "ll" ) ) );
+    CharStream cs = new MappingCharFilter( normMap, CharReader.get( new StringReader( "ll" ) ) );
    TokenStream ts = new CharStreamAwareWhitespaceTokenizer( cs );
    List<Token> real = getTokens( ts );
    List<Token> expect = tokens( "llll,1,0,2" );
@ -83,7 +83,7 @@ public class TestMappingCharFilter extends BaseTokenTestCase {
  }

  public void test2to1() throws Exception {
-    CharStream cs = new MappingCharFilter( normMap, new CharReader( new StringReader( "aa" ) ) );
+    CharStream cs = new MappingCharFilter( normMap, CharReader.get( new StringReader( "aa" ) ) );
    TokenStream ts = new CharStreamAwareWhitespaceTokenizer( cs );
    List<Token> real = getTokens( ts );
    List<Token> expect = tokens( "a,1,0,2" );
@ -91,7 +91,7 @@ public class TestMappingCharFilter extends BaseTokenTestCase {
  }

  public void test3to1() throws Exception {
-    CharStream cs = new MappingCharFilter( normMap, new CharReader( new StringReader( "bbb" ) ) );
+    CharStream cs = new MappingCharFilter( normMap, CharReader.get( new StringReader( "bbb" ) ) );
    TokenStream ts = new CharStreamAwareWhitespaceTokenizer( cs );
    List<Token> real = getTokens( ts );
    List<Token> expect = tokens( "b,1,0,3" );
@ -99,7 +99,7 @@ public class TestMappingCharFilter extends BaseTokenTestCase {
  }

  public void test4to2() throws Exception {
-    CharStream cs = new MappingCharFilter( normMap, new CharReader( new StringReader( "cccc" ) ) );
+    CharStream cs = new MappingCharFilter( normMap, CharReader.get( new StringReader( "cccc" ) ) );
    TokenStream ts = new CharStreamAwareWhitespaceTokenizer( cs );
    List<Token> real = getTokens( ts );
    List<Token> expect = tokens( "cc,1,0,4" );
@ -107,7 +107,7 @@ public class TestMappingCharFilter extends BaseTokenTestCase {
  }

  public void test5to0() throws Exception {
-    CharStream cs = new MappingCharFilter( normMap, new CharReader( new StringReader( "empty" ) ) );
+    CharStream cs = new MappingCharFilter( normMap, CharReader.get( new StringReader( "empty" ) ) );
    TokenStream ts = new CharStreamAwareWhitespaceTokenizer( cs );
    List<Token> real = getTokens( ts );
    assertEquals( 0, real.size() );
@ -132,7 +132,7 @@ public class TestMappingCharFilter extends BaseTokenTestCase {
  //   aa,20,22 =>    a,20,22
  //
  public void testTokenStream() throws Exception {
-    CharStream cs = new MappingCharFilter( normMap, new CharReader( new StringReader( "h i j k ll cccc bbb aa" ) ) );
+    CharStream cs = new MappingCharFilter( normMap, CharReader.get( new StringReader( "h i j k ll cccc bbb aa" ) ) );
    TokenStream ts = new CharStreamAwareWhitespaceTokenizer( cs );
    List<Token> real = getTokens( ts );
    List<Token> expect = tokens( "i,1,0,1 i,1,2,3 jj,1,4,5 kkk,1,6,7 llll,1,8,10 cc,1,11,15 b,1,16,19 a,1,20,22" );
@ -151,7 +151,7 @@ public class TestMappingCharFilter extends BaseTokenTestCase {
  //    h,8,9 => i,8,9
  public void testChained() throws Exception {
    CharStream cs = new MappingCharFilter( normMap,
-        new MappingCharFilter( normMap, new CharReader( new StringReader( "aaaa ll h" ) ) ) );
+        new MappingCharFilter( normMap, CharReader.get( new StringReader( "aaaa ll h" ) ) ) );
    TokenStream ts = new CharStreamAwareWhitespaceTokenizer( cs );
    List<Token> real = getTokens( ts );
    List<Token> expect = tokens( "a,1,0,4 llllllll,1,5,7 i,1,8,9" );