Fix bug #55733 - XWPFWordExtractor need

s to handle .docx files with neither headers nor footers git-svn-id: https://svn.apache.org/repos/asf/poi/trunk@1538044 13f79535-47bb-0310-9956-ffa450edef68
2013-11-01 19:43:46 +00:00 · 2013-11-01 19:43:46 +00:00 · 2881930651
parent 374ea84aa6
commit 2881930651
4 changed files with 32 additions and 20 deletions
--- a/src/ooxml/java/org/apache/poi/xwpf/extractor/XWPFWordExtractor.java
+++ b/src/ooxml/java/org/apache/poi/xwpf/extractor/XWPFWordExtractor.java
@ -17,7 +17,6 @@
 package org.apache.poi.xwpf.extractor;

 import java.io.IOException;
-import java.util.Iterator;
 import java.util.List;

 import org.apache.poi.POIXMLDocument;
@ -34,7 +33,6 @@ import org.apache.poi.xwpf.usermodel.XWPFHyperlink;
 import org.apache.poi.xwpf.usermodel.XWPFHyperlinkRun;
 import org.apache.poi.xwpf.usermodel.XWPFParagraph;
 import org.apache.poi.xwpf.usermodel.XWPFRelation;
-import org.apache.poi.xwpf.usermodel.XWPFRun;
 import org.apache.poi.xwpf.usermodel.XWPFSDT;
 import org.apache.poi.xwpf.usermodel.XWPFTable;
 import org.apache.poi.xwpf.usermodel.XWPFTableCell;
@ -92,7 +90,7 @@ public class XWPFWordExtractor extends POIXMLTextExtractor {
        // Start out with all headers
        extractHeaders(text, hfPolicy);

-		// body elements
+        // Process all body elements
        for (IBodyElement e : document.getBodyElements()){
        	appendBodyElementText(text, e);
        	text.append('\n');
@ -178,6 +176,8 @@ public class XWPFWordExtractor extends POIXMLTextExtractor {
   }
   
 	private void extractFooters(StringBuffer text, XWPFHeaderFooterPolicy hfPolicy) {
+		if (hfPolicy == null) return;
+		
 		if(hfPolicy.getFirstPageFooter() != null) {
 			text.append( hfPolicy.getFirstPageFooter().getText() );
 		}
@ -190,6 +190,8 @@ public class XWPFWordExtractor extends POIXMLTextExtractor {
 	}

 	private void extractHeaders(StringBuffer text, XWPFHeaderFooterPolicy hfPolicy) {
+		if (hfPolicy == null) return;
+		
 		if(hfPolicy.getFirstPageHeader() != null) {
 			text.append( hfPolicy.getFirstPageHeader().getText() );
 		}
--- a/src/ooxml/testcases/org/apache/poi/xwpf/extractor/TestXWPFWordExtractor.java
+++ b/src/ooxml/testcases/org/apache/poi/xwpf/extractor/TestXWPFWordExtractor.java
@ -351,5 +351,16 @@ public class TestXWPFWordExtractor extends TestCase {
            assertEquals("controlled content loading-"+targ, true, hit);
        }
        assertEquals("controlled content loading hit count", targs.length, hits);
+        ex.close();
+    }
+
+    /** No Header or Footer in document */
+    public void testBug55733() throws Exception {
+        XWPFDocument doc = XWPFTestDataSamples.openSampleDocument("55733.docx");
+    	XWPFWordExtractor extractor = new XWPFWordExtractor(doc);
+
+        // Check it gives text without error
+        extractor.getText();
+        extractor.close();
    }
 }
--- a/src/scratchpad/testcases/org/apache/poi/hwpf/extractor/TestWordExtractorBugs.java
+++ b/src/scratchpad/testcases/org/apache/poi/hwpf/extractor/TestWordExtractorBugs.java
@ -45,5 +45,4 @@ public final class TestWordExtractorBugs extends TestCase {
        // Check it gives text without error
        extractor.getText();
    }
-    
 }
--- a/test-data/document/55733.docx
+++ b/test-data/document/55733.docx