Decodes a String with Numeric Character References : String Parser « Data Type « Java

Home
Java
1.2D Graphics GUI
2.3D
3.Advanced Graphics
4.Ant
5.Apache Common
6.Chart
7.Class
8.Collections Data Structure
9.Data Type
10.Database SQL JDBC
11.Design Pattern
12.Development Class
13.EJB3
14.Email
15.Event
16.File Input Output
17.Game
18.Generics
19.GWT
20.Hibernate
21.I18N
22.J2EE
23.J2ME
24.JavaFX
25.JDK 6
26.JDK 7
27.JNDI LDAP
28.JPA
29.JSP
30.JSTL
31.Language Basics
32.Network Protocol
33.PDF RTF
34.Reflection
35.Regular Expressions
36.Scripting
37.Security
38.Servlets
39.Spring
40.Swing Components
41.Swing JFC
42.SWT JFace Eclipse
43.Threads
44.Tiny Application
45.Velocity
46.Web Services SOA
47.XML
Java » Data Type » String Parser 




Decodes a String with Numeric Character References
      

/* ***** BEGIN LICENSE BLOCK *****
 * Version: MPL 1.1/GPL 2.0/LGPL 2.1
 *
 * The contents of this file are subject to the Mozilla Public License Version
 * 1.1 (the "License"); you may not use this file except in compliance with
 * the License. You may obtain a copy of the License at
 * http://www.mozilla.org/MPL/
 *
 * Software distributed under the License is distributed on an "AS IS" basis,
 * WITHOUT WARRANTY OF ANY KIND, either express or implied. See the License
 * for the specific language governing rights and limitations under the
 * License.
 *
 * The Original Code is part of dcm4che, an implementation of DICOM(TM) in
 * Java(TM), available at http://sourceforge.net/projects/dcm4che.
 *
 * The Initial Developer of the Original Code is
 * TIANI Medgraph AG.
 * Portions created by the Initial Developer are Copyright (C) 2003-2005
 * the Initial Developer. All Rights Reserved.
 *
 * Contributor(s):
 * Gunter Zeilinger <[email protected]>
 * Franz Willer <[email protected]>
 *
 * Alternatively, the contents of this file may be used under the terms of
 * either the GNU General Public License Version 2 or later (the "GPL"), or
 * the GNU Lesser General Public License Version 2.1 or later (the "LGPL"),
 * in which case the provisions of the GPL or the LGPL are applicable instead
 * of those above. If you wish to allow use of your version of this file only
 * under the terms of either the GPL or the LGPL, and not to allow others to
 * use your version of this file under the terms of the MPL, indicate your
 * decision by deleting the provisions above and replace them with the notice
 * and other provisions required by the GPL or the LGPL. If you do not delete
 * the provisions above, a recipient may use your version of this file under
 * the terms of any one of the MPL, the GPL or the LGPL.
 *
 * ***** END LICENSE BLOCK ***** */



/**
 *
 * Helper class to encode/decode Strings with Numeric Character References as defined in SGML.
 
 @author franz.willer
 *
 @version $Revision: 2101 $
 @since 25.11.2005
 */
public class NumericCharacterReference {

  /**
   * Decodes a String with Numeric Character References.
   * <p>
   
   @param str A NCR encoded String
   @param unknownCh, A character that is used if nnnn of &#nnnn; is not a int.
   
   @return The decoded String.
   */
   public static String decode(String str, char unknownCh) {
          StringBuffer sb = new StringBuffer();
          int i1=0;
          int i2=0;

          while(i2<str.length()) {
             i1 = str.indexOf("&#",i2);
             if (i1 == -) {
                  sb.append(str.substring(i2));
                  break ;
             }
             sb.append(str.substring(i2, i1));
             i2 = str.indexOf(";", i1);
             if (i2 == -) {
                  sb.append(str.substring(i1));
                  break ;
             }

             String tok = str.substring(i1+2, i2);
              try {
                   int radix = 10 ;
                   if (tok.charAt(0== 'x' || tok.charAt(0== 'X') {
                      radix = 16 ;
                      tok = tok.substring(1);
                   }
                   sb.append((charInteger.parseInt(tok, radix));
              catch (NumberFormatException exp) {
                   sb.append(unknownCh);
              }
              i2++ ;
          }
          return sb.toString();
  }

   /**
    * Encode a String with Numeric Character Refernces.
    * <p>
    * Formats each character < 0x20 or > 0x7f to &#nnnn; where nnnn is the char value as int.
    * <p>
    *  
    @param str The raw String
    @return The encoded String
    */
   public static String encodeString str ) {
     char[] ch = str.toCharArray();
     StringBuffer sb = new StringBuffer();
     for int i = ; i < ch.length ; i++ ) {
      if ch[i0x20 || ch[i0x7f )
        sb.append("&#").append((intch[i]).append(";");
      else
        sb.append(ch[i]);
     }
     return sb.toString();
   }
}

   
    
    
    
    
    
  














Related examples in the same category
1.Parse Comma Delimited List
2.Parse Fraction
3.Parse String to array of Strings while treating quoted values as single element
4.Parse a method signature or method call signature
5.Parse basic types
6.Returns true if the argument contains a number
7.Normalize a SQL identifer, up-casing if , and handling of (SQL 2003, section 5.2).
8.Convert a String to an int, returning zero if the conversion fails.
9.Parsing primitives from String's without creating any objects
10.Checks whether the String a valid Java number.
11.Check whether the given String has actual text.
java2s.com  | Contact Us | Privacy Policy
Copyright 2009 - 12 Demo Source and Support. All rights reserved.
All other trademarks are property of their respective owners.