Unicode UTF-16 und JSP

From: Manfred Nebel (M_Nebel_at_T-Online.de)
Date: 05/29/04


Date: Sat, 29 May 2004 21:45:51 +0200

Hallo,

ich habe ein Problem mit dem UTF-16 Zeichensatz.
Bis dato habe ich mit:
    BufferedReader in = new BufferedReader(new
FileReader("daten.txt"),65535);
und einem StringTokenizer Zeilen aus einer ASCII-Datei gelesen, zerhackt und
per ODBC in eine DB geschaufelt.
Jetzt bekomme ich die Daten als UTF-16 Datei.
Aufgrund der Hilfe in der "comp.lang.java.databases" habe ich den
InputStreamReader genommen und folgendes zum Test zusammengestrickt.

BufferedReader in = new BufferedReader (new InputStreamReader (new
FileInputStream("daten.txt"), "UTF-16"),65535);
BufferedWriter out = new BufferedWriter (new OutputStreamWriter(new
FileOutputStream("data.txt"), "UTF-16"),65535);
while ((zeile = in.readLine()) != null) {
  System.out.println(zeile);
  out.write(zeile);
  StringTokenizer st = new StringTokenizer(zeile, "\u0009");
  int token = 0;
  while (st.hasMoreTokens()) {
   tok = st.nextToken();
   System.out.println(tok);
   out.write(tok +"\n");
  }

Es funktioniert.
Die Ausgabe auf dem Bildschirm ist zwar -wie zu erwarten- in ASCII, aber die
Ausgabe in die Datei funktioniert in UTF-16, was den Schluß zuläßt, dass
auch in die DB in UTF-16 geschrieben wird, wenn ich die Ausgabe
dementsprechend steuere.

Da ich mittels JSP auf meine Datenbank zugreife, habe ich das Problem, die
von der DB angelieferten Daten in HTML als Unicode darzustellen.
Gibt es eine elegantere Möglichkeit, als ein Array von char-Werten in der
Form &#<x%=FC%>; (FCh für "ü") auszugeben um einen String auszugeben
und wieso steht in Selfhtml nichts von 00FC bez. FC00?? sollte die Ausgabe
nicht &#<x%=FC00%>; lauten???

Danke vorab

Manfred Nebel



Relevant Pages

  • Codierungsproblem mit UTF-8
    ... dass die Daten in UTF-16 gespeichert ... mit einem Hex-Editor kann man sich die BOM-Bytes anschauen. ... ist die Datei natürlich doppelt so gross, wie sie mit UTF-8 ...
    (microsoft.public.de.inetserver.iis.asp)
  • Re: Codierungsproblem mit UTF-8
    ... > Schleifen und Datenbankabfragen einen String, ... > ist die Datei natürlich doppelt so gross, ... Das FileSystemObject kann meines Wissens nur UTF-16 oder aber 8-bit code ... Per MSXML kann man aber sicher eine UTF-8 kodierte XML-Datei erzeugen. ...
    (microsoft.public.de.inetserver.iis.asp)
  • Re: Unicode UTF-16 und JSP
    ... > ich habe ein Problem mit dem UTF-16 Zeichensatz. ... > und einem StringTokenizer Zeilen aus einer ASCII-Datei gelesen, ... > Jetzt bekomme ich die Daten als UTF-16 Datei. ... > Manfred Nebel ...
    (comp.lang.java.databases)