仕事に関係する情報のメモ 技術、プロジェクト管理など

木曜日, 6月 11, 2009

UTF-8

ASCII文字と互換性を持たせるために、ASCIIと同じ部分は1バイト、その他の部分を2~6バイトで符号化する。

1バイト目の上位ビットの1の個数でその文字のバイト数が判るようになっている。また、2バイト目以降は10で始まり、1バイト目と2バイト目以降では値の範囲が重ならないので、文字境界を確実に判定できる。


0xxxxxxx (00-7f) 7bit
110yyyyx 10xxxxxx (c0-df)(80-bf) 11bit
1110yyyy 10yxxxxx 10xxxxxx (e0-ef)(80-bf)(80-bf) 16bit
11110yyy 10yyxxxx 10xxxxxx 10xxxxxx (f0-f7)(80-bf)(80-bf)(80-bf) 21bit

火曜日, 6月 02, 2009

Linux tomcat5.5 dbcp 接続

Linux tomcat5.5でrpmインストールした場合、
naming-factory-dbcp.jar
が配置されず、以下のようなエラーが出る。

org.apache.tomcat.dbcp.dbcp.BasicDataSourceFactory ClassNotFoundException

windows版の5.5から、naming-factory-dbcp.jar
を持っていき、配置したらOKとなった