![]() |
| | #1 |
| 論壇站長 註冊日期: 2004-10-06 住址: http://www.twvbb.com
文章: 1,588
|
簡單來說(以下全部是經驗談) Big5 有幾個特色 1. 每個中文字使用 2 bytes 2. 因為制定者腦殘,用到了控制碼,所以許多程式與軟體都會有許、蓋、功這類中文字的沖碼問題 3. 延伸字集中,有簡體字但是沒有定義日文字 UTF-8 則有以下特色 1. 採用變動大小,中文字使用 3 bytes,英文則維持 1 byte 因此若轉碼後,資料庫整體會變成 1.5 倍大,200MB(Big5) -> 300MB(UTF-8) 2. 支援所有語言文字,還有一些怪怪圖形 ![]() 3. 簡體與正體中文重複字只定義一次,例如說,簡體的"山",跟正體的"山",是同一個 UTF-8 編碼 至於怎麼轉碼呢....php 只要使用 iconv 函數即可 安裝方式 http://www.twvbb.com/vbb/thread/30/299/ 使用方式 http://tw.php.net/iconv 我在 ptt 上回覆的就順便轉過來,往後在慢慢補齊
__________________ vBulletin 問題請在論壇討論,請勿私下詢問我,以利後人參考 |
| | |
| | #2 |
| 論壇站長 註冊日期: 2004-10-06 住址: http://www.twvbb.com
文章: 1,588
|
補充幾篇不錯的文章 談談Unicode編碼,簡要解釋UCS、UTF、BMP、BOM等名詞 http://fmddlmyy.home4u.china.com/text6.html 基本多文種平面 http://zh.wikipedia.org/wiki/%E5%9F%...B9%B3%E9%9D%A2 通用字元集 http://zh.wikipedia.org/wiki/ISO_10646 中日韓統一表意文字 http://zh.wikipedia.org/wiki/%E4%B8%...96%87%E5%AD%97 Unicode http://zh.wikipedia.org/wiki/Unicode UTF-8 http://zh.wikipedia.org/wiki/UTF-8 UTF-16 http://zh.wikipedia.org/wiki/UTF-16 順便做個筆記 準備來補完這篇
__________________ vBulletin 問題請在論壇討論,請勿私下詢問我,以利後人參考 |
| | |