24h購物| | PChome| 登入
2005-11-07 10:47:38| 人氣2,242| 回應0 | 上一篇 | 下一篇

Unicode1補充

推薦 0 收藏 0 轉貼0 訂閱站台

(Chinese BIG5 text)

Unicode 補完計畫 2.40 Alpha3 (Win98/SE/ME/2K/XP/2K3)
。論壇網址:

http://leoboard.cpatch.org/cgi-bin/forums.cgi?forum=21


■軟體描述

  長久以來繁體中文編碼 BIG5 總是會碰到字數不足的窘境。日文假名
打不出來,還要灌櫻花輸入法什麼的,可是別人又說這個 IME 日文不一樣
,一樣都是日文假名,問題一堆,怎麼那麼複雜啊?不單是假名,就連漢
字也東缺西缺,就像咱們行政院長「游錫? 」,在緊要關頭,他老是變成
「? 」問號,真是讓人生氣。

◎ 你想自由地轉貼日文、簡體中文到 BBS 上、到 MP3 標籤裡,卻老是貼
  出一堆 ???? 問號?
◎ 你想用日文 IME 輸入日文? 你想用注音輸入法輸入簡體中文?

  這個軟體能擴充 BIG5 字碼,更相容於 Unicode。我們目前支援了
ShiftJIS、GB2312 大部分的文字,在 BBS、FTP、telnet 等眾多 ANSI 環
境下,立刻支援簡體字、假名,與許多符號。

  你只需要想像,裝了神奇的 Unicode 補完計畫以後,部分原本不屬於
BIG5 的眾多 Unicode 字元 (簡體字、日文假名......),會被加入 BIG5
標準規格裡面,這樣你就可以懂了吧?


■原理簡述

  Windows 2000/XP 之下的 BIG5 對應表,就是 c_950.nls 這個檔案。
Unicode 與 ANSI (950) (即 BIG5) 之間的轉換,都是這個檔案在負責。

  透過 Unicode 補完計畫,解決 Unicode 與 BIG5 之間的轉換,除去
亂碼與缺字的問題。缺了哪些字?目前的 Windows 給的 Big5 沒有日文假
名、沒有簡體字、少一堆人名用字。

技術細節,請參閱「論壇」及「網頁」。

測試頁位置

http://cpatch.org/witchfive/1/C.HTM
http://cpatch.org/witchfive/1/J.HTM

◆Q1 裝上這個,有什麼立刻的好處?

 1.解決──簡體中文、日文假名、日文漢字、日本國字
  1) 轉貼 BBS 時,所產生一大堆 ???? 問號問題。
  2) 正常顯示、正常列印放大縮小,不需要安裝造字。
  3) 因為他根本就不是造字!你電腦裡本來就有這些字!我們是將這
    5300 字釋放出來。

 2.游鍚「坤」,王建「火宣」,生物上的「酉每」之類的特別外字,
  原本未納入 BIG5 標準,現在全部納入。不需要再造字。提供絕大
  部分繁體字地區 (含香港/臺灣/人名等) 常見外字。

 3.可顯示、列印,甚至可在網路交換 (在 unicode 平臺, IE6/ICQ/MSN,
  即使對方未安裝)。是的,所見即所得。



 中國海的網址
 http://www.chinasea.com.tw

  平臺 (IE6/ICQ/MSN) 交換訊息
 ,不需要擔心流通問題。
所以,趕快安裝吧!


◆Q9 香港字、臺灣地名人名字與 HKSCS 的顧慮

詳閱此處

http://leoboard.cpatch.org/cgi-bin/topic.cgi?forum=21&topic=72&show=0


◆Q10 目前總對應字數達成率

 其實這樣算不太妥當,BIG5 畢竟不是 s-jis、 GB2312 或是 HKSCS。

目前達成率:

1. 只要是 GB2312 中出現的「漢字」,全面雙向對應。
2. 只要是 S-JIS 中出現的「漢字」,全面雙向對應。
3. HKSCS 中出現的「漢字」,只要它的 unicode 碼落在 U+4E00~U+9FFF 內,
全面雙向對應。
 
 ps: 這些是指 [gb2312、s-jis、hkscs] → unicode → big5 的情況。


◆Q11.如果我使用 Win98 ,又想拿 3.21 版的細明體更新系統

請先參閱末端「 Win98 已知缺字問題」,並參考這裡。

http://cpatch.org/witchfive/pastepic/newttf/newttf.html


■檔案下載

(win98/SE/ME/2000/XP/2003) Unicode 補完計畫 2.40 alpha3 1.15MB
http://search.cpatch.org/download/patchutil/unicodeaton/unicodeaton_240.exe

(win) Unicode 補完計畫 for Netscape/Mozilla/Thunderbird 2.40
http://search.cpatch.org/download/patchutil/unicodeaton/uao_mozilla_netscape_240.rar

(win) Unicode 補完計畫 for MozillaFirebird 0.7 2.40
http://search.cpatch.org/download/patchutil/unicodeaton/uao_mf_07_240.rar


■安裝方式

NSIS 2.0b4 多語言安裝格式。

1.依照螢幕指定進行。
2.重新開機。
3.如需要使用「櫻花輸入法」「日文輸入法」「MS-IME 日文輸入法」,請在
安裝時直接「勾選」即可。安裝程式會自動幫你把勾選的輸入法都掛進來。

4.Win98 部分,如果你自認用不到「簡體字」,你可以不裝「中國海字集」。
如果你要使用「簡體字」,則仍需要安裝中國海字集。 Win2k 不需要中國
海字集。此外,從 2.30 版起,不再提供「中國海字集合併安裝」版本。


請使用下面方法安裝「中國海字集」:

1.你要先去抓「中國海字集」:
http://input.cpatch.org/font/easy/cswsmin.zip

2.抓完後,把它解到你的 windows 目錄內,然後用「記事本」編輯解出來的
cswmin.reg,把此行:

"SystemDefaultEUDCFont"="c:\winfont\cswsmin.TTE"

改成:

"SystemDefaultEUDCFont"="c:\windows\cswsmin.TTE"

3.儲存後,離開「記事本」,再用「檔案總管」對 cswmin.reg 按二下執行,
匯入此登錄值。匯入完成後,系統需要重新啟動。


■回應與論壇

中文化專業論壇
http://leoboard.cpatch.org/cgi-bin/forums.cgi?forum=21


■共通的一些問題 & 解法:

0)部份問題 & 解答含有圖片內容,請至此 link 觀看完整的內容:
http://leoboard.cpatch.org/cgi-bin/topic.cgi?forum=21&topic=286&show=0

1)問:如何確認你想用的字型在 unicode 下日文假名有沒有缺字?
答:請使用 2K/XP 內附的「字元對應表」檢視你想要使用的字型,看看
在 Unicode 內碼 U+3041 有沒有字,如果 U+3041 沒有出現「あ」
的話,代表這個字型在 unicode 下缺字。

2)問:我使用 KKMan,在 bbs 下「漢字」都變成亂碼。
答:KKMan 目前版本對 Big5 內碼定義受限,它只承認傳統的 A140
~ F9FE,但 Big5 包含造字區之合法字碼範圍為 8140 ~ FEFE。
這造成 KKMan 對「造字」完全不具相容性。但補完計畫會使用到
這些造字範圍,所以那些「字」就被 KKMan 變成亂碼了。

目前此問題的解法只能等 KKMan 把此 Bug 修掉,或者請你跳槽使
用 PCMan。

3)問:日文的疊字符號「々」在文件 & BBS 中可以正常顯示 (變粗體)
但是放到檔名中就會變成「□」。
答:這是因為「從古至今」出現過的「所有版本」的「細明體」都「沒
有這個字」。

我們已經把這個字對到正確的位置,可是因為「細明體」缺字,所
以也無法顯示。

在部份環境,如 IE 或 BBS,軟體「可能」會自動找到其他字型來
補,這在 IE 下通常是有效的。BBS 這部份,就 PCMan 的測試而
言,字型集保持在「CHINESE_BIG5」狀態下,通常也會自動找到其
他字型的字來補。

但「檔案總管」就是一個不會去自動抓字型補的環境,這沒辦法。
事實上從控制台把桌面環境全部改用「日文字型」 ── 如:MS
Gothic ── 就能看的到了。不過應該沒有必要這樣做就是了。

4)問:我裝了補完計畫後,FrontPage 2003 就不能開啟了,一開就錯誤
跳出。
答:我們並不知道導致這個問題的原因為何,無論如何,下面這個方法
是由熱心的 mina 網友所提供的,如果您也有這樣的問題,請試試
這個方法 or 改用 FrontPage 2002。
http://leoboard.cpatch.org/cgi-bin/topic.cgi?forum=21&topic=329


■已知問題

1.Win98

 1)Win98 使用 ANSI (950) 字碼頁為運作核心,而非 unicode。
  Win2k 則使用 unicode 為核心。

2)Win98 下,無法直接使用「舊檔名」的檔案,舊檔名檔案需要經過「改
名」才能使用。

 3)Win98 下純「問號型式」的程式亂碼  (如簡體中文的程式, 在繁體
 中文 Win98 執行 ) & 「底線型式」的程式亂碼,則業已解決。

 4)Win98 「需要」再安裝中國海字型,以做為 ANSI 顯示, 這樣才能正
 常顯示純文字檔案。因為 Win98 內部核心為 ANSI  所以當它使用 ANSI
 字時,並不需要像 Win2K 一樣再去作「轉換」, 換 NLS 只能解決
 unicode 端的問題;Win2k 無此問題。

5)問:裝 2.30 後,所有的「資料匣」皆無法用「檔案總管」開啟。
答:此 bug 已修正,請至原 link 重新抓取,重新安裝。

6)問:裝 2.30 後,舊日文檔名都無法開啟。
答:請使用任何方法 (如下面這個) 把舊檔名改成新的,改完後就 ok。
==
1.備份此檔:c:windowssystemunicode.bin
2.將 c:Program FilesUnicode-At-OnBackupunicode.bin 覆製到
c:windowssystem 內,選「覆蓋」。
ps:此檔系統不會鎖定,請放心操作。
3.重新開機。
4.用有支援「長檔名」的壓縮程式 (建議用 rar),把你要改名的檔全部
「搬移」到壓縮檔內。
5.將 1. 備份的檔案,還原回去,並覆蓋掉
c:windowssystemunicode.bin。
6.重新開機。
7.把 4. 產生的壓縮檔內的東西解出來。

改名完成 ... 有點白痴的作法 ...
==

7)問:裝 2.30 後,所有未改名的「日文檔名」都變「空白」。
答:請安裝「中國海字集」,不過並不建議如此作。最好的方法是「改
名」,把「舊」檔名改成世界通用的「新」檔名。

8)問:裝 2.30 後,所有改過名的「日文檔名」都變「空白」。
答:你的「細明體」沒更新 or 更新失敗,請更新「細明體」。

9)問:裝 2.30 後,在裝任一補完計畫前燒錄的 cd 上,日文檔名檔案無
法讀取。
答:用下面這支程式可以把檔案讀下來,並且在轉存到 hd 時會順便「
改檔名」,but 這是「要錢的」軟體,而且要「註冊版」才能轉存
,或許對岸同胞那可找到某種 lucky number 也說不定 ... ^^;
... 建議在讀下來後,用「新檔名」重燒一張。

Arrowkey CD/DVD Diagnostic
http://www.arrowkey.com/cddvd_diagnostic.html

10)問:我依照「改名方法」只做到第三步就可以看之前的日文檔資料夾了
那還要做下面的嗎??
答:您如果不把它作完的話,那麼

1.您在某些軟體中遇到的「底線」將不會被補完,底線依舊。
2.您產生的「假名檔案」還是「舊」檔名,等於您還是在用 2.20。
3.您自己燒的含假名字元檔名 cd,自己還是不能讀取,等於您還是
在用 2.20。

總而言之,您在用 2.20 時遇到的「檔案交流問題」,如果您不把
「改名」步驟作完的話,那麼這些問題就會一直存在。也失去更新
到能解決這些問題的 2.30 的意義了。

11)問:我的系統是 cwin98 & jwin98 並存的,我的「日文檔名」全部都是
在 jwin98 下產生的,我需要依照「改名方法」改名嗎?
答:如果您的「日文檔名」是使用未安裝 unicode 補完計畫 2.30 以上
版本的 cwin98 輸入的,那 200% 肯定是要改檔名的。

如果您確定那些日文檔名都是用 jwin 輸入的,那麼只要您的日文
檔名是長檔名 (非「8.3」的) ,除非有內含一些奇怪的符號,否則
可以不用改名,在裝好 unicode 補完計畫 2.30 以上版本的
cwin98 下直接就可以使用。

至於那些因為不符長檔名規則而只有「短檔名」的檔,就要碰運氣
了,最好是在 jwin 下透過「改名」把它們變成「長檔名」的檔案
,如此一來,這些檔案就一定能在裝好 unicode 補完計畫 2.30 以
上版本的 cwin98 下直接使用。


2.win2k/xp

 無以上問題。

3.缺字問題:

 Win98   MingLiU.TTC Ver 2.10 Size: 7,067,224 bytes
 Win2k/XP MingLiU.TTC Ver 3.21 Size: 8,823,308 bytes

 限於華康與微軟的版權,我們不能直接提供更新版本的「細明體」
 字型。你可以直接取用 Win2k/XP 的字型。我只能說,無論
 是 2.10 或 3.21 ,在 unicode 標準上,漏造了不少字。
 比如圈圈 1 到圈圈 20 ,簡中/日/韓 都有提供,唯讀繁中
 「細明體」沒有。

 華康另外一套號稱 Unicode 全字集,還算齊全。也有細明體可用。

 不管如何,至少記得把 Win2k 的字型,轉移到 Win98 上使用。
 好處顯而易見,至少不缺那麼多字了。


■附錄:

1.UcFileRenamer

再次感謝「胡克儀」兄提供 2k/xp 下的改名程式!

本程式的使用法與前一版提供的差不多,每次執行完都會產生「日誌檔案」
,位置在 %USERPROFILE%RenameLogs 目錄內,「日誌檔案」的檔名是以該
「日誌檔案」產生時的時間命名,其格式如下:

yyyymmdd-hhnnss.log

yyyy -> 年,四位數
mm -> 月,二位數
dd -> 日,二位數
hh -> 時,二位數
nn -> 分,二位數
ss -> 秒,二位數

2.Unicode 補完計畫 for Linux (glibc 2.3.2)

這是由 Tiberius 網友所製作的東西,由於我們對 Linux 平台上的情況並
不清楚,請有興趣的朋友自行前往了解。相關聯結如下:

http://leoboard.cpatch.org/cgi-bin/topic.cgi?forum=21&topic=359&show=0
http://forums.gentoo.org.tw/viewtopic.php?t=41230

3.Unicode 補完計畫 for Palm

這是由 hobart & mactaris 網友自行製作的 project,目前有 CJKOS & 掌
龍中文的對應版本。相關聯結如下:

起源:PALM 上繁簡日漢字同時使用 [Unicode 補完計畫] 前篇
http://forum.palmislife.com/viewthread.php?tid=22308&fpage=12

[狂想曲] 繁簡日漢字同時使用 (Unicode 補完計畫) [CJKOS版本]
http://forum.palmislife.com/viewthread.php?tid=22580&fpage=4

[狂想曲] 繁簡日漢字同時使用 (Unicode 補完計畫) [掌龍版本]
http://forum.palmislife.com/viewthread.php?tid=22962&fpage=4


台長: Vega
人氣(2,242) | 回應(0)| 推薦 (0)| 收藏 (0)| 轉寄
全站分類: 數位資訊(科技、網路、通訊、家電)

是 (若未登入"個人新聞台帳號"則看不到回覆唷!)
* 請輸入識別碼:
請輸入圖片中算式的結果(可能為0) 
(有*為必填)
TOP
詳全文