(Chinese BIG5 text)
Unicode 補完計畫 2.40 Alpha3 (Win98/SE/ME/2K/XP/2K3)
。論壇網址:
http://leoboard.cpatch.org/cgi-bin/forums.cgi?forum=21
■軟體描述
長久以來繁體中文編碼 BIG5 總是會碰到字數不足的窘境。日文假名
打不出來,還要灌櫻花輸入法什麼的,可是別人又說這個 IME 日文不一樣
,一樣都是日文假名,問題一堆,怎麼那麼複雜啊?不單是假名,就連漢
字也東缺西缺,就像咱們行政院長「游錫? 」,在緊要關頭,他老是變成
「? 」問號,真是讓人生氣。
◎ 你想自由地轉貼日文、簡體中文到 BBS 上、到 MP3 標籤裡,卻老是貼
出一堆 ???? 問號?
◎ 你想用日文 IME 輸入日文? 你想用注音輸入法輸入簡體中文?
這個軟體能擴充 BIG5 字碼,更相容於 Unicode。我們目前支援了
ShiftJIS、GB2312 大部分的文字,在 BBS、FTP、telnet 等眾多 ANSI 環
境下,立刻支援簡體字、假名,與許多符號。
你只需要想像,裝了神奇的 Unicode 補完計畫以後,部分原本不屬於
BIG5 的眾多 Unicode 字元 (簡體字、日文假名......),會被加入 BIG5
標準規格裡面,這樣你就可以懂了吧?
■原理簡述
Windows 2000/XP 之下的 BIG5 對應表,就是 c_950.nls 這個檔案。
Unicode 與 ANSI (950) (即 BIG5) 之間的轉換,都是這個檔案在負責。
透過 Unicode 補完計畫,解決 Unicode 與 BIG5 之間的轉換,除去
亂碼與缺字的問題。缺了哪些字?目前的 Windows 給的 Big5 沒有日文假
名、沒有簡體字、少一堆人名用字。
技術細節,請參閱「論壇」及「網頁」。
測試頁位置
http://cpatch.org/witchfive/1/C.HTM
http://cpatch.org/witchfive/1/J.HTM
◆Q1 裝上這個,有什麼立刻的好處?
1.解決──簡體中文、日文假名、日文漢字、日本國字
1) 轉貼 BBS 時,所產生一大堆 ???? 問號問題。
2) 正常顯示、正常列印放大縮小,不需要安裝造字。
3) 因為他根本就不是造字!你電腦裡本來就有這些字!我們是將這
5300 字釋放出來。
2.游鍚「坤」,王建「火宣」,生物上的「酉每」之類的特別外字,
原本未納入 BIG5 標準,現在全部納入。不需要再造字。提供絕大
部分繁體字地區 (含香港/臺灣/人名等) 常見外字。
3.可顯示、列印,甚至可在網路交換 (在 unicode 平臺, IE6/ICQ/MSN,
即使對方未安裝)。是的,所見即所得。
中國海的網址
http://www.chinasea.com.tw
平臺 (IE6/ICQ/MSN) 交換訊息
,不需要擔心流通問題。
所以,趕快安裝吧!
◆Q9 香港字、臺灣地名人名字與 HKSCS 的顧慮
詳閱此處
http://leoboard.cpatch.org/cgi-bin/topic.cgi?forum=21&topic=72&show=0
◆Q10 目前總對應字數達成率
其實這樣算不太妥當,BIG5 畢竟不是 s-jis、 GB2312 或是 HKSCS。
目前達成率:
1. 只要是 GB2312 中出現的「漢字」,全面雙向對應。
2. 只要是 S-JIS 中出現的「漢字」,全面雙向對應。
3. HKSCS 中出現的「漢字」,只要它的 unicode 碼落在 U+4E00~U+9FFF 內,
全面雙向對應。
ps: 這些是指 [gb2312、s-jis、hkscs] → unicode → big5 的情況。
◆Q11.如果我使用 Win98 ,又想拿 3.21 版的細明體更新系統
請先參閱末端「 Win98 已知缺字問題」,並參考這裡。
http://cpatch.org/witchfive/pastepic/newttf/newttf.html
■檔案下載
(win98/SE/ME/2000/XP/2003) Unicode 補完計畫 2.40 alpha3 1.15MB
http://search.cpatch.org/download/patchutil/unicodeaton/unicodeaton_240.exe
(win) Unicode 補完計畫 for Netscape/Mozilla/Thunderbird 2.40
http://search.cpatch.org/download/patchutil/unicodeaton/uao_mozilla_netscape_240.rar
(win) Unicode 補完計畫 for MozillaFirebird 0.7 2.40
http://search.cpatch.org/download/patchutil/unicodeaton/uao_mf_07_240.rar
■安裝方式
NSIS 2.0b4 多語言安裝格式。
1.依照螢幕指定進行。
2.重新開機。
3.如需要使用「櫻花輸入法」「日文輸入法」「MS-IME 日文輸入法」,請在
安裝時直接「勾選」即可。安裝程式會自動幫你把勾選的輸入法都掛進來。
4.Win98 部分,如果你自認用不到「簡體字」,你可以不裝「中國海字集」。
如果你要使用「簡體字」,則仍需要安裝中國海字集。 Win2k 不需要中國
海字集。此外,從 2.30 版起,不再提供「中國海字集合併安裝」版本。
請使用下面方法安裝「中國海字集」:
1.你要先去抓「中國海字集」:
http://input.cpatch.org/font/easy/cswsmin.zip
2.抓完後,把它解到你的 windows 目錄內,然後用「記事本」編輯解出來的
cswmin.reg,把此行:
"SystemDefaultEUDCFont"="c:\winfont\cswsmin.TTE"
改成:
"SystemDefaultEUDCFont"="c:\windows\cswsmin.TTE"
3.儲存後,離開「記事本」,再用「檔案總管」對 cswmin.reg 按二下執行,
匯入此登錄值。匯入完成後,系統需要重新啟動。
■回應與論壇
中文化專業論壇
http://leoboard.cpatch.org/cgi-bin/forums.cgi?forum=21
■共通的一些問題 & 解法:
0)部份問題 & 解答含有圖片內容,請至此 link 觀看完整的內容:
http://leoboard.cpatch.org/cgi-bin/topic.cgi?forum=21&topic=286&show=0
1)問:如何確認你想用的字型在 unicode 下日文假名有沒有缺字?
答:請使用 2K/XP 內附的「字元對應表」檢視你想要使用的字型,看看
在 Unicode 內碼 U+3041 有沒有字,如果 U+3041 沒有出現「あ」
的話,代表這個字型在 unicode 下缺字。
2)問:我使用 KKMan,在 bbs 下「漢字」都變成亂碼。
答:KKMan 目前版本對 Big5 內碼定義受限,它只承認傳統的 A140
~ F9FE,但 Big5 包含造字區之合法字碼範圍為 8140 ~ FEFE。
這造成 KKMan 對「造字」完全不具相容性。但補完計畫會使用到
這些造字範圍,所以那些「字」就被 KKMan 變成亂碼了。
目前此問題的解法只能等 KKMan 把此 Bug 修掉,或者請你跳槽使
用 PCMan。
3)問:日文的疊字符號「々」在文件 & BBS 中可以正常顯示 (變粗體)
但是放到檔名中就會變成「□」。
答:這是因為「從古至今」出現過的「所有版本」的「細明體」都「沒
有這個字」。
我們已經把這個字對到正確的位置,可是因為「細明體」缺字,所
以也無法顯示。
在部份環境,如 IE 或 BBS,軟體「可能」會自動找到其他字型來
補,這在 IE 下通常是有效的。BBS 這部份,就 PCMan 的測試而
言,字型集保持在「CHINESE_BIG5」狀態下,通常也會自動找到其
他字型的字來補。
但「檔案總管」就是一個不會去自動抓字型補的環境,這沒辦法。
事實上從控制台把桌面環境全部改用「日文字型」 ── 如:MS
Gothic ── 就能看的到了。不過應該沒有必要這樣做就是了。
4)問:我裝了補完計畫後,FrontPage 2003 就不能開啟了,一開就錯誤
跳出。
答:我們並不知道導致這個問題的原因為何,無論如何,下面這個方法
是由熱心的 mina 網友所提供的,如果您也有這樣的問題,請試試
這個方法 or 改用 FrontPage 2002。
http://leoboard.cpatch.org/cgi-bin/topic.cgi?forum=21&topic=329
■已知問題
1.Win98
1)Win98 使用 ANSI (950) 字碼頁為運作核心,而非 unicode。
Win2k 則使用 unicode 為核心。
2)Win98 下,無法直接使用「舊檔名」的檔案,舊檔名檔案需要經過「改
名」才能使用。
3)Win98 下純「問號型式」的程式亂碼 (如簡體中文的程式, 在繁體
中文 Win98 執行 ) & 「底線型式」的程式亂碼,則業已解決。
4)Win98 「需要」再安裝中國海字型,以做為 ANSI 顯示, 這樣才能正
常顯示純文字檔案。因為 Win98 內部核心為 ANSI 所以當它使用 ANSI
字時,並不需要像 Win2K 一樣再去作「轉換」, 換 NLS 只能解決
unicode 端的問題;Win2k 無此問題。
5)問:裝 2.30 後,所有的「資料匣」皆無法用「檔案總管」開啟。
答:此 bug 已修正,請至原 link 重新抓取,重新安裝。
6)問:裝 2.30 後,舊日文檔名都無法開啟。
答:請使用任何方法 (如下面這個) 把舊檔名改成新的,改完後就 ok。
==
1.備份此檔:c:windowssystemunicode.bin
2.將 c:Program FilesUnicode-At-OnBackupunicode.bin 覆製到
c:windowssystem 內,選「覆蓋」。
ps:此檔系統不會鎖定,請放心操作。
3.重新開機。
4.用有支援「長檔名」的壓縮程式 (建議用 rar),把你要改名的檔全部
「搬移」到壓縮檔內。
5.將 1. 備份的檔案,還原回去,並覆蓋掉
c:windowssystemunicode.bin。
6.重新開機。
7.把 4. 產生的壓縮檔內的東西解出來。
改名完成 ... 有點白痴的作法 ...
==
7)問:裝 2.30 後,所有未改名的「日文檔名」都變「空白」。
答:請安裝「中國海字集」,不過並不建議如此作。最好的方法是「改
名」,把「舊」檔名改成世界通用的「新」檔名。
8)問:裝 2.30 後,所有改過名的「日文檔名」都變「空白」。
答:你的「細明體」沒更新 or 更新失敗,請更新「細明體」。
9)問:裝 2.30 後,在裝任一補完計畫前燒錄的 cd 上,日文檔名檔案無
法讀取。
答:用下面這支程式可以把檔案讀下來,並且在轉存到 hd 時會順便「
改檔名」,but 這是「要錢的」軟體,而且要「註冊版」才能轉存
,或許對岸同胞那可找到某種 lucky number 也說不定 ... ^^;
... 建議在讀下來後,用「新檔名」重燒一張。
Arrowkey CD/DVD Diagnostic
http://www.arrowkey.com/cddvd_diagnostic.html
10)問:我依照「改名方法」只做到第三步就可以看之前的日文檔資料夾了
那還要做下面的嗎??
答:您如果不把它作完的話,那麼
1.您在某些軟體中遇到的「底線」將不會被補完,底線依舊。
2.您產生的「假名檔案」還是「舊」檔名,等於您還是在用 2.20。
3.您自己燒的含假名字元檔名 cd,自己還是不能讀取,等於您還是
在用 2.20。
總而言之,您在用 2.20 時遇到的「檔案交流問題」,如果您不把
「改名」步驟作完的話,那麼這些問題就會一直存在。也失去更新
到能解決這些問題的 2.30 的意義了。
11)問:我的系統是 cwin98 & jwin98 並存的,我的「日文檔名」全部都是
在 jwin98 下產生的,我需要依照「改名方法」改名嗎?
答:如果您的「日文檔名」是使用未安裝 unicode 補完計畫 2.30 以上
版本的 cwin98 輸入的,那 200% 肯定是要改檔名的。
如果您確定那些日文檔名都是用 jwin 輸入的,那麼只要您的日文
檔名是長檔名 (非「8.3」的) ,除非有內含一些奇怪的符號,否則
可以不用改名,在裝好 unicode 補完計畫 2.30 以上版本的
cwin98 下直接就可以使用。
至於那些因為不符長檔名規則而只有「短檔名」的檔,就要碰運氣
了,最好是在 jwin 下透過「改名」把它們變成「長檔名」的檔案
,如此一來,這些檔案就一定能在裝好 unicode 補完計畫 2.30 以
上版本的 cwin98 下直接使用。
2.win2k/xp
無以上問題。
3.缺字問題:
Win98 MingLiU.TTC Ver 2.10 Size: 7,067,224 bytes
Win2k/XP MingLiU.TTC Ver 3.21 Size: 8,823,308 bytes
限於華康與微軟的版權,我們不能直接提供更新版本的「細明體」
字型。你可以直接取用 Win2k/XP 的字型。我只能說,無論
是 2.10 或 3.21 ,在 unicode 標準上,漏造了不少字。
比如圈圈 1 到圈圈 20 ,簡中/日/韓 都有提供,唯讀繁中
「細明體」沒有。
華康另外一套號稱 Unicode 全字集,還算齊全。也有細明體可用。
不管如何,至少記得把 Win2k 的字型,轉移到 Win98 上使用。
好處顯而易見,至少不缺那麼多字了。
■附錄:
1.UcFileRenamer
再次感謝「胡克儀」兄提供 2k/xp 下的改名程式!
本程式的使用法與前一版提供的差不多,每次執行完都會產生「日誌檔案」
,位置在 %USERPROFILE%RenameLogs 目錄內,「日誌檔案」的檔名是以該
「日誌檔案」產生時的時間命名,其格式如下:
yyyymmdd-hhnnss.log
yyyy -> 年,四位數
mm -> 月,二位數
dd -> 日,二位數
hh -> 時,二位數
nn -> 分,二位數
ss -> 秒,二位數
2.Unicode 補完計畫 for Linux (glibc 2.3.2)
這是由 Tiberius 網友所製作的東西,由於我們對 Linux 平台上的情況並
不清楚,請有興趣的朋友自行前往了解。相關聯結如下:
http://leoboard.cpatch.org/cgi-bin/topic.cgi?forum=21&topic=359&show=0
http://forums.gentoo.org.tw/viewtopic.php?t=41230
3.Unicode 補完計畫 for Palm
這是由 hobart & mactaris 網友自行製作的 project,目前有 CJKOS & 掌
龍中文的對應版本。相關聯結如下:
起源:PALM 上繁簡日漢字同時使用 [Unicode 補完計畫] 前篇
http://forum.palmislife.com/viewthread.php?tid=22308&fpage=12
[狂想曲] 繁簡日漢字同時使用 (Unicode 補完計畫) [CJKOS版本]
http://forum.palmislife.com/viewthread.php?tid=22580&fpage=4
[狂想曲] 繁簡日漢字同時使用 (Unicode 補完計畫) [掌龍版本]
http://forum.palmislife.com/viewthread.php?tid=22962&fpage=4