董福興台語資訊專題:如何顯示長輩圖
演講
- 注音在網路標記上的使用,是來自1999年的ruby(跟日文標字一樣)
- 2001年正式制定,注音的重點是無論直排或橫排,注音放右邊,同時調號放注音符號最末的右上。
- 微軟的日本team是第一個把ruby做出來的,同時微軟也希望可以把office的編輯可以直接轉到網頁上,但2001年無法實用化,直到2010年資策會拿了八千萬,做了電子書prefix的語法,但瀏覽器和閱讀程式不做。差點要被刪掉,後來2014年終於能夠把ruby-position: intercharacter放到右邊。可是調號的問題仍然無解,只好用字型去實驗。
- 但是台語方音符號的資料太少,清大的教授(陳柏中)說明是教育部怕赤化注音很早之前就有,諸如以前的注音「一」並不是橫排而是直排,因此沒有標準化。到了2000年,注音都還只有作為印刷需求,當時都有網路了,竟然連數位標準化都還沒開始。
- 數位標準化流程:提出需求→說明規則→寫出規範→測試回饋→實用化
- 數位典藏最早日本已經開始做注音,是日文漢字需求所做的,即為ruby-position,有ruby text與ruby base。為1999年製作的。
- 注音的最基本標準:注音放右邊,調號放注音右側。
- 微軟在IE就有加入日本的技術,有做了規範,但做一半就沒做了。
- 2010年epub電子書機html等語法機ruby-position的語法。但資策會拿了錢不去W3C而去IDPF。
- 2014年IOS9成功的在safari完成了ruby-position,將注音擺在右邊,只是調號的問題依然無解。
- 為了解決這個問題,董福興發起注音標音opentype font計畫。
- 國語注音的問題,目前似乎台羅是主要潮流,相對方音符號較少。
- 台羅和教羅得組合字元問題,目前也還沒解決。因此,在台語書寫的規則或標準化都還沒完成的情況下,誰能提供這樣的規則以供資訊界。
- 為什麼現在還會缺字?尤其台語和客語字行之有年,為什麼一直沒有編進去unicode?
- 漢字編碼過程:教育部、內政部*、其他單位→國發會(前研考會)CNS11643→**標準局、中推會→ISO/IEC JTC1、SC2 WC2 IRG→ISO10646 Unicode。
- *內政部發現如果申請姓名者是使用舊字,會請申請人寫張卡片來申請新字
- **這個過程大約三年的時間(以台灣韓國日本提出新漢字,這流程就要一年,都提出來再回去確認一個字一個字過去有沒有造過或彼此重複,又要再兩三年。)
- 會缺字的原因:海內海外1980年國科會制定中文資訊標準,1983年完成,隔一年資策會發布BIG-5編碼(13053字),1986年公布國家標準CNS11643(比資策會少了2字為13051字,因為發覺原本資策會的字有重複編輯了兩個字)。
- 基本多語種平面BMP(Basic Multilingual Plane)
- Unicode有8萬字,BIG-5有10萬字。
- 字太多了,根本不可能造完。目前只有新細明體造完
- 6763字(台灣的常用字甲表)是最小限度字體
- 13000字是一般
- 20902字是最完整
- 蘋果造字也沒有造好造滿,多數散落在Ext-A B C D E F等。然而,就算某一字體有造台語客語字,如何確保其他字型也能顯示?類似香港增補字符集。
問答時間
- Q:可以在使用台語輸入法嗎?
- A:目前Android和iOS都可以自己做輸入法,而Android在4.0版本之前所使用的字體很糟糕,日本是每個字體的技術規格不一致。另外方言符號在unicode也有編碼了
新聞翻譯時間
緬甸
參考來源(周大哥)
公視世界台