動態組字 專案 (IDS)
TODO
extension:參考Extension:Math 做成一套後台Web服務,mw獲得指令(<id>包裹內容)後,通過在PHP取得WebServiceClient上傳指令,獲得圖片,並且基於指令為鍵將圖片在mw本地快取,不暴露後台服務。也能利用基金會的圖片儲存集群。
- 幫助基金會工程師review han3_ji7_tsoo1_kian3原碼的安全性:
- 釐清核心原碼的安全性
- 關鍵程式碼的函式、變數英譯註釋
- 向社群解釋以及招募維護團隊
- 團隊任務是維護ids extension與協助han3_ji7_tsoo1_kian3 server的改良
- 工作目標的方針是盡可能照實呈現書上有過的缺字
- 舉報server呈現錯誤的缺字,協助server改良
- 會java程式語言的人,能對上游han3_ji7_tsoo1_kian3提出patch改良
- extension:<ids>要提供字體變更、大小變更語法
- server需要更多字體實作(例如思源黑體)
- 中研院缺字部件還沒有推進unicode的,需要搜查整理出來,請相關組織或人物推進unicode(很少了,應該是10多個左右)
11/12組字專案的技術說明整理
11/12經過討論以後,有以下結論:
原來設想的在extension裡面把組字引擎隱藏在後端,經探討反而會有更大的問題。
- 安全問題:承宏的han3_ji7_tsoo1_kian3(我們採用的組字引擎server)提供的web API,接到指令只會丟描繪png或者svg圖而回傳(我們extension目前只使用png),不會有其他硬體I/O。換句話說,這樣一來,這個服務就會像是commons.wikipedia.com對外的一種特殊服務
- 為了安全,得在extension那邊實作出類似goo.gl一類的短轉址服務,轉包一層外加額外的資料庫存取
- 效率問題:丞宏回答如果在他那邊實作快取也不需要,而是靠Proxy作即可,而維基相關計畫的網站入口 就是一台Varnish Proxy ,所以不用擔心。
正一確實考量過以後,確認的確如此。
動態組字開發歷史簡介
由剎那定下跟unicode相容的路線,這個開發路線,到現在是第三代,第一代是剎那工作室的葉健欣開發的,當時是跟中研院謝清俊教授、莊德明研究員合作漢字構型資料庫。第二代,是我做出開源版本的函式庫與示範程式,第三代,是薛丞宏現在的「漢字組建」引擎,三個程式都是獨立的code
理論上,還有第零代,是葉健欣曾任職的朱邦復工作室,是這種概念的起源,差別是朱邦復的版本,是自己的編碼,不是unicode的。
需要人才
先求表達缺字,再求美觀
組字引擎的文件需要將中文文件翻譯為英文( Announce、Readme)
動態組字技術
組字server:
java語言,要處理社群的希望的新功能請求(還蠻多的),跟原作者薛承宏合作,以及加強可讀性(含英文說明)、通用server的自動編譯改寫(目前我緩步進行中)done
測試中版本-
https://tools.wmflabs.org/idsgen/%E2%BF%B0%EF%93%A7%E2%BF%B1%E4%BB%BB%E5%BF%83.png?%E5%AD%97%E9%AB%94=%E5%AE%8B%E9%AB%94
組字 extension:
php語言,裝在維基網站上,向組字server發訊息顯示缺字圖,抓回維基百科上
這就是本週稍早,申請到的測試wiki在示範的
http://ids-testing.wmflabs.org/
測試網站
正一申請基金會的兩台測試server(組字server跟 測試wiki server),目前是正一在控制、佈署
推廣給潛在的技術社群
例如Mozilla的技術社群、google等,他們可能可以對動態組字有更好的實作,例如webfont技術,瀏覽器的動態組字呈像插件等等,成為我們的技術夥伴
動態組字對數位漢字文化世界的影響
- 所有使用漢字的維基計畫都蒙受其利
- 出了維基,在古籍文化面產生的變革:
- 原來只有中文或佛典學術機構內的專門軟體可以解決缺字問題,現在等於是對社會開放這技術,像g0v萌典那邊常參與的道教協會的朋友等較缺乏學術單位支持的,現在也能解決缺字問題
- 古代減字譜、樂譜
- 新文化應用:g0v或者mozilla的朋友就很明顯,甚至有人用這個概念快速應用到時事上
- 可能導致推動缺字技術的全面解決方案:包含桌機、手機系統內,mozilla社群那邊有人提出這企圖(魏藥)。
動態組字對其他文化的影響
需要2D組字的其他文字(例如古埃及文、古瑪雅文等),都有幫助
資金籌措與商業可能
- 做合字的周邊商品,參見urban dictionary 網站
- 提供道教協會或某些想做古文字線上字型的站台等做web font支援,收取服務費。
- 得到google、Mozilla、文化部、科技部等單位的贊助,以及合作(這個需要討論策略)
相關文件
- 一份個人心目中期待的開放中文字型改善計畫提案書
- 自由軟體正體中文化 (L10N)工作指引
- 20161116起相關討論在中文維基 irc / tg 聊天室( https://telegram.me/wikipedia_zh )