第二千五百七十九章 萬事具備,恰遇東風
光有這個協議是不夠的,要將之推廣開,就需要一個非常適合的應用場景。
嵌入個人作業系統,是最好的選擇,於是就產生了瀚文大字庫,這個字庫以其優異卓越的性能,可以分級使用的靈活配置,能夠滿足從日常家用電腦到專業級圖書出版社的使用,得到了微軟的青睞。
再往上一層就是擴展應用,這一層的產品包括了給各種專業設備如印表機,彩印機,排版系統,通信設備所使用的軟硬體升級套餐。
硬體中包括了字庫晶片,漢卡;軟體里包含了輸入法,編輯軟體,漢化工具包等等。
如果不是一開始周至就將和漢字編碼相關的這一系列問題予以了全局性的考慮,麥明東可以想像得到,哪怕以瀚文字庫如此優越的性能,在推廣當中也會遇到諸多的麻煩,每一道坎,都可能讓瀚文大字庫最後和許多所謂「科研成果」一般,成為束之高閣的的東西。
要按照「正常」的方式來,恐怕直到現在瀚文字庫都還會處在艱難的推廣階段,不可能成為全世界默認的惟一通用字庫軟體。
「亞洲區統一編碼現在被證實命名為UTF-8編碼,命名大會下周會在首都召開,由UNICODE組織在會後對外證實公布。」麥明東說道:「這是中國對世界信息產業做出的一項巨大貢獻,也是中國在信息學層面將傳統文字融入到資訊時代的最完美,最成功的案例,你的貢獻很大,這一次可不能缺席了。」
「他們是要和信息交換標準委員會打擂台,故意造出這麼大的聲勢,我就不去給他們助興了吧?」周至笑道。
「我其實一直有一個問題。」麥明東想了一下,還是決定問出來:「你在搞瀚文大字庫的時候,就已經考慮好了後來基於UNIX系統研發出來的COiniCOS了?」
UTF是Unicode Tranation Format的縮寫,意為Unicode轉換格式。
8代表的是八比特,也就是四個字節,意味著UNICODE字符由4個字節表示。因為UTF是一種變長的編碼,因此這個8其實指的是編碼規則的比特上限,其實大多數的UNICODE字符用不到這麼長的字節數,
傳統的信息系統基本採用的是最知名可能要數被稱為ASCII的7位字符集。它是American Standard Code for Information Interchange的縮寫,意為北美信息交換標準碼,本身是米國英語通信所設計的。
因為是針對英語設計的,別說處理漢字,就連處理帶有音調標號的幾種歐洲文字時都就會出現問題。
為了表示更多字符,人們打起了校驗碼的主意,讓最高位也用作字符表示,這就是ASCII碼擴字符集。
一種擴展是把值為128-255之間的字符用於畫圖和畫線,以及一些特殊的歐洲字符。另一種擴展是把位於128-255之間的字符用於拉丁字母表中特殊語言字符。
隨著信息技術在全世界各個國家的發展,這種修修補補的方法,其局限性就徹底暴露了出來。
作為脫離傳統打字機的後生事物,UTF-8代表著信息技術新時代,即網絡時代和無線通信時代的先進編碼。
除了字符數量可以幾乎不受約束地編制之外,它還可以通過屏蔽位和移位操作快速讀寫,也可以使排序變得更加容易。
但是UTF-8也不是一點問題都沒有,比如目前的部分系統如ISO 2022,4873,6429和8859,會將UTF-8超過百分之五十使用率的碼值100xxxxx解讀成C1控制碼,導致被過濾或者解讀出錯。
但是這個問題很好解決,就是通過一個字節對UTF-8進行修正,因而構成UTF-8修正碼。
隨著這些系統被新興的系統取代,這個問題就和即將到來的「千年蟲」問題一樣,變得不復存在。
但是這個問題在UNIX系統,以及基於UNIX系統發展起來的linux系統,四葉草COiniCOS系統中並不存在,因為UNIX系統一開始就是基於UNICODE設計的。
隨著四葉草的系統在超算系統, java環境系統,各類伺服器-終端型辦公系統等應用場景中攻城略地,語言環境的獨特優勢一步步得以持續的凸顯。
讓其餘開發商頭疼的系統字符兼容性問題,在四葉草這裡壓根不存在,大家可以將力量集中在其餘研發方向上。
但是麥明東之所以會問出這個問題,是因為周至在搞瀚文資料庫的時候,UNICODE字符集對於全世界信息產業的影響都還沒有完全體現出來,即便是到了現在,ASCII字符集都還是西方社會的主流,而最近兩三年才出現的各大廠軟體系統爭相兼容UNICODE字符集的現象,主要還是因為捆綁在英文地區外的市場上銷售作業系統的需要帶來的。
如果沒有周至後續引導四葉草集團對開發系統的研究,瀚文字庫最多就是給WINDOWS,蘋果OS錦上添花的產物,繞不過別人的智慧財產權壁壘,就只有靠別人從手指縫裡漏一點湯水來飽足。
然而結果卻是四葉草以開放智慧財產權的UNIX系統為基礎,利用自己替微軟研發VC模塊時練就的本領,將字符指令型的UNIX系統轉化為圖形界面的COiniCOiniCOS指令集上的瀚文漢卡,自身賺了個盆滿缽滿不說,還完全滿足了國內「縫縫補補又三年」的傳統,實現了國內原有信息處理設備的升級。
這項成功又為四葉草持續進行作業系統與工控通用平台指令集的研發打開了光明的前景。
最近重溫四葉草集團的發展歷程,麥明東發現了一個恐怖的事實,那就是四葉草一路走來,技術積累和產品研發不但相輔相成,而且發展線路重迭性極大,發展方向極度精準。
當別的大廠因為對技術路線沒有足夠把握,不得不大範圍圍獵智慧財產權的時候,四葉草以自己非常精準的眼光,將火力集中起來,迅速從競爭當中脫穎而出,轉眼就成了所在行業的大擘。
這已經不是兩條腿交替著走路了,簡直是在飛奔。
放眼全世界,這樣的人也是鳳毛麟角。
對這個問題,周至卻早就想好了搪塞方案:「至少到目前為止,我算是比較幸運的一方吧。」
說完拍了拍麥小苗的小手:「最大的幸運,當然就是遇到小苗了。要真是一切都有計劃,那我和小苗的相遇,不也成了計劃的一部分?」
麥明東果然就樂了,的確,要是沒有麥小苗歸國這一茬,周至的事業多半就止步在MiniCos通用平台和存儲晶片上了,四葉草COS不會進化成非線性超算矩陣的基礎操作平台,而存儲晶片也不會進化成算力卡。
哪怕是前期四葉草已經完成基準版MiniCOS,工控晶片,圖資料庫引擎,幾款「學習模式」工程軟體的技術積累,要達到今天這樣的成就和規模,至少在短期內絕不可能。
問題就在於在那個階段,周至的一切努力,似乎就在為了麥小苗的出現。
好像他知道會有這樣一個人到來,表演「萬事俱備,恰遇東風」一般。(本章完)
嵌入個人作業系統,是最好的選擇,於是就產生了瀚文大字庫,這個字庫以其優異卓越的性能,可以分級使用的靈活配置,能夠滿足從日常家用電腦到專業級圖書出版社的使用,得到了微軟的青睞。
再往上一層就是擴展應用,這一層的產品包括了給各種專業設備如印表機,彩印機,排版系統,通信設備所使用的軟硬體升級套餐。
硬體中包括了字庫晶片,漢卡;軟體里包含了輸入法,編輯軟體,漢化工具包等等。
如果不是一開始周至就將和漢字編碼相關的這一系列問題予以了全局性的考慮,麥明東可以想像得到,哪怕以瀚文字庫如此優越的性能,在推廣當中也會遇到諸多的麻煩,每一道坎,都可能讓瀚文大字庫最後和許多所謂「科研成果」一般,成為束之高閣的的東西。
要按照「正常」的方式來,恐怕直到現在瀚文字庫都還會處在艱難的推廣階段,不可能成為全世界默認的惟一通用字庫軟體。
「亞洲區統一編碼現在被證實命名為UTF-8編碼,命名大會下周會在首都召開,由UNICODE組織在會後對外證實公布。」麥明東說道:「這是中國對世界信息產業做出的一項巨大貢獻,也是中國在信息學層面將傳統文字融入到資訊時代的最完美,最成功的案例,你的貢獻很大,這一次可不能缺席了。」
「他們是要和信息交換標準委員會打擂台,故意造出這麼大的聲勢,我就不去給他們助興了吧?」周至笑道。
「我其實一直有一個問題。」麥明東想了一下,還是決定問出來:「你在搞瀚文大字庫的時候,就已經考慮好了後來基於UNIX系統研發出來的COiniCOS了?」
UTF是Unicode Tranation Format的縮寫,意為Unicode轉換格式。
8代表的是八比特,也就是四個字節,意味著UNICODE字符由4個字節表示。因為UTF是一種變長的編碼,因此這個8其實指的是編碼規則的比特上限,其實大多數的UNICODE字符用不到這麼長的字節數,
傳統的信息系統基本採用的是最知名可能要數被稱為ASCII的7位字符集。它是American Standard Code for Information Interchange的縮寫,意為北美信息交換標準碼,本身是米國英語通信所設計的。
因為是針對英語設計的,別說處理漢字,就連處理帶有音調標號的幾種歐洲文字時都就會出現問題。
為了表示更多字符,人們打起了校驗碼的主意,讓最高位也用作字符表示,這就是ASCII碼擴字符集。
一種擴展是把值為128-255之間的字符用於畫圖和畫線,以及一些特殊的歐洲字符。另一種擴展是把位於128-255之間的字符用於拉丁字母表中特殊語言字符。
隨著信息技術在全世界各個國家的發展,這種修修補補的方法,其局限性就徹底暴露了出來。
作為脫離傳統打字機的後生事物,UTF-8代表著信息技術新時代,即網絡時代和無線通信時代的先進編碼。
除了字符數量可以幾乎不受約束地編制之外,它還可以通過屏蔽位和移位操作快速讀寫,也可以使排序變得更加容易。
但是UTF-8也不是一點問題都沒有,比如目前的部分系統如ISO 2022,4873,6429和8859,會將UTF-8超過百分之五十使用率的碼值100xxxxx解讀成C1控制碼,導致被過濾或者解讀出錯。
但是這個問題很好解決,就是通過一個字節對UTF-8進行修正,因而構成UTF-8修正碼。
隨著這些系統被新興的系統取代,這個問題就和即將到來的「千年蟲」問題一樣,變得不復存在。
但是這個問題在UNIX系統,以及基於UNIX系統發展起來的linux系統,四葉草COiniCOS系統中並不存在,因為UNIX系統一開始就是基於UNICODE設計的。
隨著四葉草的系統在超算系統, java環境系統,各類伺服器-終端型辦公系統等應用場景中攻城略地,語言環境的獨特優勢一步步得以持續的凸顯。
讓其餘開發商頭疼的系統字符兼容性問題,在四葉草這裡壓根不存在,大家可以將力量集中在其餘研發方向上。
但是麥明東之所以會問出這個問題,是因為周至在搞瀚文資料庫的時候,UNICODE字符集對於全世界信息產業的影響都還沒有完全體現出來,即便是到了現在,ASCII字符集都還是西方社會的主流,而最近兩三年才出現的各大廠軟體系統爭相兼容UNICODE字符集的現象,主要還是因為捆綁在英文地區外的市場上銷售作業系統的需要帶來的。
如果沒有周至後續引導四葉草集團對開發系統的研究,瀚文字庫最多就是給WINDOWS,蘋果OS錦上添花的產物,繞不過別人的智慧財產權壁壘,就只有靠別人從手指縫裡漏一點湯水來飽足。
然而結果卻是四葉草以開放智慧財產權的UNIX系統為基礎,利用自己替微軟研發VC模塊時練就的本領,將字符指令型的UNIX系統轉化為圖形界面的COiniCOiniCOS指令集上的瀚文漢卡,自身賺了個盆滿缽滿不說,還完全滿足了國內「縫縫補補又三年」的傳統,實現了國內原有信息處理設備的升級。
這項成功又為四葉草持續進行作業系統與工控通用平台指令集的研發打開了光明的前景。
最近重溫四葉草集團的發展歷程,麥明東發現了一個恐怖的事實,那就是四葉草一路走來,技術積累和產品研發不但相輔相成,而且發展線路重迭性極大,發展方向極度精準。
當別的大廠因為對技術路線沒有足夠把握,不得不大範圍圍獵智慧財產權的時候,四葉草以自己非常精準的眼光,將火力集中起來,迅速從競爭當中脫穎而出,轉眼就成了所在行業的大擘。
這已經不是兩條腿交替著走路了,簡直是在飛奔。
放眼全世界,這樣的人也是鳳毛麟角。
對這個問題,周至卻早就想好了搪塞方案:「至少到目前為止,我算是比較幸運的一方吧。」
說完拍了拍麥小苗的小手:「最大的幸運,當然就是遇到小苗了。要真是一切都有計劃,那我和小苗的相遇,不也成了計劃的一部分?」
麥明東果然就樂了,的確,要是沒有麥小苗歸國這一茬,周至的事業多半就止步在MiniCos通用平台和存儲晶片上了,四葉草COS不會進化成非線性超算矩陣的基礎操作平台,而存儲晶片也不會進化成算力卡。
哪怕是前期四葉草已經完成基準版MiniCOS,工控晶片,圖資料庫引擎,幾款「學習模式」工程軟體的技術積累,要達到今天這樣的成就和規模,至少在短期內絕不可能。
問題就在於在那個階段,周至的一切努力,似乎就在為了麥小苗的出現。
好像他知道會有這樣一個人到來,表演「萬事俱備,恰遇東風」一般。(本章完)