物聯傳媒 旗下網站
登錄 注冊
RFID世界網 >  新聞中心  >  物聯網新聞  >  正文

互聯網支持全球多少種語言?僅僅5%

作者:李瑋
來源:騰訊科技
日期:2015-12-07 10:54:57
摘要:土著文化缺乏充足的資源,因此在互聯網上很難為自己的語言找到一席之地。
關鍵詞:互聯網

互聯網支持全球多少種語言?僅僅5%

  12月6日消息,《大西洋月刊》本周刊文稱,盡管互聯網連接了全世界,但互聯網對人群的割裂比我們想象中更嚴重。這是由于,互聯網網頁僅僅使用了全球為數不多的語言,而大部分語言仍未能上網。

  以下為文章全文:

  是tweet、tuit,還是giolc?這是蓋爾語中對“Tweet”(Twitter消息)一詞的3種表述方式。2012年,Twitter的愛爾蘭翻譯們為此爭執不休。關于究竟是用英語拼法,還是蓋爾語拼法,亦或是蓋爾語中的動詞形式,這一困難的選擇導致項目停滯了整整一年時間。最終,一個翻譯小組做出了決定,采用英語拼法“tweet”,同時配以愛爾蘭語法。到2015年4月,蓋爾語版本的Twitter終于上線。

  許多土著文化缺乏充足的資源,因此在互聯網上很難為自己的語言找到一席之地。英語、西班牙語和法語等少數語言主導了互聯網。在社交網絡上,以這些語言作為母語的用戶已習慣于約定俗成的單詞庫、內置的翻譯服務、基本的語法,以及拼寫檢查工具。

  在愛爾蘭,只有2%到3%的人口使用蓋爾語,因此以這一語言作為母語的人群很難使用數字服務。而某一語言即使有數百萬使用者,可能也仍會缺乏資源,使互聯網在日常生活中難以發揮作用。

  數字發展寬帶委員會成立于5年前,其任務是關注全球互聯網的發展及使用。今年9月,該委員會發布了2015年的“寬帶狀態報告”。報告認為,在幫助尚未聯網的40億人口互聯的過程中,互聯網對各種語言的支持將是主要挑戰之一。

  目前,互聯網網頁僅僅使用了全球5%的語言。在訪問量最大的1000萬家網站中,即使是某些國家的官方語言,例如印地語和斯瓦西里語,也僅被其中的0.01%使用。全球大部分語言都還沒有存在于互聯網上。

  全球現用語言名錄Ethnologue發現,在目前使用的7100種語言中,有1519種正面臨逐漸消亡的風險。對于這些瀕臨滅亡的語言,Facebook、Twitter和Instagram等社交網絡,以及谷歌(微博)和維基百科等其他數字平臺可以帶來幫助。盡管挽救語言的最佳方式使確保有人說這些語言,但讓人們在網站上使用自己的母語也能有所助益。

  計算機語言學教授凱文·斯堪奈爾(Kevin Scannell)花了很多時間去建設能支持多種語言的技術基礎設施,而工具常常是開源軟件。目前,斯堪奈爾正在處理40多種語言,而他的工作也是更廣泛的語言保護行動的一部分。他表示:“這些語言目前還不是互聯網或計算機行業的一部分。我們試圖改變這一現狀,向人們提供可用的工具。”

  齊切瓦語正是這樣一種資源匱乏的語言。齊切瓦語是非洲班圖語的一種,被1200萬人口使用,其中大部分人口居住在馬拉維。程序員埃德蒙·卡查爾(Edmond Kachale)從2005年開始為齊切瓦語開發基本的文字處理工具,而過去5年則在嘗試將谷歌搜索服務翻譯成這一語言。此前,互聯網上幾乎沒有任何齊切瓦語的內容。這意味著持這種語言的人群很難參與數字時代的全球化競爭。他表示:“除非這種語言在數字世界中引起關注,否則就將走向消亡。”

  在馬拉維,超過60%的人口還無法訪問互聯網。不過卡查爾指出,即使在馬拉維全國范圍內提供免費的互聯網服務,但由于語言障礙的存在,母語為齊切瓦語的人口可能也不會去使用互聯網。2015年的寬帶報告證實了卡查爾的觀點。以各種語言的10萬個維基百科頁面作為參考,報告發現,全球只有53%的人口可以用母語獲得足夠多的內容,從而發揮互聯網的作用。

  無法使用互聯網可能會造成經濟上的落后,因為這些人群將無法享受電商帶來的便利。在馬拉維,Facebook已成為互聯網上的關鍵平臺,但在當地Facebook也沒有提供齊切瓦語的版本。相關用戶需要使用瀏覽器插件來自行翻譯。

  2014年,Facebook支持了20種新的語言,而今年又支持了更多語言,目前支持的語言總數超過80種。Facebook還啟動了基于社區的翻譯項目,而這帶來了約50種語言,包括只在玻利維亞、秘魯和智利使用的土著語言艾瑪拉語。盡管目前仍有約200萬使用者,但聯合國教科文組織已將艾瑪拉語定義為“瀕危”語言。從2014年5月開始,由20名志愿翻譯者組成的團隊前往當地整理了2.5萬個常用詞匯,而這一項目預計將于今年圣誕節完成。

  這一項目非常重要,因為這將鼓勵年輕人使用自己的母語。負責這一翻譯項目的艾利亞斯·楚拉(Elias Quisepe Chura)表示:“我們肯定,如果艾瑪拉語成為Facebook官方語言之一,那么將給艾瑪拉人帶來力量。”

  翻譯團隊的另一名成員魯本·希拉里(Ruben Hilari)對西班牙《國家報》表示:“艾瑪拉語仍然存在,沒有必要復活這種語言。然而,這一語言的地位需要加強,而這正是我們所做的工作。如果我們今天沒有為自己的語言和文化努力,那么明天我們可能就會不再記得自己是誰,我們對自己的身份將會產生不安全感。”

  盡管被稱作“信息高速公路”,但互聯網目前只對少數語言的使用者有用。而互聯網的這一局限也反映了當代全球社會存在的割裂和不平等現象。

人物訪談