標籤的語言細微性

一年零六個月前,我寫了篇使用標籤是遲早的事來反駁「就博客而言,標籤沒有太大意義」的觀點。最近又看到在分享裡有篇文章提到tags在中文網站用不好的原因之一是語言的細微性問題,因為「英文的細微性是單詞,中文的細微性是字。」並且舉了個「貓」的例子,英文tags多半是cat,而中文tags可能是貓、貓貓、貓咪、咪咪、小貓咪等等。

我認為這個結論還是不夠準確,問題任何語言都存在,只是各有各的表現特徵。在某種程度上,中文可能表現的很麻煩,但英文也簡單不到哪裡去,比如英文的複數。《錦繡藍圖》中有個關於英文正餐之前開胃菜說法的例子,可以叫starter, first course, appetizer, Hors d’oeuvres, Anamuse-gueule,另外西餐館可能叫grazing,運動主題酒吧可能叫warmups。

可見,問題的關鍵是電腦不能像人一樣主動思考。並且現實生活中,因為語言、文化、習慣、專業等等因素,很容易造成詞彙混亂。在資訊架構專業領域裡,有個方法叫「創建受控詞彙表」。顧名思義,就是統一「約定俗成的表意詞」,用人工的關係組織來讓電腦明白N種說法其實都一樣。

文章提到第二個使用者習慣的原因,我認為確實客觀存在。但這個不是「中文」的問題,使用者也可以再教育,比如很多做的好的英文產品上,也能看到中文使用者提供並維護很好的tags體系。當然,說到線民容易把話題扯很大,反正現實是目前絕大多數中文線民上網的首要任務還不是「任務導向」。

綜上所述,我認為問題的根本不在tag本身,而是設計層面做的不夠。在實際的處理方案中,我認為tags不一定需要使用者來提供,因為確實價值有限。但如果是團隊內部用tags來組織資訊,肯定會收到事半功倍的效果。只不過中英文的處理上,應該需要注意中文當地語系化問題。

還是關於「語言細微性」的例子,英文tags的input錄入控制項裡,約定成俗的習慣基本都用英文逗號「,」做分隔符號,而很多中文網站也延續了這個規範。我認為並不合適,因為英文的細微性是單詞,有可能用多個單詞加空格來做描述;而中文的細微性是文字,所有詞描述都由N個字組成。另外,中英文切換也不方便,所以中文tags的input錄入控制項用「空格」做分隔符號最合適。

源位址:HTTP://blog.rexsong.com/?p=10005

特別注意:本站所有轉載文章言論不代表本站觀點,本站所提供的攝影照片,插畫,設計作品,如需使用,請與原作者聯繫,文章轉自alibuybuy

Comments are closed.