微博為什麼限制140字

問題的提出

申請過那麼多的微博,數申請網易微博的動機最不純,因為它的字數限制不是傳說中的140字,而是163個字。當年覺得很可愛,於是就註冊了,之後再也沒登錄過。今天在人人網轉發狀態,提示我超過140字了,突然就好奇大家都在湊什麼熱鬧,為什麼除了網易微博,都限制140個字呢?

當然也已經有過關於這個問題的解釋,比如人民網上這位“並沒有twitter方面做過交流”的專家,或者這位新浪微博的副主編(原來新浪微博是有編輯的啊),還有各種論壇、百度知道提問等等,都不足以讓人信服,考據癖沒能得到滿足,只好自己來考據一番。

twitter說

We like to keep it short and sweet! It also just so happens that 140 characters is the perfect len​​gth for sending status updates via text message. The standard text message length in most places is 160 characters per message. We reserve 20 characters for people's names, and the other 140 are all yours! (via Twitter FAQ)

也就是說,twitter希望微博首先能做到“微”,言簡意賅,其次這樣的限制是考慮到短信更新狀態的字數限制,本身是160字母的限制,再留20字給id長度,剩餘140字母留給用戶發揮。

此外,YAHOO!的meme(2,000字)和Google的Buzz(沒有限制)等對字數都沒有短而精的要求,在這個層面上,算不上微博,只能算輕量級博客,暫不相提並論。

國內微博為什麼也限制140字

如果按照160字是短信長度限制的說法,那麼國內短信是70字,為什麼國內的各微博不限制在70字,而是140字呢? *浪副總編說,因為這剛好是兩條短信的長度。看上去挺合理的解釋,可還是不禁追問,為什麼一定要兩條?會不會像傳說中所有國內微博地址開頭的那個“t.”代表twitter一樣,表明是對twitter的一種“借鑒”?還是說這個140已經成為twitter建立的隱含的行業標準?中文的字數限制從已經逝去的“吃飯了嗎 (update:它已經復活了)”開始把140字沿用至今,成為一個不成文的規定,沒什麼特別的就不需要改,倒是網易在這一點上走了個歪路。



當然不只我一個糾結過這個問題,這篇關於中文微博140字的博文分析原因可能是“一方面,70個字符承載的信息量確實少了點;另一方面,在輸入中文的時候我們也會輸入英文”。雖然我比較肯定他的出發點,但是禁不住再較真一番:首先,70個字符承載的信息究竟夠不夠?粗略計算一下,根據新華翻譯社的多年翻譯經驗,英譯中的字數大約是1:1.8(英:中),而統計表明, 英文平均每個單詞4.5個字母。那麼140個字母表達的意思是可以翻譯成(140/4.5*1.8=) 56個漢字的。如果從這個角度看,70個漢字其實是足夠表達一個簡單的語義的(所以很多中文twitter用戶都發現140個漢字能表達的信息遠遠大於140個字母,優越感油然而生)。其次,關於國內微博輸入英文這一點有一個很有趣的發現:如果國內把字數設定為70字,那麼發英文的更新的確是個難題。但是新浪微博有個獨創性的事,就是兩個英文字符(字母、空格、數字、英文符號等)算一個字,也就是允許用戶輸入280個英文字符。這算是創舉了,看來新浪微博果然是允許用戶發兩倍於twitter數目的信息(中英文包含在內),原因不詳。

倒是這位同學的考據路線和我走的差不多(我看了他的文章才想起來校內是從70字的限制增加到140字的),不過我們都沒有任何確鑿的證據說明漢字140字的取法,我也不是任何方面的專家,也沒做過多少字滿足微博需要的調查,以上都是不負責任的推測,期待行內人士詳解。

(logo裡果斷截了“測試版”仨字,以賀國內各微博的“二次beta”)

bonus:關於短信的字數限制

中文短信的字數限制是70字,本來沒想過為什麼要控制在這個字數之內,被twitter的解釋給弄的好奇了,於是繼續考據。

先講個故事:1985年的德國波恩,Friedhelm Hillebrand坐在自己家裡,啪嗒啪嗒的敲著打字機的鍵盤,隨意的打著一些句子。這位通信專家一邊打一邊數著字母、數字、標點和空格的數目,最終發現160個字符足夠表現一個簡單的意思。當時Hellebrand正在參與一個允許手機發送及顯示文字消息的標準制定計劃,他們考慮到無線網絡的帶寬限制,消息越短越好。最終,Hillebrand堅持認為160字是最好的長度限制,短信長度的限制也由此而來。

關於160字的限制,洛杉磯時報的這篇文章解釋得格外詳細(這個故事就取自文章前一部分),國內也有很不錯的翻譯版本,可以自行在Google搜索“twitter的創始人可能都還在玩泥巴”。

而我最信任的wikipedia大神在SMS的詞條中提到, “it was necessary to limit the length of the messages to 128 bytes (later improved to 140 bytes, or 160 7-bit characters), so that the messages could fit into the existing signaling formats.” 也就是說,160字符實際上來源於140字節的限制,140字節相當於(140*8/7=)160個7位字符(140個8位字符,70個16位字符,如漢字)。而 Hillebrand的打字機實驗,以及對明信片字母數的統計(一般不超過150字母),驗證了160個字符可以勝任簡單語義的表達。

後來看到了一個好消息,說手機短信20年來首次擴容,電信要支持150字的短信了,不知道依據和意義何在,09年的新聞說“年內可以為用戶提供服務”,如今2010年已過半,除了09年那條舊新聞,也搜不到已經擴容的消息,看來項目推進延期了不少。

考據畢。

來源:http://www.starming.com

特別注意:本站所有轉載文章言論不代表本站觀點,本站所提供的攝影照片,插畫,設計作品,如需使用,請與原作者聯繫,文章轉自alibuybuy

Comments are closed.