有同事在公司的OA上發了個貼子,介紹在javascript中如何得到中英文混合字符串的長度。
用的是正則表達式。
複製代碼代碼如下:
var str = ”坦克是tank的音譯”;
var len = str.match(/[^ -~]/g) == null ? str.length : str.length + str.match(/[^ -~]/g).length ;
我查了一下書,有點明白了:
西文常用字符集由空格“ ”(0x20)到“~”(0x7e)構成,漢字會落在這個字符集外,而正則表達式[^ -~]表示除空格到“~”外的字符集。
複製代碼代碼如下:
string.match(regex) 會以數組形式返回字符串string中匹配正則表達式regex的子串,所以,
str.match(/[^ -~]/g)會以數組的形式返回一個個漢字。例如
var str = "dd大哥";
//顯示"大,哥",數組中返回兩個漢字,數組長度為2
alert(str.match(/[^ -~]/g));
這樣,var len = str.match(/[^ -~]/g) == null ? str.length : str.length + str.match(/[^ -~]/g).length ;就可以得到str的正確長度了。
在javascript中,一個漢字的長度也被計算為1,常常在提交到數據庫中造成長度超標的錯誤,現在用這個方法,可以在提交前先檢測一番了。
注:以上代碼有些符號有問題,經修正後,改為如下函數。
複製代碼代碼如下:
function get_strlength (str)
{
var len = 0;
if (str.match(/[^ -~]/g) == null)
{
len = str.length;
}
else
{
len = str.length + str.match(/[^ -~]/g).length;
}
return len;
}