我们写爬虫爬回来的一些页面可能是编码后的utf8码,这时候我们需要对他们进行解码1
var code10, code16, zh;
code10 = '天堂向左,深圳向右';
zh = code10.replace(/&#(\d+);/g, function($, $1) {return String.fromCodePoint($1)});
console.log(zh);
code16 = zh.replace(/[^\u0000-\u00ff]/g, function($) {return '&#x' + $.codePointAt(0).toString(16) + ';';});
console.log(code16);
zh = code16.replace(/&#x(\w+);/g, function($, $1) {return String.fromCodePoint(parseInt($1, 16))});
console.log(zh);
html中UTF8编码的解码
本文标题:html中UTF8编码的解码
文章作者:CoderQ
发布时间:2016年02月29日 - 08时05分
最后更新:2016年04月06日 - 07时38分
原始链接:http://coderq.github.io/2016/02/29/decode-utf8/
许可协议: "署名-非商用-相同方式共享 3.0" 转载请保留原文链接及作者。