A JavaScript Fancier

伟大的javascript技术研究中...

IT博客 :: 首页 :: 新随笔 :: 联系 :: 聚合

:: 管理 ::

304 随笔 :: 0 文章 :: 479 评论 :: 0 Trackbacks

JS正则表达式提取字符串中所有汉字

再网上发现有人用vbscript正则表达式实现了这个功能，但代码很厂，偶改成js的了，很短的一段代码：

这里的关键是汉字escape后的编码范围是\u4e00-\u9fa5，知道这个问题就好解决了。

posted on 2006-06-28 18:14 Yemoo'S JS Blog 阅读(5501) 评论(3) 编辑收藏引用所属分类: javascript个人作品、正则表达式专题

# re: JS正则表达式提取字符串中所有汉字 2007-02-04 01:54 杂耍大扫除htmdfghdfhg　

怎样从一个Html页面中提取所有汉字呢？不能有其它Html代码回复更多评论

# re: JS正则表达式提取字符串中所有汉字 2007-02-04 10:35 Yemoo'S JS Blog

原理相同，只是需要读取页面的html代码：
1.读取本页面的汉字方法：
==========================================
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title> new document </title>
<meta name="generator" content="editplus" />
<meta name="author" content="" />
<meta name="keywords" content="" />
<meta name="description" content="" />
</head>

<body>
汉字汉字
<input type="button" value="显示页面所有汉字" onclick='alert(document.documentElement.innerHTML.replace(/[^\u4e00-\u9fa5]/gi,""))'>

<a href="" title="">超级链接</a>
<p>段落标记</p>
</body>
</html>
==========================================
2.读取其他网页中的汉字，现使用xmlhttp获取数据然后使用同样的方法replace()即可。回复更多评论

# re: JS正则表达式提取字符串中所有汉字 2008-11-06 19:14 yangtse

\u4e00-\u9fa5
你说的这个范围是错误的
不信你试试等于号
也当作汉字处理了
回复更多评论

刷新评论列表

只有注册用户登录后才能发表评论。

A JavaScript Fancier

公告

常用链接

留言簿(26)

随笔分类

随笔档案

Ajax技术站点

javascript学习站点

JS高人Blog

Ruby&&Ajax框架

Web技术站点

搜索

积分与排名

最新评论

阅读排行榜

评论排行榜

评论