<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>寂静的深海 &#187; 中文</title>
	<atom:link href="http://www.deepseath.com/?feed=rss2&#038;tag=%E4%B8%AD%E6%96%87" rel="self" type="application/rss+xml" />
	<link>http://www.deepseath.com</link>
	<description></description>
	<lastBuildDate>Mon, 29 Jan 2024 09:55:11 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>PHP的json数据编译和解译，字符编码无关。</title>
		<link>http://www.deepseath.com/?p=1016</link>
		<comments>http://www.deepseath.com/?p=1016#comments</comments>
		<pubDate>Fri, 11 Nov 2011 03:23:48 +0000</pubDate>
		<dc:creator>Deepseath</dc:creator>
				<category><![CDATA[实验室]]></category>
		<category><![CDATA[ajax]]></category>
		<category><![CDATA[PHP]]></category>
		<category><![CDATA[中文]]></category>
		<category><![CDATA[代码]]></category>
		<category><![CDATA[开发]]></category>
		<category><![CDATA[技术]]></category>

		<guid isPermaLink="false">http://www.deepseath.com/?p=1016</guid>
		<description><![CDATA[这里只就PHP5.2.0+以上版本而言，因为JSON扩展是自PHP5.2.0才开始引入的。早期版本没有默认引入。 json现在应用比较广泛，主要是由于ajax技术的原因。json可以很方便的传输具有属性的数据格式，方便前端进行解析处理，更好的将数据流量传输降低并且也能使前后端尽可能的分离。 貌似自06年开始我在做的项目如果客户不强烈要求的情况下，我都会使用UTF-8进行编码开发，UTF-8开发会有很多好处，比如前、后端数据传输很方便无须额外的编码开销，另外储存的字符也比较直观，虽然有数据容量的浪费，但在目前储存如白菜价的环境下，容量问题应该不大。 在使用UTF-8编码的时候，json_encode/json_decode可以很方便的处理（虽然编译后的数据中的中文看起来很怪异，但因为也不需要直接使用数据所以也无所谓），因为PHP自带的json扩展库只支持UTF-8编码。 但有的时候客户强烈选择使用GBK/GB2312进行编码的情况下，自带的json就应付不了了。所有涉及到中文的经过编译后会变成null。 在不考虑使用第三方的扩展或者其他类库处理的情况，可以自己写一个变形函数来处理。 原理其实就是将数据的字符进行编码，比如使用rawurlencode()、urlencode()或者base64_encode()等函数进行编码，然后输出的时候再进行解码。 当然了，也可以用另一种途径，就是直接将数据字符进行编码转换，统一转换为UTF-8，然后使用json扩展函数进行处理，不过，这样处理可能会有一些意外发生（比如字符编码错误），另外，程序内的几个字符编码间来回转换看起来也不太好。 我处理的时候，利用urlencode进行编码（其实也可以使用rawurlencode()或base64_encode()，不过base64编码容量会比较大一些）。一般就是重写几个函数：json_encode()、json_decode()、ulrencode()、urldecode()。 首先要重写一下urlencode()和urldecode()，因为php自带的这两个函数只能对字符串进行处理，对于数组无法处理。而我们大多情况下其实就是处理数组。 其次要重写json_encode()和json_decode()，主要是将字符串编码进行还原，其实如果是js需要的话，可以不用重写。 主要代码： function djson_encode($data){ //重写json_encode，将数据使用urlencode进行编码 return json_encode(durlencode($data)); } function djson_decode($data){ $data = json_decode($data,true); $out = array(); foreach ( $data AS $key=&#62;$value ) { $out[durldecode($key)] = durldecode($value); } return $out; } function durldecode($string){ if ( is_array($string) ) { $array = array(); foreach ( $string AS $key=&#62;$value [...]]]></description>
		<wfw:commentRss>http://www.deepseath.com/?feed=rss2&#038;p=1016</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>百度域名被劫持，竟然有那么多幸灾乐祸的</title>
		<link>http://www.deepseath.com/?p=579</link>
		<comments>http://www.deepseath.com/?p=579#comments</comments>
		<pubDate>Tue, 12 Jan 2010 10:35:56 +0000</pubDate>
		<dc:creator>Deepseath</dc:creator>
				<category><![CDATA[心情日记]]></category>
		<category><![CDATA[中文]]></category>
		<category><![CDATA[域名]]></category>
		<category><![CDATA[天津]]></category>
		<category><![CDATA[百度]]></category>

		<guid isPermaLink="false">http://www.deepseath.com/?p=579</guid>
		<description><![CDATA[今天非常非常冷，这么冷的天气，早上爆出百度被黑的传闻，进而是域名被劫持，然后在若干网站看到消息评论，貌似很多人都在幸灾乐祸，其实，抱着那样心态的人为什么不低头想想难道百度真的一无是处吗？ 就做网站的草根而言，百度带来的好处不言而喻，不相信？那就好好看看你的搜索引擎统计吧，做国内内容的网站来自搜索引擎的百度估计最少也得一半以上，当百度无法访问的时候你看过你的流量统计吗？是什么样的景象？ 就普通网民而言，没了百度，你还“知道”什么？ 诚然百度有这样或那样的不好，但你不能不承认它的强大，进而由强大带来的方便。就现有技术的中文搜索来说，没有比百度做得更好的了 。 说实话，看到百度访问不了，开始以为是最近越来越乱的域名整治之风连百度都给扳倒了呢，幸好不是……最近已经完全撤离了.cn，想曾经拥有相同名字的几个后缀的域名，最终选择.cn做为主域名，原因就是“爱国之心”，哪曾想会有当下的情形…… 跑题了，也没什么可说的了，说重了担心被封…… 呼应开头，再说说今儿的天气，刚说过很冷很冷，可刚查过中国气象局主办的中国天气网，天津实时温度是零下10度，Fuck，我真切的在外面体验过，这零下10度与俺老家的零下20度有得一拼了，真不知道他们搞得这玩意儿准不准？]]></description>
		<wfw:commentRss>http://www.deepseath.com/?feed=rss2&#038;p=579</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>windows下生成目录结构的树状报告</title>
		<link>http://www.deepseath.com/?p=496</link>
		<comments>http://www.deepseath.com/?p=496#comments</comments>
		<pubDate>Thu, 14 May 2009 02:22:32 +0000</pubDate>
		<dc:creator>Deepseath</dc:creator>
				<category><![CDATA[日积月累]]></category>
		<category><![CDATA[PHP]]></category>
		<category><![CDATA[tree drive]]></category>
		<category><![CDATA[Windows]]></category>
		<category><![CDATA[中文]]></category>

		<guid isPermaLink="false">http://www.deepseath.com/?p=496</guid>
		<description><![CDATA[前一阵需要做一个文档，弄一个目录结构的树状报告，原本打算用PHP来写小程序的，尝试了一下发现生成的效果不太好看，也懒得去美化，另辟蹊径，突然发现命令行下有一个tree命令可以实现。 关于tree命令，可以输出帮助看看。 以图形显示驱动器或路径的文件夹结构。 TREE [drive:][path] [/F] [/A] /F 显示每个文件夹中文件的名称。 /A 使用 ASCII 字符，而不使用扩展字符。 所以，可以这样用： 如果要查看的目录位置在：d:/dir1/的话，可以利用这样的命令： tree /F d:/dir1 &#62; d:/tree.txt 这样就可以将目录“d:\dir1”的目录结构生成树状形式并输出到一个文本文件“d:/tree.txt”中。类似这样的效果： D:\DIR1 │ file1.txt │ ├─dir2 │ file21.txt │ file221.txt │ └─dir3 └─dir31 │ file.txt │ └─dir4 实际在文本内看起来还是很好看的，很清晰。]]></description>
		<wfw:commentRss>http://www.deepseath.com/?feed=rss2&#038;p=496</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>从Windows98到Windows7</title>
		<link>http://www.deepseath.com/?p=471</link>
		<comments>http://www.deepseath.com/?p=471#comments</comments>
		<pubDate>Fri, 01 May 2009 09:50:48 +0000</pubDate>
		<dc:creator>Deepseath</dc:creator>
				<category><![CDATA[程序人生]]></category>
		<category><![CDATA[Windows]]></category>
		<category><![CDATA[WinXP]]></category>
		<category><![CDATA[中文]]></category>
		<category><![CDATA[朋友]]></category>
		<category><![CDATA[网络]]></category>

		<guid isPermaLink="false">http://www.deepseath.com/?p=471</guid>
		<description><![CDATA[我能清晰的记得第一次接触计算机和网络的时间，因为我有一个东东最早先的密码就是那天——2000年9月11日。那天是一个好朋友在玩，然后我在旁边看，还给我申请了个oicq（QQ早先的名字） 等到去哈尔滨上学后，第一次真正的自己摸计算机打开网页的时候真的被这花花绿绿的东西吸引了，觉得很好玩，当时还不知道我的未来就要靠它来吃饭了。 我接触的操作系统最开始就是Windows98，记得是学校机房和网吧，在网吧玩了小半年（通宵的琢磨网页是个啥东东并尝试学着做），然后觉得还是自己买一台会省很多也方便很多，跟老爸老妈商量着买一台，磨了1K多，然后自己偷偷借了1K多，找同学帮忙配置的兼容机（他的一个亲戚哥哥做装机），记得还是“分期”付款呢，哈哈。买来后，自己装了一阵98，后来有了Winme用了很久的Winme，其实一直觉得WinMe也挺好的，不像其他人说的那么一无是处。后来WinXP出来，当时的XP刚出来，的确非常不适应，加上机器配置不是很高，那种花哨的界面，令我很头痛（直到现在我的XP都是用的标准样式没有任何渲染）。然后慢慢喜欢上了XP，期间虽然有叛逃到Linux的时候不过最终还是一直用WinxP的。很庆幸自己的机器当时配置不高，加上就爱折腾，所以机器的优化做到了极限^_^ Windows Vista刚出来，用过一阵测试版的，实在不舒服，等正式版发布的时候也不中意，使用还是WindowsXP，到了去年年中，终于更换了新本，配置非常非常高^_^。还是WindowsXP，现在Windows７出来了，早在年初就在虚拟机上安装了测试版，用着还算可以，至少比Vista强一些。然后接下来的测试版接着试用，发现越来越成熟了。应该说，Windows7很多操作与WindowsXP不一样了，操作也许不适应，但总归有些地方其实还是很方便的，某些功能和附件也增强了不少，总得说来还是很期待的。 刚刚下载了Windows7的7100测试，还没安装，看新闻说Win7发布了最低配置 1GHz处理器（32位或64位） 512Mb RAM（家庭版），或1GB RAM（其他版本） 15GB可用硬盘空间 支持DirectX 9，带32MB显存（家庭版），或128MB显存并支持WDDM（其他版本） 据说，Win7的RC版也发布了，不知道中文有没有，好像到2010年6月1日都可以免费用^_^晚上先安装7100再说，尝尝鲜，希望乱码问题能够被解决了。以那个最低配置来说。装到虚拟机都绰绰有余，哈哈。]]></description>
		<wfw:commentRss>http://www.deepseath.com/?feed=rss2&#038;p=471</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>金融危机、经济危机、XX危机</title>
		<link>http://www.deepseath.com/?p=412</link>
		<comments>http://www.deepseath.com/?p=412#comments</comments>
		<pubDate>Tue, 25 Nov 2008 04:31:04 +0000</pubDate>
		<dc:creator>Deepseath</dc:creator>
				<category><![CDATA[心情日记]]></category>
		<category><![CDATA[中文]]></category>

		<guid isPermaLink="false">http://www.deepseath.com/?p=412</guid>
		<description><![CDATA[最近新闻铺天盖地几乎全是关于某某危机的，特别是金融危机和经济危机，看了很久貌似没有什么特别的感触了，不过刚刚突然感觉中文的博大精深——“危机”，什么是危机呢？危难中的机遇。所以坚持在困苦中寻找机会危难也会变成一种机遇，喜欢这个词^_^]]></description>
		<wfw:commentRss>http://www.deepseath.com/?feed=rss2&#038;p=412</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>IIS的日志分析</title>
		<link>http://www.deepseath.com/?p=341</link>
		<comments>http://www.deepseath.com/?p=341#comments</comments>
		<pubDate>Mon, 13 Oct 2008 18:11:35 +0000</pubDate>
		<dc:creator>Deepseath</dc:creator>
				<category><![CDATA[程序人生]]></category>
		<category><![CDATA[Apache]]></category>
		<category><![CDATA[Explorer]]></category>
		<category><![CDATA[IE]]></category>
		<category><![CDATA[INT]]></category>
		<category><![CDATA[ip]]></category>
		<category><![CDATA[microsoft]]></category>
		<category><![CDATA[microsoft windows]]></category>
		<category><![CDATA[pi]]></category>
		<category><![CDATA[Port]]></category>
		<category><![CDATA[Server]]></category>
		<category><![CDATA[W3C]]></category>
		<category><![CDATA[Web]]></category>
		<category><![CDATA[Windows]]></category>
		<category><![CDATA[中文]]></category>
		<category><![CDATA[技术]]></category>
		<category><![CDATA[服务]]></category>
		<category><![CDATA[服务器]]></category>
		<category><![CDATA[浏览器]]></category>
		<category><![CDATA[知识]]></category>

		<guid isPermaLink="false">http://www.deepseath.com/?p=341</guid>
		<description><![CDATA[为了方便而又准确的统计站点信息需要分析IIS日志，找了好多软件，要么不是自己需要的要么就是收费的，因此打算自己写一个分析的程序，于是进入微软技术站看技术文档，总结了一下写在这里以备忘：   1。为了集中而又方便的统计整台服务器的日志，如果各个站点单独记录日志可能统计起来不太方便，当然如果只是为了统计某个站点那就另当别论了，我打算统计整台服务器多个站点的数据，因此如果能将多站日志合并到一起或许会方便一些。因此需要用到IIS的“启用 W3C 集中日志记录”功能，在命令行执行命令：Adsutil.vbs set w3svc/CentralW3CLoggingEnabled true，然后重起IIS服务就可以了。 2。因为服务器运行在中文语言下，而且很多站点是UTF-8作为编码字符集的，因此还有必要将IIS日志设置为UTF-8编码的，方便分析同时也相对安全一些，打开这个功能可以这样做：在IIS管理器中，在本地计算机上点击右键，选择“属性”，在“UTF-8日志”选项单元中，钩选“用 UTF-8 编码 Web 日志”，然后确定并重起IIS服务即可。 3。IIS的每个字段之间使用半角空格进行分隔的。就每个字段数据而言如果存在空格则IIS自动会将空格转换为“+”。但，要注意数据中可能自身会存在“+”。 4。每个字段对应的含义是： 日期(date)，时间(time)，客户端IP地址(c-ip)，用户名(cs-username)，服务名(s-sitename)，服务器名(s-computername)，服务器ip地址(s-ip)，服务器端口(s-port)，方法(cs-method)，uri资源(cs-uri-stem)，uri查询(cs-uri-query)，协议状态(sc-status)，协议子状态(sc-substatus)，wind32状态(sc-wind32-status)，发送的字节数(sc-bytes)，接收的字节数(cs-bytes)，所用时间(time-taken)，协议版本(cs-version)，主机(cs-host)，用户代理(cs(User-Agent))，cookie(cs(Cookie))，引用站点(cs(Referer)。 5。协议状态(这就是通用的了，无论是IIS还是Apache抑或是其他的)。 1xx &#8211; 信息提示：这些状态代码表示临时的响应。客户端在收到常规响应之前，应准备接收一个或多个 1xx 响应。 100 &#8211; 继续。 101 &#8211; 切换协议。 2xx &#8211; 成功：这类状态代码表明服务器成功地接受了客户端请求。 200 &#8211; 确定。客户端请求已成功。 201 &#8211; 已创建。 202 &#8211; 已接受。 203 &#8211; 非权威性信息。 204 &#8211; 无内容。 205 &#8211; 重置内容。 206 &#8211; 部分内容。 3xx &#8211; 重定向：客户端浏览器必须采取更多操作来实现请求。例如，浏览器可能不得不请求服务器上的不同的页面，或通过代理服务器重复该请求。 [...]]]></description>
		<wfw:commentRss>http://www.deepseath.com/?feed=rss2&#038;p=341</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>汉语词性分析</title>
		<link>http://www.deepseath.com/?p=331</link>
		<comments>http://www.deepseath.com/?p=331#comments</comments>
		<pubDate>Thu, 09 Oct 2008 05:23:46 +0000</pubDate>
		<dc:creator>Deepseath</dc:creator>
				<category><![CDATA[程序人生]]></category>
		<category><![CDATA[PHP]]></category>
		<category><![CDATA[中文]]></category>
		<category><![CDATA[分词]]></category>
		<category><![CDATA[北大]]></category>
		<category><![CDATA[字典]]></category>
		<category><![CDATA[底层]]></category>
		<category><![CDATA[技术]]></category>
		<category><![CDATA[缺憾]]></category>
		<category><![CDATA[网络]]></category>
		<category><![CDATA[词典]]></category>
		<category><![CDATA[词性]]></category>
		<category><![CDATA[词频]]></category>

		<guid isPermaLink="false">http://www.deepseath.com/?p=331</guid>
		<description><![CDATA[最近一直利用晚上时间在研究分词，不过中文分词实在是个麻烦的技术，个人能力也十分有限，特别对于底层技术还有很多缺憾，目前只能利用已有的字典文件进行分词，没有神经智能可言：（不过应付一些提取关键词以及查找分类什么的还稍微有点用途，有点不太好的就是效率不是很高，还得继续钻研啊…… 在网络找到一个词典，很不错，词频、词重以及词性都有了，不过词性有的看不明白，通过网络整理到了一个比较全的北大的标注标准： 汉语词性对照表[北大标准/中科院标准] 词性编码 词性名称 注解 词性编码 词性名称 注解 Ag 形语素 形容词性语素。形容词代码为a，语素代码ｇ前面置以A a 形容词 取英语形容词adjective的第1个字母。 ad 副形词 直接作状语的形容词。形容词代码a和副词代码d并在一起。 an 名形词 具有名词功能的形容词。形容词代码a和名词代码n并在一起。 Bg 区别语素 b 区别词 取汉字“别”的声母。 c 连词 取英语连词conjunction的第1个字母。 Dg 副语素 副词性语素。副词代码为d，语素代码ｇ前面置以D。 d 副词 取adverb的第2个字母，因其第1个字母已用于形容词 dc 程度副词 df 否定副词 e 叹词 取英语叹词exclamation的第1个字母。 f 方位词 取汉字“方”的声母。 g 语素 绝大多数语素都能作为合成词的“词根”，取汉字“根”的声母。由于实际标注时，一定标注其子类，所以从未用到过g。 h 前接成分 取英语head的第1个字母。 i 成语 取英语成语idiom的第1个字母。 ia [...]]]></description>
		<wfw:commentRss>http://www.deepseath.com/?feed=rss2&#038;p=331</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
	</channel>
</rss>
