<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>寂静的深海 &#187; 词典</title>
	<atom:link href="http://www.deepseath.com/?feed=rss2&#038;tag=%E8%AF%8D%E5%85%B8" rel="self" type="application/rss+xml" />
	<link>http://www.deepseath.com</link>
	<description></description>
	<lastBuildDate>Mon, 29 Jan 2024 09:55:11 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>汉语词性分析</title>
		<link>http://www.deepseath.com/?p=331</link>
		<comments>http://www.deepseath.com/?p=331#comments</comments>
		<pubDate>Thu, 09 Oct 2008 05:23:46 +0000</pubDate>
		<dc:creator>Deepseath</dc:creator>
				<category><![CDATA[程序人生]]></category>
		<category><![CDATA[PHP]]></category>
		<category><![CDATA[中文]]></category>
		<category><![CDATA[分词]]></category>
		<category><![CDATA[北大]]></category>
		<category><![CDATA[字典]]></category>
		<category><![CDATA[底层]]></category>
		<category><![CDATA[技术]]></category>
		<category><![CDATA[缺憾]]></category>
		<category><![CDATA[网络]]></category>
		<category><![CDATA[词典]]></category>
		<category><![CDATA[词性]]></category>
		<category><![CDATA[词频]]></category>

		<guid isPermaLink="false">http://www.deepseath.com/?p=331</guid>
		<description><![CDATA[最近一直利用晚上时间在研究分词，不过中文分词实在是个麻烦的技术，个人能力也十分有限，特别对于底层技术还有很多缺憾，目前只能利用已有的字典文件进行分词，没有神经智能可言：（不过应付一些提取关键词以及查找分类什么的还稍微有点用途，有点不太好的就是效率不是很高，还得继续钻研啊…… 在网络找到一个词典，很不错，词频、词重以及词性都有了，不过词性有的看不明白，通过网络整理到了一个比较全的北大的标注标准： 汉语词性对照表[北大标准/中科院标准] 词性编码 词性名称 注解 词性编码 词性名称 注解 Ag 形语素 形容词性语素。形容词代码为a，语素代码ｇ前面置以A a 形容词 取英语形容词adjective的第1个字母。 ad 副形词 直接作状语的形容词。形容词代码a和副词代码d并在一起。 an 名形词 具有名词功能的形容词。形容词代码a和名词代码n并在一起。 Bg 区别语素 b 区别词 取汉字“别”的声母。 c 连词 取英语连词conjunction的第1个字母。 Dg 副语素 副词性语素。副词代码为d，语素代码ｇ前面置以D。 d 副词 取adverb的第2个字母，因其第1个字母已用于形容词 dc 程度副词 df 否定副词 e 叹词 取英语叹词exclamation的第1个字母。 f 方位词 取汉字“方”的声母。 g 语素 绝大多数语素都能作为合成词的“词根”，取汉字“根”的声母。由于实际标注时，一定标注其子类，所以从未用到过g。 h 前接成分 取英语head的第1个字母。 i 成语 取英语成语idiom的第1个字母。 ia [...]]]></description>
		<wfw:commentRss>http://www.deepseath.com/?feed=rss2&#038;p=331</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
	</channel>
</rss>
