汉语词性对照表[北大标准
注 解 | ||
---|---|---|
Ag |
形语素 | 形容词性语素。形容词代码为 a,语素代码g前面置以A。 |
a |
形容词 | 取英语形容词 adjective的第1个字母 |
ad |
副形词 | 直接作状语的形容词。形容词代码 |
an |
名形词 | 具有名词功能的形容词。形容词代 |
b |
区别词 | 取汉字“别”的声母。 |
c |
连词 | 取英语连词 conjunction的第1个 |
dg
|
副语素 | 副词性语素。副词代码为 d,语素代码g前面置以D。 |
d |
副词 | 取 adverb的第2个字母,因其 |
e |
叹词 | 取英语叹词 exclamation的第1个 |
f |
方位词 | 取汉字“方” |
g |
语素 | 绝大多数语素都能作为合成词的“ |
h |
前接成分 | 取英语 head的第1个字母。 |
i |
成语 | 取英语成语 idiom的第1个字母。 |
j |
简称略语 | 取汉字“简”的声母。 |
k |
后接成分 | |
l |
习用语 | 习用语尚未成为成语,有点“临时 |
m |
数词 | 取英语 numeral的第3个字母,n |
Ng |
名语素 | 名词性语素。名词代码为 n,语素代码g前面置以N。 |
n |
名词 | 取英语名词 noun的第1个字母。 |
nr |
人名 | 名词代码 n和“人(ren)”的声母并在 |
ns |
地名 | 名词代码 n和处所词代码s并在一起。 |
nt |
机构团体 | “团”的声母为 t,名词代码n和t并在一起。 |
nz |
其他专名 | “专”的声母的第 1个字母为z,名词代码n和z并 |
o |
拟声词 | 取英语拟声词 onomatopoeia的第1 |
p |
介词 | 取英语介词 prepositional的第 |
q |
量词 | 取英语 quantity的第1个字母。 |
r |
代词 | 取英语代词 pronoun的第2个字母,因 |
s |
处所词 | 取英语 space的第1个字母。 |
tg |
时语素 | 时间词性语素。时间词代码为 t,在语素的代码g前面置以T。 |
t |
时间词 | 取英语 time的第1个字母。 |
u |
助词 | 取英语助词 auxiliary |
vg |
动语素 | 动词性语素。动词代码为 v。在语素的代码g前面置以V。 |
v |
动词 | 取英语动词 verb的第一个字母。 |
vd |
副动词 | 直接作状语的动词。动词和副词的 |
vn |
名动词 | 指具有名词功能的动词。动词和名 |
w |
标点符号 | |
x |
非语素字 | 非语素字只是一个符号,字母 x通常用于代表未知数、符号。 |
y |
语气词 | 取汉字“语”的声母。 |
z |
状态词 | 取汉字“状”的声母的前一个字母 |
un |
未知词 | 不可识别词及用户自定义词组。取 |
你可能还喜欢下面这些文章
一、问题背景随着深度学习的广泛应用,在搜索引擎/推荐系统/机器视觉等业务系统中,越来越多的深度学习模型部署到线上服务。机器学习模型在离线训练时,一般要将输入的数据做特征工程预处理,再输入模型在 TensorFlow PyTorch 等框架上做训练。1.常见的特征工程逻辑常见的特征工程逻辑有: 分箱/分桶 离散化 log/exp 对数/幂等 math numpy 常见数学运算 特征缩放/归一化/截断 交叉特征生成 分词匹配程度计算 字符串分隔匹配判断 tong 缺省值填充等 数据平滑 onehot 编码,hash 编码等这些特征工程代码,当然一般使用深度学习最主要的语言 pyt
这篇文章是漫话中文分词算法的续篇。在这里,我们将紧接着上一篇文章的内容继续探讨下去:如果计算机可以对一句话进行自动分词,它还能进一步整理句子的结构,甚至理解句子的意思吗?这两篇文章的关系十分紧密,因此,我把前一篇文章改名为了《漫话中文自动分词和语义识别(上)》,这篇文章自然就是它的下篇。我已经在很多不同的地方做过与这个话题有关的演讲了,在这里我想把它们写下来,和更多的人一同分享。什么叫做句法结构呢?让我们来看一些例子。“白天鹅在水中游”,这句话是有歧义的,它可能指的是“白天有一只鹅在水中游”,也可能指的是“有一只白天鹅在水中游”。不同的分词方案,产生了不同的意义。有没有什么句子,它的分词方案是
项目做多了之后,可能会慢慢总结出自己的代码库出来,当在新的项目中使用的时候,总不能一直是复制粘贴。这个时候,composer就能派上用场了。一个项目开始,使用composer就能够加载所需要的依赖,非常方便。这个时候,来做一个自己的包吧!使用命名空间composer自动加载需要用到命名空间,因此所有的代码库都需要使用命名空间,如果没有,那就改吧!使用命名空间之后你可能会打开新世界的大门。创建composer.json我假设你已经安装了composer,并且已经会使用了。创建自己的包我们首先需要创建一个composer.json,示例文件如下上面的composer.json有一个比较重要的是au
语法高亮是文本编辑器用来显示文本的,特别是源代码,根据不同的类别来用不同的颜色和字体显示。这个功能有助于编写结构化的语言,比如编程语言,标记语言,这些语言的语法错误显示是有区别的。语法高亮并不会影响文本自身的意义,而且能很好的符合人们的阅读习惯。语法高亮同时也能帮助开发者很快的找到他们程序中的错误。例如,大部分编辑器会用不同的颜色突出字符串常量。所以,非常容易发现是否遗漏了分隔符,因为相对于其他文本颜色不同。现 在有各种各样的语法高亮工具,可以格式化语言,并且根据不同的编程语言进行高亮显示。无论是个 HTML 页面还是 PHP,Ruby,Python 或者是 ASP。这篇文章中,我们会介绍 1
作为代码中,第一个看到的,极有可能就是define这个东西,称为宏!(define是可以出现在任何地方的,但是我们一般把这个写到最开始)然而,很多时候,初学者有时候可能看不懂她,因此,我的c语言学习的第一篇就写这个啦。define基本用法,简单定义最浅显的,define能用一个有含义的字符来替代一些数字,比如#define PI 3.141592654这样,假如以后要计算圆的周长或者面积,就可以用PI这个字符而不用写3.141592654啦。比如#define PI 3.141592654#include "stdio.h"int main(){ int r = 3; float
一个将网页里面的(图片,链接地址)相对路径转化为绝对路径的php实现方法
抓取网页的时候有时候会需要下载里面的图片或者其他附件,但有的网页里面用的是相对路径,这时候就要转化为绝对路径。 /*** url补全,相对url转化为绝对url* 作用是补全url*/function url2abs($srcurl,$baseurl){ $srcinfo = parse_url($srcurl); //print_r($srcinfo); if(isset($srcinfo)) { return $srcurl; } $baseinfo = parse_url($baseurl); $url = $baseinfo.'://'.$basein
原本我想要写造福后人,请为你的程序编写单元测试吧。突然觉得这样写会不会太高尚了一些,想想还是不给以后的自己找麻烦,编写单元测试比较好。一直都在隐式的做着单元测试你可能没有听过单元测试,或者听过,但没有使用单元测试框架来做单元测试,又或者对单元测试框架不屑一顾等等...(等等,这不是在说我自己嘛)好了,在你没有使用单元测试框架之前,其实你一直在不知不觉中使用单元测试。比如,当你写完了一个方法的时候,你会在下面调用这个方法,然后看看运行的结果,哦,对了,要的就是这个结果。这就是一个单元测试啊!你对这个方法做了一个测试,传n个参数进入,输出一个结果,结果与预期一致,通过;结果与预期不一致,失败,de
来说说php的empty,isset,is_null 与!,这几个都是if语句中比较常见的判断逻辑。但是有时候用的很纠结,甚至看别人写的程序里面也很纠结。特地梳理梳理,避免踩坑先来定义一些东西<?php$a;$b=0;$c=array();$d='';$e=null;empty,用了会上瘾这是一个用了会上瘾的语言结构!多好,empty可接受的参数是一个变量,任意类型,哪怕是变量不存在,只要变量被boolean转换之后是false(参考:php的boolean都有哪些),那么empty返回的就是false,并且不会出现警告!等价于不过注意的是,empty里面不能使用表达式(在php<
最佳的Sublime Text 插件朋友们你们好!我尝试着收集了最佳的ST插件,这些插件真的会改善你的工作流程。我搜索了很多网站,下面是我的成果。WebInspector在 JavaScript调试方面,这是一个令人惊讶的工具,Sublime上的完整的代码检查工具。功能:使用绝对路径储存在用户设置中的项目断点,控制台,分步和断点调试器,栈追踪。这些都能够很棒的工作!而且Mozilla还提供了一个插件Fireplay让你连接到Firefox 开发工具和最简单的调试器JSHintEmmet编辑器中最流行的插件之一。Emmet,前身Zen Coding也是web开发者提高生产力最有效的方法之一。按下
作为一个php开发者,换工作环境的时候可能会重新配置编辑器,这里给出一个比较好的环境(也是我的常用环境)。配置篇每家公司都会有内部的规范,但是只要公司不是特别奇葩,那么规范一般是大同小异。根据规范来设定编辑器,那么写出来的代码则很容易符合规范了。此外,一个设置好的编辑器能够大大提高编码效率!下面是我的配置,可以根据注释自行调整{ // 粗体文本 "bold_folder_labels": true, // 显示所有的空白字符,这样可以看出空格和tab "draw_white_space": "all", // 设置字体 "font_size": 15,
赞赏微信赞赏支付宝赞赏