有没有谁使用过CCL语料库检索系统?
有没有谁使用过CCL语料库检索系统?[兔子][可怜]求指点迷津
CCL语料库检索系统(网络版) 这个 我用过 它里面的 古文搜索都很准确 而且 描述的到位 比较简单 直接点击这个网页后 输入你需要查询的语料 然后 点击查询就好了啊 (为您解答,希望帮到您,如有用,请选下方“对我有用”谢谢采纳.)
好
木有有用过 不过我还是想当雷锋
一 关于CCL语料库及其检索系统 1。1 CCL语料库及其检索系统为纯学术非盈利性的。不得将本系统及其产生的检索结果用于任何商业目的。CCL不承担由此产生的一切后果。 1。2 本语料库仅供语言研究参考之用。语料本身的正确性需要您自己加以核实。
1。3 语料库中所含语料的基本内容信息可以在“高级搜索”页面上,点击相应的链接查看。比如: “作者列表”:列出语料库中所包含的文件的作者 “篇名列表”:列出语料库中所包含的篇目名 “类型列表”:列出语料库中文章的分类信息 “路径列表”:列出语料库中各文件在计算机中存放的目录 “模式列表”:列出语料库中可以查询的模式 1。
4 语料库中的中文文本未经分词处理。 1。5 检索系统以汉字为基本单位。 1。6 主要功能特色: 支持复杂检索表达式(比如不相邻关键字查询,指定距离查询,等等); 支持对标点符号的查询(比如查询“?”可以检索语料库中所有疑问句); 支持在“结果集”中继续检索; 用户可定制查询结果的显示方式(如左右长度,排序等); 用户可从网页上下载查询结果(text文件); 二 关于查询表达式 本节对CCL语料库检索系统目前支持的查询表达式加以说明。
2。1 特殊符号 查询表达式中可以使用的特殊符号包括8个: | $ # + - ~ ! : 这些符号分为四组: Operator1: | Operator2: $ # + - ~ Operaotr3: ! Delimiter: : 符号的含义如下: (一) Operator1: Operator1是二元操作符,它的两边可以出现“基本项”(关于“基本项”的定义见2。
2) (1) | 相当于逻辑中的“或”关系。 (二) Operator2:Operator2是二元操作符,它的两边可以出现“简单项”(关于“简单项”的定义见2。3) (2) $ 表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。
两个“简单项”之间相隔字数小于或等于Number (3) # 表示它两边的“简单项”出现于同一句中,不考虑前后次序。两个“简单项”之间相隔字数小于或等于Number (4) + 表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。
两个“简单项”之间相隔字数刚好等于Number (5) - 表示它左边的“简单项”出现于句子中,并且,在右边相隔Number个字的范围内,-号右边的“简单项”不出现。 (6) ~ 表示它左边的“简单项”出现于句子中,并且,在左边相隔Number个字的范围内,~号右边的“简单项”不出现。
(三)Operator3:Operator3是一元操作符。 (7) ! 表示它后面的“简单项”是本次查询的主关键字符串,显示查询结果时以该“简单项”作为中心来进行定位。 注意: Operator2后面的Number是必须的,不能省略。
Number=0表示相邻,Number=1表示间隔1个单位,其余依此类推。 (四)Delimiter:西文冒号 : 是分隔符 (8) : 跟在 path,author,name,type,pattern 等关键字后面,用于分隔关键字和它们的取值。
这样形成的查询式我们称之为“过滤项”(见下面2。5) 注意:上述特殊字符不能作为基本项在语料库中进行检索。path,author等关键字可以作为基本项进行检索。 2。2 基本项 指不包含特殊符号和空格的连续字符串 2。3 简单项 简单项可以由以下三种形式的序列组成 (1) 基本项 (2) 基本项1 Operator1 基本项2 Operator1 。
。。 (3) (基本项1 Operator1 基本项2 Operator1 。。。) 注意:在实际表达式中,Operator1 前后不能有空格 2。4 复杂项 复杂项可以由以下三种形式的序列组成 (1) 简单项 (2) 简单项1 Operator2 Number 简单项2 (3) 简单项1 Operator2 Number Operator3 简单项2 其中第二种形式,等价于 Operator3 简单项1 Operator2 Number 简单项2,换句话说,如果以第一个简单项作为查询结果的显示中心,!可以省略。
注意:Number为0和正整数。Operator2,Operator3前后均不能有空格 2。5 过滤项 过滤项可以包含以下表达式: (1)author:简单项 (2)name:简单项 (3)path:简单项 (4)type:简单项 (5)pattern:简单项 (“author:简单项”的含义是指“author:”后面跟的表达式是上面2。
3“简单项”所定义的字符串,其余类推)。
这中专业知识 还是最好自己好好学
没用过
答:属于。 九企科技详情>>
答:详情>>
答:网络技术电子邮件有了通达全球的Internet后,人们首先想到的是可以利用它来提供个人之间的通信,而且这种通信应能兼具电话的速度和邮政的可靠性等优点详情>>
答:分享个:P2P终结者软件~就挺厉害的~详情>>