论文部落小编回答:
Coh-Metrix是由美国孟菲斯大学的设计开发的一个在线语料分析工具。代写论文分析,该工具合理地利用了计算语言学、语料库语言学、信息检索等多种自然的语言的分析技术,可以有效地测量文本的词汇、语法、语义与语篇特征。尤为重要的是,Coh-Metrix采用潜伏语义分析法提取文本的各种变量。这种深层次的语义相关性分析方法可以准确地计算语言单位的各种特征。Coh-Metrix测量的语言指数高达56个,涉及语篇的衔接与连贯、句法复杂度、词汇信息等多个方面。根据各指数测量的主要语言特征,我们可以将其大致分为五大类:(1)语篇基本情况;(2)语篇衔接与连贯;(3)词汇运用;(4)句法复杂性;(5)语篇内容。下面,我们重点介绍后四类指数的主要内容。
Coh-Metrix测量语篇衔接连贯的指数有27个,涉及各种常见的衔接手段,如指称和连接等。指称包括回指、互指等。其中,互指主要有三种,即毗邻论元重叠、论元重叠和毗邻词干重叠。毗邻论元重叠指共享一个或多个论元的相邻句子,相邻的两个句子共享论元studies。论元重叠指同一段落内共享一个或多个论元的相邻句对占句子总数的比例,该指数有助于确定同一段落中的所有句子是否服务于同一命题。毗邻词干重叠则指相邻句子共享一个或多个词干,即相邻句子中出现词干相同的词,evaporates和evaporation的词干相同,因此两个句子间存在词干重叠。连接则包括各种连接词和操作词的使用。此外,还有情景类衔接手段如时间衔接(动词时与体的复现)、空间衔接(使用表示场所与动作的词)、意向性衔接(使用表示意向性行为的词)和因果衔接(使用表因果关系的词)等。
在反映词汇使用情况的指数中,与实词相关的指数有10个。这些指数从不同的角度反映了词汇的丰富性或“抽象程度”。譬如,类型词标比是反映词汇丰富性的重要指标,它与词汇原创性、词汇复杂性和词汇多样性等息息相关,其比例越高,表明语篇的用词越丰富。名词上义词值和动词上义词值则反映名词和动词的“抽象程度”。一般地讲,文本的上义词值越低表明其用词越抽象。
句法层面的7个指数反映句子结构的两大特征:复杂性与多样性。其中,名词短语、名词短语前修饰语、上层结构成分和主要动词前成分表明语篇中句子结构的复杂程度,其值越高,句子越复杂。因为名词短语和名词前修饰成分多意味着句子的主语和宾语结构复杂;动词前成分多意味着谓语动词比较复杂,或者其前面的句子成分复杂;而上层句法成分多则表明句子的结构密度大,句子的结构更加复杂。毗邻句子的句法相似性,段落间所有句子的句法相似性,段落内所有句子的句法相似性则是衡量句子与句子之间、段落内各个句子之间以及不同段落之间句子结构相似程度的重要指标。句子结构相似度高,表明句子结构单一,缺乏多样性。
反映语篇内容的指数有7个。其中,主题句表明语篇信息是否围绕同一主题展开;语类纯度说明语篇内容是否属于同一语类;语篇可读性程度和难度级别反映文本内容的可读性程度和语篇整体难度。另外三个指数一毗邻句中潜在语义、所有句中潜在语义和段落间潜在语义,则通过分析句子之间的深层语义关系揭示语篇中的句子是否服务于同一命题。具体地讲,毗邻句子间潜在语义值指的是相邻句子之间潜在语义的余弦均值。如果相邻的两个句子的潜在语义余弦值接近1,则表明这两个句子有较大的语义相关性,同时可以说明这两个句子所讨论的是同一命题或相似命题。所有句子间潜在语义值指语篇中所有句子间的潜在语义余弦均值,它表明所有句子是否服务于同一命题。段落间潜在语义值则指同一文本内所有段落之间的潜在语义余弦均值,它表明不同的段落是否围绕同一主题展开。代写论文说,可见,这些指数能有效地考察语篇内容方面的连续性。