前言

HanLP2.1支持包括简繁中英日俄法德在内的104种语言上的10种联合任务：分词（粗分、细分2个标准，强制、合并、校正3种）、词性标注（PKU、863、CTB、UD四套词性规范）、命名实体识别（PKU、MSRA、OntoNotes三套规范）、依存句法分析（SD、UD规范）、成分句法分析、语义依存分析（SemEval16、DM、PAS、PSD四套规范）、语义角色标注、词干提取、词法语法特征提取、抽象意义表示（AMR）。

HanLP提供RESTful和native两种API，分别面向轻量级和海量级两种场景。

在线演示资源、HanLP教学资源、HanLP GitHub等。

安装

Native 安装

创建虚拟环境（非必要操作）

conda create -n hanlp python=3.7

安装HanLP（在线安装失败时，可选择离线安装）

pip install hanlp-2.1.0a36.tar.gz

RESTful 安装

pip install hanlp_restful

HanLP的使用（以native为例）

查询HanLP中所有的预训练模型

hanlp.pretrained.ALL

使用HanLP进行预定义任务执行

import hanlphanlp.load(hanlp.pretrained.mtl.CLOSE_TOK_POS_NER_SRL_DEP_SDP_CON_ELECTRA_SMALL_ZH)hanlp.HanLP(['清华大学研究核能的教授有哪些'])

可选子任务功能

hanlp.HanLP(['清华大学研究核能的教授有哪些'], tasks='tok')hanlp.HanLP('清华大学研究核能的教授有哪些', tasks=['pos', 'dep'])hanlp.HanLP('清华大学研究核能的教授有哪些', tasks=['pos/863', 'dep'])

可视化输出

hanlp.HanLP(['清华大学研究核能的教授有哪些']).pretty_print()

工具学习系列

以下为多个工具的词性标注、依存句法分析、语义依存分析等能力对比：

	pos/tag	dep	sdp
LTP
SpaCy	基于扩展标注
DDParser
HanLP	、、DM、PAS、PSD	、
Stanford CoreNLP	Penn Chinese Treebank Tag Set（）
jieba	兼容的标记法	不支持	不支持

转载地址：http://jflh.baihongyu.com/

你可能感兴趣的文章