【.net新闻管理系统源码】【easyui行事件源码】【e语音CF源码】nlpir 源码

2024-11-25 02:02:22 来源:返利app源码 吾爱 分类:时尚

1.中文分词工具在线PK新增:FoolNLTK、LTP、StanfordCoreNLP

nlpir 源码

中文分词工具在线PK新增:FoolNLTK、LTP、StanfordCoreNLP

       中文分词在线PK之旅持续推进,继上篇《五款中文分词工具在线PK: Jieba,.net新闻管理系统源码 SnowNLP, PkuSeg, THULAC, HanLP》之后,此次又新增了三个中文分词工具,分别是FoolNLTK、哈工大LTP(pyltp, ltp的python封装)和斯坦福大学的CoreNLP(stanfordcorenlp is a Python wrapper for Stanford CoreNLP),现在可在AINLP公众号进行测试:中文分词 我爱自然语言处理。

       以下是在Python3.x & Ubuntu. 的环境下测试及安装这些中文分词器:6)FoolNLTK:github.com/rockyzhengwu...

       特点:可能不是最快的开源中文分词,但很可能是最准的开源中文分词。基于BiLSTM模型训练而成,easyui行事件源码包含分词,词性标注,实体识别,都有比较高的准确率。用户自定义词典,可训练自己的e语音CF源码模型,批量处理,定制自己的模型。get clone github.com/rockyzhengwu... cd FoolNLTK/train 详细训练步骤可参考文档。

       仅在linux Python3 环境测试通过。

       安装,依赖TensorFlow,php源码获取gps 会自动安装:pip install foolnltk

       中文分词示例:

       7) LTP: github.com/HIT-SCIR/ltp

       pyltp: github.com/HIT-SCIR/pyl...

       pyltp 是语言技术平台(Language Technology Platform, LTP)的Python封装。

       安装 pyltp 注:由于新版本增加了新的第三方依赖如dynet等,不再支持 windows 下 python2 环境。使用 pip 安装 使用 pip 安装前,请确保您已安装了 pip $ pip install pyltp 接下来,需要下载 LTP 模型文件。下载地址 - `模型下载 ltp.ai/download.html`_ 当前模型版本 - 3.4.0 注意在windows下 3.4.0 版本的c语言大漠源码语义角色标注模块模型需要单独下载,具体查看下载地址链接中的说明。请确保下载的模型版本与当前版本的 pyltp 对应,否则会导致程序无法正确加载模型。从源码安装 您也可以选择从源代码编译安装 $ git clone github.com/HIT-SCIR/pyl... $ git submodule init $ git submodule update $ python setup.py install 安装完毕后,也需要下载相应版本的 LTP 模型文件。

       这里使用"pip install pyltp"安装,安装完毕后在LTP模型页面下载模型数据:ltp.ai/download.html,我下载的是 ltp_data_v3.4.0.zip ,压缩文件有多M,解压后1.2G,里面有不同NLP任务的模型。

       中文分词示例:

       8) Stanford CoreNLP: stanfordnlp.github.io/C... stanfordcorenlp: github.com/Lynten/stanf...

       这里用的是斯坦福大学CoreNLP的python封装:stanfordcorenlp

       stanfordcorenlp is a Python wrapper for Stanford CoreNLP. It provides a simple API for text processing tasks such as Tokenization, Part of Speech Tagging, Named Entity Reconigtion, Constituency Parsing, Dependency Parsing, and more.

       安装很简单,pip即可:pip install stanfordcorenlp

       但是要使用中文NLP模块需要下载两个包,在CoreNLP的下载页面下载模型数据及jar文件,目前官方是3.9.1版本:nlp.stanford.edu/softwa...

       第一个是:stanford-corenlp-full---.zip 第二个是:stanford-chinese-corenlp----models.jar

       前者解压后把后者也要放进去,否则指定中文的时候会报错。

       中文分词使用示例:

       最后再说一下,原本计划加上对NLPIR中文分词器的支持,但是发现它的license需要定期更新,对于长久放server端测试不太方便就放弃了;另外之所以选择python,因为我用了Flask restful api框架,也欢迎推荐其他的中文分词开源框架,如果它们有很好的Python封装的话,这里可以继续添加。

更多资讯请点击:时尚

热门资讯

flash 源码素材

2024-11-25 01:381295人浏览

sockcapt源码

2024-11-25 01:10443人浏览

零壹源码_零壹游戏官网

2024-11-25 00:271439人浏览

deliph源码

2024-11-25 00:141426人浏览

寄售卡源码_寄售卡平台

2024-11-25 00:10367人浏览

推荐资讯

10010钓鱼源码_2020钓鱼源码

1.可可粉能钓鱼吗?可可粉能钓鱼吗? 干嘛要代替?很多饵料里面都加有很多拉丝粉了,除了鲤鱼饵料需要一点拉丝粉其他的基本可以不用,只需要多打几下就可以了 1、将新鲜豆腐渣~千克先捂闷,闷出酸臭味

微笑源码

1.《源代码》赏析 - 平行宇宙的思考2.在程序员节的节日里送给程序员的祝福语3.素材什么意思4.使用四叉树优化碰撞检测《源代码》赏析 - 平行宇宙的思考 在科幻领域,平行宇宙的概念如同璀璨的星辰

opengl 源码

1.CMake搭建OpenGL开发环境2.如何在Linux下使用OpenGL+ C++开发3.OpenGL中gltranslate()的函数代码,我会用这个函数,我要的