ITPub博客

首页 > 人工智能 > 自然语言

关于 “自然语言” 的内容如下:

  • Hanlp在ubuntu中的使用方法介绍

    HanLP的一个很大的好处是离线开源工具包,换而言之,它不仅提供免费的代码免费下载,而且将辛苦收集的词典也对外公开啦,此诚乃一大无私之举.我在安装的时候,主要参照这份博客: blog.csdn.net/article/details?id=50938796 不过该博客主要介绍的是windows如何使用hanlp,而ubuntu是linux的,所以会有所区别.下面我主要介绍的是在

    adnb34g 自然语言 340 2018-12-10 10:21
  • 配置Hanlp自然语言处理进阶

    中文分词中有众多分词工具,如结巴、hanlp、盘古分词器、庖丁解牛分词等;其中庖丁解牛分词仅仅支持java,分词是HanLP最基础的功能,HanLP实现了许多种分词算法,每个分词器都支持特定的配置。接下来我将介绍如何配置Hanlp来开启自然语言处理之旅,每个工具包都是一个非常强大的算法集合,所以小编以后将花一些时间去看看里面源码如何。

    adnb34g 自然语言 342 2018-12-07 10:18
  • 手机删除照片恢复,如何恢复

      手机删除照片恢复?手机现在对于我们来说是比较重要的,因为现在的我们几乎离不开我们的手机,我们会用我们的手机做各种事情,但是我们比较常使用的就是使用我们的手机去进行拍照。  我们会拍一些生活中比较美好的场面,以便以后我们可以更好的去进行我们回忆我们的照片,因此我们的手机上会保存一些美好的照片,那么若是我们删除了,该怎么恢复呢,没有任何的备份的话,下面的方法可以试试。  1、首先可以在此恢复过程中

    拥抱太阳的熊猫 自然语言 341 2018-12-05 15:02
  • HanLP中人名识别分析详解

    这篇文章里面没有写维特比分词算法的详细过程,以及转移矩阵的生成过程,以后有时间再补上。看源码,对隐马模型的理解又加深了一点,感受到了理论的东西如何用代码一步步来实现。由于我也是初学,对源码的理解不够深入或者存在一些偏差,欢迎批评指正。

    adnb34g 自然语言 342 2018-12-05 09:59
  • HanLP二元核心词典详细解析

    本文分析:HanLP版本1.5.3中二元核心词典的存储与查找。当词典文件没有被缓存时,会从文本文件CoreNatureDictionary.ngram.txt中解析出来存储到TreeMap中,然后构造start和pair数组,并基于这两个数组实现词共现频率的二分查找。当已经有缓存bin文件时,那直接读取构建start和pair数组,速度超快。

    adnb34g 自然语言 341 2018-12-03 09:55
  • hanlp中文智能分词自动识别文字提取实例

    hanlp中文智能分词自动识别文字提取实例

    adnb34g 自然语言 341 2018-11-30 11:02
  • Hanlp在java中文分词中的使用介绍

    Hanlp在java中文分词中的使用介绍

    adnb34g 自然语言 340 2018-11-30 11:01
  • 自然语言处理怎么最快入门?

    自然语言处理说白了,就是让机器去帮助我们完成一些语言层面的事情,典型的比如:情感分析、文本摘要、自动问答等等。我们日常场景中比较常见到的类似Siri、微软小冰之类的,这些的基础都是自然语言处理,另外还有一些语音处理,这就暂且不表了。总之,你看到的机器与人利用语言交互,用机器模拟人脑阅读,对话,评论等等这些的基础都是自然语言处理的范畴之内。

    adnb34g 自然语言 340 2018-11-28 09:44
  • 腾讯AI Lab:深度解读AI辅助翻译的研究及应用

    http://blog.itpub.net/31559354/viewspace-2220356/11月13日,深圳 - 腾讯AI Lab今日发布了一款AI辅助翻译产品 - “腾讯辅助翻译”(Transmart),可满足用户快速翻译的需求,用AI辅助人工翻译提高效率和质量。该产品采用业内领先的人机交互式机器翻译技术,融合神经网络机器翻译、统计机器翻译、输入法、语义理解、数据挖掘等多项前沿技术,配合

    dicksonjyl560101 自然语言 337 2018-11-28 08:20
  • 目前常用的自然语言处理开源项目/开发包大汇总

    中文主要有 : NLTK , FoolNLTK , HanLP ( java 版本), pyhanlp ( python 版本), Ansj , THULAC ,结巴分词, FNLP ,哈工大LTP 

    dicksonjyl560101 自然语言 344 2018-11-28 08:16
  • 目前常用的自然语言处理开源项目/开发包大汇总

    中文主要有:NLTK,FoolNLTK,HanLP(java版本),pyhanlp(python版本),Ansj,THULAC,结巴分词,FNLP,哈工大LTP,中科院ICTCLAS分词,GATE,SnowNLP,东北大学NiuTrans,NLPIR,;

    adnb34g 自然语言 371 2018-11-26 10:00
  • pyhanlp 文本聚类详细介绍

    文本聚类简单点的来说就是将文本视作一个样本,在其上面进行聚类操作。但是与我们机器学习中常用的聚类操作不同之处在于。

    adnb34g 自然语言 345 2018-11-23 09:24
  • 最全NLP反作弊攻略,从马蜂窝注水事件说起

    在开始正文之前,我们先回顾一下事件背景。10月21日,朋友圈被一篇名为《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》的文章刷屏。文章作者小声比比指控在线旅游网站马蜂窝存在点评大量造假的情况,包括从其他网站如大众点评、携程等抓取相关点评,及通过水军撰写虚拟点评。

    大数据文摘 自然语言 348 2018-11-22 14:35
  • Spring Boot中对自然语言处理工具包hanlp的调用详解

    HanLP 是基于 Java开发的 NLP工具包,由一系列模型与算法组成,目标是普及自然语言处理在生产环境中的应用。而且 HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点,因此十分好上手,本文就结合 Spring Boot来将 HanLP用起来!

    adnb34g 自然语言 373 2018-11-21 11:17
  • pyhanlp 停用词与用户自定义词典功能详解

    关于停用词,我同样先给出了一个简单的例子,你可以使用这个例子来完成你所需要的功能。要注意的一点是,因为java中的类所返回的数据类型与Python不统一,所以当你使用不同的函数的时候,一定要先检查输出结果在Python中的类型,不然可能会出现意想不到的问题。

    adnb34g 自然语言 339 2018-11-16 09:43
  • Spark应用HanLP对中文语料进行文本挖掘--聚类详解教程

    在Kmeans算法中,一个样本需要使用数值类型,所以需要把文本转为数值向量形式,这里在Spark中有两种方式。其一,是使用TF-IDF;其二,使用Word2Vec。这里暂时使用了TF-IDF算法来进行,这个算法需要提供一个numFeatures,这个值越大其效果也越好,但是相应的计算时间也越长,后面也可以通过实验验证。

    adnb34g 自然语言 341 2018-11-12 10:27
  • 自然语言处理之:搭建基于HanLP的开发环境

    HanLP几乎所有的功能都可以通过工具类HanLP快捷调用,当你想不起来调用方法时,只需键入HanLP.,IDE应当会给出提示,并展示HanLP完善的文档。所有Demo都位于com.hankcs.demo下,比文档覆盖了更多细节,更新更及时,强烈建议运行一遍。

    adnb34g 自然语言 347 2018-11-09 09:39
  • 一文看懂NLP神经网络发展历史中最重要的8个里程碑!

    一文看懂NLP神经网络发展历史中最重要的8个里程碑! https://mp.weixin.qq.com/s/gNZiiEfsQjlF9tArNDIt5Q                                 &

    dicksonjyl560101 自然语言 339 2018-11-08 15:02
  • hanlp源码解析之中文分词算法详解

    词图指的是句子中所有词可能构成的图。如果一个词A的下一个词可能是B的话,那么A和B之间具有一条路径E(A,B)。一个词可能有多个后续,同时也可能有多个前驱,它们构成的图我称作词图。

    adnb34g 自然语言 341 2018-11-07 10:24
  • HanLP 关键词提取算法分析详解

    前面提到,若干句话分词之后,得到的一个个的词,或者叫Term。假设窗口大小为5。解释一下TextRank算法提取关键词的Java实现文章中提到的如何确定某个Term有哪些邻接Term。

    adnb34g 自然语言 343 2018-11-05 09:56
点击加载更多下一页

成为大咖

联系我们
itpub
help@itpub.net
18603471036
扫描二维码联系客服
关于 广告服务 使用条款
京ICP备16024965号
经营性网站备案信息
网络110报警服务
中国互联网举报中心
北京互联网违法和不良信息举报中心