ITPub博客

首页 > 大数据 > 数据分析 > GitHub十周岁HanLP自然语言处理包用户量超越CoreNLP

GitHub十周岁HanLP自然语言处理包用户量超越CoreNLP

数据分析 作者:本宫没空6 时间:2018-10-10 11:31:15 0 删除 编辑

GitHub 十周岁 HanLP 自然语言处理包用户量超越 CoreNLP

 

在本周, GitHub 终于度过了属于它自己的十周岁生日。这个在 2008 年由 3 个来自旧金山的年轻人创建的基于 Git 的代码托管网站,先后超越了元老级的 SourceForge 和背景强大的 Google Code ,成为了全世界范围内最受欢迎的代码托管网站。

 

“十年前的今天, GitHub 正式上线。最一开始,我们只有一个特别简单的目标:链接所有的开发者,让他们用 Git 更轻松地进行项目协作。”联合创始人 Chris Wanstrath 在博客里写道,“十年过去了,我们作为公司,作为平台都有了很大的变化,但 GitHub 存在的意义从未改变。”

截至到去年 5 月底, GitHub 完成了第 1 亿个 PR 合并请求命令。截至今天, GitHub 上已经能够拥有超过 8000 万个 repo ,活跃用户达到 2700 万人,超过 150 万家公司和机构进驻。大快搜索的 HanLp 自然语言处理开源项目同样进驻了 GitHub

GitHub 团队作为对十周年的纪念和庆祝,并没有像大多数公司一样选择回顾公司的发展历史,而是整理了一份过去十年的几大里程碑事件。这份光荣,不止属于平台自己,更是属于那些为了让这个世界变得更好,通过 Git GitHub 、用 JS Python 和各种语言共享代码的人们。

GitHub 十周年之际,大快搜索 AI 研究小组的,自然语言处理专家 Hancks 所主持的 HanLP 开源项目,全球用户量首次超过了斯坦福大学的 CoreNLP ,以及老牌的自然语言处理开包 Ansj ,成为全球范围内最受开发人员喜爱的自然语言处理技术。

 

 

2014 年首次发布,通过 3 年的不断迭代, HanLP 的分词准确性和分词速率得到了极大的提升。据阿里杨尚川的一份测评报告显示, HanLP 的分次准确率在全球排名第三,分词速度在全球排名第一。卓越的性能自然带来了大量的使用者。终于,在太平洋时间 10 25 日, GitHub HanLP 的用户量超过 Stanford-CoreNLP

 

自然语言处理是人工智能的一个重要分支, HanLP 的用户量证明了国产技术的高性能与可靠性,也再一次证明了大快搜索用心做技术、专注于大数据与人工智能基础软件的决心。大快今后也将开发出更多组件用于建设大数据与人工智能生态,绘出人工智能与大数据的中国智慧。


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31555245/viewspace-2215815/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2018-09-18

  • 博文量
    54
  • 访问量
    19410