我爱电子书-《Java自然语言处理》| pdf + epub + mobi + awz3, 高清版, 带目录，Kindle版, 多看精排版下载

注重体验与质量的电子书资源下载网站

分类于: 编程语言计算机基础

简介

Java自然语言处理豆 0.0分

资源最后更新于 2020-03-29 01:25:45

作者：〔美〕理查德M.里斯

译者：邹伟孙逢举

出版社：出版社机械工业出版社

出版日期：2018-03

ISBN：9787111592112

文件格式： pdf

标签：计算机编程 Java 智能系统与技术丛书

简介· · · · · ·

自然语言处理（NLP）已用于解决各种各样的问题，包括对搜索引擎的支持，对网页文本的总结与分类，以及结合机器学习技术解决诸如语音识别、查询分析等问题。它已经在任何包含有用信息的文件中使用。理查德M.里斯（Richard M.Reese），曾就职于学术界和工业界。他曾在电信和航天工业领域工作17年，期间曾担任研发、软件开发、监督和培训等多个职位。他目前任教于塔尔顿州立大学，运用他多年来积累的行业经验来完善他的课程。

直接下载

简介

Java自然语言处理 豆 0.0分

简介· · · · · ·

目录

译者序

作者简介

审校者简介

前言

第1章 NLP简介

1.1 什么是NLP

1.2 为何使用NLP

1.3 NLP的难点

1.4 NLP工具汇总

1.4.1 Apache OpenNLP

1.4.2 Stanford NLP

1.4.3 LingPipe

1.4.4 GATE

1.4.5 UIMA

1.5 文本处理概览

1.5.1 文本分词

1.5.2 文本断句

1.5.3 人物识别

1.5.4 词性判断

1.5.5 文本分类

1.5.6 关系提取

1.5.7 方法组合

1.6 理解NLP模型

1.6.1 明确目标

1.6.2 选择模型

1.6.3 构建、训练模型

1.6.4 验证模型

1.6.5 使用模型

1.7 准备数据

1.8 本章小结

第2章 文本分词

2.1 理解文本分词

2.2 什么是分词

2.3 一些简单的Java分词器

2.3.1 使用Scanner类

2.3.2 使用split方法

2.3.3 使用BreakIterator类

2.3.4 使用StreamTokenizer类

2.3.5 使用StringTokenizer类

2.3.6 使用Java核心分词法的性能考虑

2.4 NLP分词器的API

2.4.1 使用OpenNLPTokenizer类分词器

2.4.2 使用Stanford分词器

2.4.3 训练分词器进行文本分词

2.4.4 分词器的比较

2.5 理解标准化处理

2.5.1 转换为小写字母

2.5.2 去除停用词

2.5.3 词干化

2.5.4 词形还原

2.5.5 使用流水线进行标准化处理

2.6 本章小结

第3章 文本断句

3.1 SBD方法

3.2 SBD难在何处

3.3 理解LingPipe的HeuristicSentenceModel类的SBD规则

3.4 简单的Java SBD

3.4.1 使用正则表达式

3.4.2 使用BreakIterator类

3.5 使用NLP API

3.5.1 使用OpenNLP

3.5.2 使用Stanford API

3.5.3 使用LingPipe

3.6 训练文本断句模型

3.6.1 使用训练好的模型

3.6.2 使用SentenceDetectorEvaluator类评估模型

3.7 本章小结

第4章 人物识别

4.1 NER难在何处

4.2 NER的方法

4.2.1 列表和正则表达式

4.2.2 统计分类器

4.3 使用正则表达式进行NER

4.3.1 使用Java的正则表达式来寻找实体

4.3.2 使用LingPipe的RegExChunker类

4.4 使用NLP API

Java自然语言处理豆 0.0分

第1章　NLP简介

1.1　什么是NLP

1.2　为何使用NLP

1.3　NLP的难点

1.4　NLP工具汇总

1.4.1　Apache OpenNLP

1.4.2　Stanford NLP

1.4.3　LingPipe

1.4.4　GATE

1.4.5　UIMA

1.5　文本处理概览

1.5.1　文本分词

1.5.2　文本断句

1.5.3　人物识别

1.5.4　词性判断

1.5.5　文本分类

1.5.6　关系提取

1.5.7　方法组合

1.6　理解NLP模型

1.6.1　明确目标

1.6.2　选择模型

1.6.3　构建、训练模型

1.6.4　验证模型

1.6.5　使用模型

1.7　准备数据

1.8　本章小结

第2章　文本分词

2.1　理解文本分词

2.2　什么是分词

2.3　一些简单的Java分词器

2.3.1　使用Scanner类

2.3.2　使用split方法

2.3.3　使用BreakIterator类

2.3.4　使用StreamTokenizer类

2.3.5　使用StringTokenizer类

2.3.6　使用Java核心分词法的性能考虑

2.4　NLP分词器的API

2.4.1　使用OpenNLPTokenizer类分词器

2.4.2　使用Stanford分词器

2.4.3　训练分词器进行文本分词

2.4.4　分词器的比较

2.5　理解标准化处理

2.5.1　转换为小写字母

2.5.2　去除停用词

2.5.3　词干化

2.5.4　词形还原

2.5.5　使用流水线进行标准化处理

2.6　本章小结

第3章　文本断句

3.1　SBD方法

3.2　SBD难在何处

3.3　理解LingPipe的HeuristicSentenceModel类的SBD规则

3.4　简单的Java SBD

3.4.1　使用正则表达式

3.4.2　使用BreakIterator类

3.5　使用NLP API

3.5.1　使用OpenNLP

3.5.2　使用Stanford API

3.5.3　使用LingPipe

3.6　训练文本断句模型

3.6.1　使用训练好的模型

3.6.2　使用SentenceDetectorEvaluator类评估模型

3.7　本章小结

第4章　人物识别

4.1　NER难在何处

4.2　NER的方法

4.2.1　列表和正则表达式

4.2.2　统计分类器

4.3　使用正则表达式进行NER

4.3.1　使用Java的正则表达式来寻找实体

4.3.2　使用LingPipe的RegExChunker类

4.4　使用NLP API

4.4.1　使用OpenNLP进行NER

4.4.2　使用Stanford API进行NER

4.4.3　使用LingPipe进行NER

4.5　训练模型

4.6　本章小结

第5章　词性判断

5.1　词性标注