logo
分类于: 互联网 职场办公

简介

海量数据管理――文档和图像的压缩和索引

海量数据管理――文档和图像的压缩和索引 0.0分

资源最后更新于 2020-10-29 12:52:11

作者:Lan H.Witten(美)

译者:张仲颖/等

出版社:科学出版社/龙门书局

出版日期:1996-01

ISBN:9787030055231

文件格式: pdf

标签: 海量数据 海量数据管理 大数据 计算机 数据管理 学习系列 全文检索 jazz

简介· · · · · ·

内容提要

本书是一本讨论如何管理海量数据的专著,主要内容涉及文档和图像的压缩和索

引:概述、文本压缩、索引、查询、索引构造、图像压缩、文本图像、文本与图像混合、实现

和信息爆炸,最后是mg系统指南及词汇表。

本书适用于对计算机应用、数据库设计与管理、图像处理和文字处理感兴趣的广大

技术人员,还适用于大中专院校师生。

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

第一章 概述
1.1文档数据库
1.2文档压缩
1.3索引
1.4文档图像
1.5海量文档管理系统
1.6进一步阅读
第二章 文本压缩
2.1模型
2.2自适应模型
2.3编码
2.4符号模型
2.5字典模型
2.6同步
2.7性能比较
2.8进一步阅读
第三章 索引
3.1样本文档集合
3.2倒置文件索引
3.3倒置文件压缩
3.4索引压缩方法性能
3.5署名文件和位图
3.6字体转换及词根化和无用词
3.7索引方法比较
3.8进一步阅读
第四章 查询
4.1词典访问
4.2部分指定查询术语
4.3布尔查询处理
4.4排列及信息检索
4.5检索有效性估算
4.6余弦法的实现
4.7交互式检索
4.8进一步阅读
第五章 索引构造
5.1基于内存的倒置
5.2基于排序分类的倒置
5.3使用索引压缩
5.4压缩内存中倒置
5.5索引方法的对比
5.6构造署名文件和位图
5.7动态集合
5.8进一步阅读
第六章 图像压缩
6.1图像类型
6.2二值图像的CCITT传真标准
6.3基于上下文的二值图像压缩
6.4JBIG:二值图像的标准
6.5JPEG:连续色调图像的标准
6.6灰度图像的无损压缩
6.7图像的递增传输
6.8图像压缩技术小结
6.9进一步阅读
第七章 文本图像
7.1文本图像压缩的概念
7.2有损及无损压缩
7.3标志提取
7.4模板匹配
7.5从标志到符号
7.6对文本图像的成分进行编码
7.7性能:有损及无损模式
7.8对系统的考虑
7.9进一步阅读
第八章 混合图文
8.1确定方向
8.2分割
8.3分类
8.4进一步阅读
第九章 实现
9.1文本压缩
9.2文本压缩性能
9.3图像和文本图像
9.4索引构造
9.5索引压缩
9.6查询处理
9.7进一步阅读
第十章 信息爆炸
10.1信息技术发展两千年
10.2Internet:一种全球信息资源
10.3纸张问题
10.4面对信息爆炸
10.5使海量数据管理更好
10.6对生活的个人信息支持
10.7进一步阅读
附录A mg系统指南
A.1mg系统安装
A.2存储和检索的例子
A.3数据库生成
A.4查询一个索引后的文件集
A.5非文本文件
A.6图像压缩程序
词汇表