________5.1 文本与文本处理1)从下列三个方面对GB2312、GBK和GB180303个汉字编码[1]国家标准进行比较:(a) 字符集的内容(b) 内码的表示(c) 常用软件对它们的支持情况答:GB2312国标字符集由三个部分组成。第一部分是字母、数字和各种符号,包括拉丁字母、俄文、日文平假名、希腊字母、汉语拼音等共计682个(统称GB2312图形符);第二部分为一级常用汉字,共计3755个,按汉语拼音排列;第三部分二级常用汉字,共计3008个,因为不常用,所以按照偏旁部首排列。GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。根据ISO2022规定,在每个汉字的区号和位号分别加上32,得到的代码称为国标交换码(简称交换码)。高位为1的双字节(16位)汉字编码就称为GB2312汉字的机内码,又称内码。GBK是我国1995年发布的又一个汉字编码标准,全称《汉字内码扩展规范》。GBK字符集中一共有21003个汉字和803个图形符号,它与GB2312国标汉字字符集保持兼容。GBK字符集中的每一个字符都采用双字节表示。GBK汉字内码扩充规范应用:操作系统——Windows 95以上简体中文版,采用GBK代码,并提供了多种输入法和字体;应用软件——Office 95以上简体中文版本提供GBK码的检索和排序;互联网应用——许多网站的网页使用GBK代码,但目前还不是所有搜索引擎[2]都支持 GBK 汉字文本的搜索。国际标准化组织制定的ISO/IEC 10646标准,即“通用多8位编码字符集(简称UCS)以及由微软、IBM等计算机公司制定的与UCS完全兼容的Unicode(统一码[3]或了联合码)实现了所有字符在同一字符集中的统一编码。UCS/Unicode规定,全世界现代书面文字所使用的所有字符、符号都使用4个字节进行编码,记作UCS-4,其优点是编码空间极大(可以安排13亿个字符),能存储足够多的字符集。所谓CJK统一编码的汉字,是指中、日、韩、马以及我国的台湾、香港、澳门地区使用的汉字。GB18030-2000编码标准在GB2312和GBK的基础上进行了扩充,增加了4字节编码,包含汉字数目增加到了27000多个。2)ASCII码和Unicode编码是什么?与汉字编码有什么关系?答:美国标准信息交换码(American Standard Code for Information Interchange):使用7个二进位对字符进行编码(叫做标准ASCII码),称为ISO-646标准。标准ASCII码是七位的编码,但字节是计算机中最基本的处理单位,故以一个字节来存放一个ASCII字符。每个字节中多出来的一位一般保持为“0”,在数据传输[4]时可用作奇偶校验位。通用编码字符集UCS/Unicode:国际标准化组织制定的ISO/IEC 10646标准,即“通用多8位编码字符集(简称UCS)以及由微软、IBM等计算机公司制定的与UCS完全兼容的Unicode(统一码或了联合码)实现了所有字符在同一字符集中的统一编码。3)你常用的汉字键盘输入方法是哪一种?试分析其优缺点,提出改进意见。答:字形编码:将汉字的字形分解归类而给出的编码方法,重码[5]少、输入速度较快,如五笔字形法和表形码等。缺点:编码规则不易掌握。4)数字文本有哪些类型?在计算机中如何表示?与常规的纸质文本相比有哪些优缺点?列举数字文本的各种应用?答:数字文本,根据用途分为:简单文本、丰富格式文本和超文本[6]三类。简单文本(plain text)是由一连串的字符组成的,只含有用于表达正文内容的字符(包括汉字)以及回车、换行、制表等有限的几个打印(显示)控制字符,这种文本通常称为纯文本或ASCII文本,在PC中的文件名后缀为.txt丰富文本格式:排版(文本的格式化):对文字所使用的字体、字号、颜色、文字走向等进行设定,确定文本所在页面大小、文本在页面上的位置以及布局等。丰富文本格式:增加了许多格式控制和结构说明信息的文本。超文本是指除了传统的阅读方式之外,还可以通过链接、跳转、导航、回溯等操作,实现对文本内容更为方便的访问。超文本采用一种网状结构(非线性结构[7])来组织信息,各个信息块之间按照其内容的关系相互连接。如果超文本中的节点不单是文本节点,而且还包含图形、图像、声音或动画节点,这就把超文本推广到了多媒体的形式,这种基于多媒体信息结点[8]的超文本,有时也称超媒体[9]。Windows操作系统和其他一些软件中的帮助文件(HLP文件)就是一种典型的超文本。5)除了编辑排版功能之外,中文版Word还具有哪些中文文字处理功能?答:对字、词、句、段落进行添加、删除、修改等操作字的处理:设置字体、字号、字的排列方向、间距、颜色、效果等段落的处理:设置行距、段间距、段缩进、对称方式等页面布局的处理:设置页边距、每页行列数、分栏、页眉、页脚等其它的功能还有很多,不一一列举。6)数字文本的输出过程大致是怎样的?怎样阅读数字文本?你熟悉哪些文本阅读软件?答:文本输出过程:首先要对文本的格式描述进行解释,然后生成文字和图表的映像(bitmap),最后再传送到显示器或打印机输出。文本阅读器:承担上述文本输出任务的软件,也称为浏览器。它们可以是嵌入在文本处理软件中的一个模块,如微软的Word,也可以是独立的软件,如Adobe公司的Acrobat Reader,微软公司的IE等。5.2 图像与图形1)数字图像是怎样获取的?它分为哪几个步骤?有哪些专用的设备?答:图像的获取:从现实世界中获得数字图像的过程。图像获取的过程实质上是模拟信号[10]的数字化过程,它的处理步骤:取样、分色、量化[11]。图像获取设备有扫描仪、数码相机等。2)一幅具有1600万种颜色(真彩色)、分辨率为1280×1024的数字图像,在没有进行数据压缩[12]时,它的数据量是多少?答:颜色深度[13]为24位。所以图像的数据量=1280×1024×24/8=3.75MB3)常用的图像文件有哪些?各有什么特点?适合哪些应用?答:常用的图像文件格式有:BMP、TIF、GIF、JPEG、JP2GIF是目前因特网上广泛使用的一种图像文件格式,大约占60%,形成动画效果。TIFF大量使用于扫描仪和桌面出版。BMP是微软公司在Windows操作系统下使用的一种标准图像文件格式。JPEG标准[14]的特点:适用范围广;能处理各种连续色调的彩色或灰度[15]图像;算法复杂度适中;既可用硬件实现,也可用软件实现;图像的压缩比可控制(压缩比越低,图像质量越好;压缩比越高,图像质量越差)。4)数字图像处理[16]有哪些主要的应用?列举一至两种你熟悉的应用,并说明图像如何获取的。使用计算机进行了哪些处理?得到什么结果?答:数字图像处理:使用计算机对来自照相机、摄像机、传真机、扫描仪、医用CT机、X光机等的图像,进行去噪、增强、复原、分割、提取特征、压缩、存储、检索等操作处理。其余几问略。5)使用计算机制作合成图像(计算机图形)的软件有哪些?分别使用于什么应用领域?你会使用3D绘图软件制作一个3D景物的图像吗?其制作过程是怎样的?答:计算机合成图像的软件有:PHOTOSHOP、AUTOCAD等等。计算机合成图像的应用:计算机辅助设计和辅助制造(CAD/CAM)、利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等、作战指挥和军事训练 、计算机动画[17]和计算机艺术[18]、其他:电子出版、数据处理[19]、工业监控、辅助教学(CAI)、软件工程[20]等。“千字节”(KB),1KB = 210字节 = 1024B“兆字节”(MB),1MB = 220字节 = 1024KB“吉字节”(GB),1GB = 230字节 = 1024MB(千兆字节)“太字节”(TB),1TB = 240字节 = 1024GB(兆兆字节)3)比特的逻辑运算有哪几种?门电路[21]是什么?使用门电路可以做什么?答:逻辑运算有三种:逻辑加、逻辑乘、取反。门电路就是用于基本完成逻辑运算的电路。任何复杂的逻辑运算都可以用门电路的组合来实现。4)二进制[22]数、十进制[23]数如何相互转换?二进制数与八进制[24]数、十六进制[25]数如何相互转换?答:二进制数转换成十进制数只需要将二进制数的每一位乘上其对应的权值然后累加起来既可。十进制数转换成二进制数可以采取“除以2取余法”。八进制数转换成二进制数只要每一个八进制数改写成等值的3位二进制即可。二进制数转换成八进制数时,整数部分从低位向高位方向每3位用一个等值的八进制数来替换,最后不足3位时在高位补0凑满3位。十六进制数转换成二进制数只要每一个十六进制数改写成等值的4位二进制即可。二进制数转换成十六进制数时,整数部分从低位向高位方向每4位用一个等值的十六进制数来替换,最后不足4位时在高位补0凑满4位。5)Pentium处理器中有哪几种整数类型?-7086在这几种整数类型中是怎样表示的?6)389.625在Pentium处理器中使用32为浮点数是怎样表示的?为什么32位浮点数可表示的数值范围是10=-8~10=-8?自测题1
________
5.1 文本与文本处理
1)从下列三个方面对GB2312、GBK和GB180303个汉字编码[1]国家标准进行比较:
(a) 字符集的内容
(b) 内码的表示
(c) 常用软件对它们的支持情况
答:GB2312国标字符集由三个部分组成。第一部分是字母、数字和各种符号,包括拉丁字母、俄文、日文平假名、希腊字母、汉语拼音等共计682个(统称GB2312图形符);第二部分为一级常用汉字,共计3755个,按汉语拼音排列;第三部分二级常用汉字,共计3008个,因为不常用,所以按照偏旁部首排列。GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。根据ISO2022规定,在每个汉字的区号和位号分别加上32,得到的代码称为国标交换码(简称交换码)。高位为1的双字节(16位)汉字编码就称为GB2312汉字的机内码,又称内码。
GBK是我国1995年发布的又一个汉字编码标准,全称《汉字内码扩展规范》。GBK字符集中一共有21003个汉字和803个图形符号,它与GB2312国标汉字字符集保持兼容。GBK字符集中的每一个字符都采用双字节表示。GBK汉字内码扩充规范应用:操作系统——Windows 95以上简体中文版,采用GBK代码,并提供了多种输入法和字体;应用软件——Office 95以上简体中文版本提供GBK码的检索和排序;互联网应用——许多网站的网页使用GBK代码,但目前还不是所有搜索引擎[2]都支持 GBK 汉字文本的搜索。
国际标准化组织制定的ISO/IEC 10646标准,即“通用多8位编码字符集(简称UCS)以及由微软、IBM等计算机公司制定的与UCS完全兼容的Unicode(统一码[3]或了联合码)实现了所有字符在同一字符集中的统一编码。UCS/Unicode规定,全世界现代书面文字所使用的所有字符、符号都使用4个字节进行编码,记作UCS-4,其优点是编码空间极大(可以安排13亿个字符),能存储足够多的字符集。所谓CJK统一编码的汉字,是指中、日、韩、马以及我国的台湾、香港、澳门地区使用的汉字。GB18030-2000编码标准在GB2312和GBK的基础上进行了扩充,增加了4字节编码,包含汉字数目增加到了27000多个。
2)ASCII码和Unicode编码是什么?与汉字编码有什么关系?
答:美国标准信息交换码(American Standard Code for Information Interchange):使用7个二进位对字符进行编码(叫做标准ASCII码),称为ISO-646标准。标准ASCII码是七位的编码,但字节是计算机中最基本的处理单位,故以一个字节来存放一个ASCII字符。每个字节中多出来的一位一般保持为“0”,在数据传输[4]时可用作奇偶校验位。
通用编码字符集UCS/Unicode:国际标准化组织制定的ISO/IEC 10646标准,即“通用多8位编码字符集(简称UCS)以及由微软、IBM等计算机公司制定的与UCS完全兼容的Unicode(统一码或了联合码)实现了所有字符在同一字符集中的统一编码。
3)你常用的汉字键盘输入方法是哪一种?试分析其优缺点,提出改进意见。
答:字形编码:将汉字的字形分解归类而给出的编码方法,重码[5]少、输入速度较快,如五笔字形法和表形码等。缺点:编码规则不易掌握。
4)数字文本有哪些类型?在计算机中如何表示?与常规的纸质文本相比有哪些优缺点?列举数字文本的各种应用?
答:数字文本,根据用途分为:简单文本、丰富格式文本和超文本[6]三类。
简单文本(plain text)是由一连串的字符组成的,只含有用于表达正文内容的字符(包括汉字)以及回车、换行、制表等有限的几个打印(显示)控制字符,这种文本通常称为纯文本或ASCII文本,在PC中的文件名后缀为.txt
丰富文本格式:排版(文本的格式化):对文字所使用的字体、字号、颜色、文字走向等进行设定,确定文本所在页面大小、文本在页面上的位置以及布局等。丰富文本格式:增加了许多格式控制和结构说明信息的文本。
超文本是指除了传统的阅读方式之外,还可以通过链接、跳转、导航、回溯等操作,实现对文本内容更为方便的访问。超文本采用一种网状结构(非线性结构[7])来组织信息,各个信息块之间按照其内容的关系相互连接。如果超文本中的节点不单是文本节点,而且还包含图形、图像、声音或动画节点,这就把超文本推广到了多媒体的形式,这种基于多媒体信息结点[8]的超文本,有时也称超媒体[9]。Windows操作系统和其他一些软件中的帮助文件(HLP文件)就是一种典型的超文本。
5)除了编辑排版功能之外,中文版Word还具有哪些中文文字处理功能?
答:对字、词、句、段落进行添加、删除、修改等操作
字的处理:设置字体、字号、字的排列方向、间距、颜色、效果等
段落的处理:设置行距、段间距、段缩进、对称方式等
页面布局的处理:设置页边距、每页行列数、分栏、页眉、页脚等
其它的功能还有很多,不一一列举。
6)数字文本的输出过程大致是怎样的?怎样阅读数字文本?你熟悉哪些文本阅读软件?
答:文本输出过程:首先要对文本的格式描述进行解释,然后生成文字和图表的映像(bitmap),最后再传送到显示器或打印机输出。
文本阅读器:承担上述文本输出任务的软件,也称为浏览器。它们可以是嵌入在文本处理软件中的一个模块,如微软的Word,也可以是独立的软件,如Adobe公司的Acrobat Reader,微软公司的IE等。
5.2 图像与图形
1)数字图像是怎样获取的?它分为哪几个步骤?有哪些专用的设备?
答:图像的获取:从现实世界中获得数字图像的过程。图像获取的过程实质上是模拟信号[10]的数字化过程,它的处理步骤:取样、分色、量化[11]。图像获取设备有扫描仪、数码相机等。
2)一幅具有1600万种颜色(真彩色)、分辨率为1280×1024的数字图像,在没有进行数据压缩[12]时,它的数据量是多少?
答:颜色深度[13]为24位。
所以图像的数据量=1280×1024×24/8=3.75MB
3)常用的图像文件有哪些?各有什么特点?适合哪些应用?
答:常用的图像文件格式有:BMP、TIF、GIF、JPEG、JP2
GIF是目前因特网上广泛使用的一种图像文件格式,大约占60%,形成动画效果。
TIFF大量使用于扫描仪和桌面出版。
BMP是微软公司在Windows操作系统下使用的一种标准图像文件格式。
JPEG标准[14]的特点:适用范围广;能处理各种连续色调的彩色或灰度[15]图像;算法复杂度适中;既可用硬件实现,也可用软件实现;图像的压缩比可控制(压缩比越低,图像质量越好;压缩比越高,图像质量越差)。
4)数字图像处理[16]有哪些主要的应用?列举一至两种你熟悉的应用,并说明图像如何获取的。使用计算机进行了哪些处理?得到什么结果?
答:数字图像处理:使用计算机对来自照相机、摄像机、传真机、扫描仪、医用CT机、X光机等的图像,进行去噪、增强、复原、分割、提取特征、压缩、存储、检索等操作处理。
其余几问略。
5)使用计算机制作合成图像(计算机图形)的软件有哪些?分别使用于什么应用领域?你会使用3D绘图软件制作一个3D景物的图像吗?其制作过程是怎样的?
答:计算机合成图像的软件有:PHOTOSHOP、AUTOCAD等等。
计算机合成图像的应用:计算机辅助设计和辅助制造(CAD/CAM)、利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等、作战指挥和军事训练 、计算机动画[17]和计算机艺术[18]、其他:电子出版、数据处理[19]、工业监控、辅助教学(CAI)、软件工程[20]等。
“千字节”(KB),1KB = 210字节 = 1024B
“兆字节”(MB),1MB = 220字节 = 1024KB
“吉字节”(GB),1GB = 230字节 = 1024MB(千兆字节)
“太字节”(TB),1TB = 240字节 = 1024GB(兆兆字节)
3)比特的逻辑运算有哪几种?门电路[21]是什么?使用门电路可以做什么?
答:逻辑运算有三种:逻辑加、逻辑乘、取反。
门电路就是用于基本完成逻辑运算的电路。
任何复杂的逻辑运算都可以用门电路的组合来实现。
4)二进制[22]数、十进制[23]数如何相互转换?二进制数与八进制[24]数、十六进制[25]数如何相互转换?
答:二进制数转换成十进制数只需要将二进制数的每一位乘上其对应的权值然后累加起来既可。十进制数转换成二进制数可以采取“除以2取余法”。
八进制数转换成二进制数只要每一个八进制数改写成等值的3位二进制即可。二进制数转换成八进制数时,整数部分从低位向高位方向每3位用一个等值的八进制数来替换,最后不足3位时在高位补0凑满3位。
十六进制数转换成二进制数只要每一个十六进制数改写成等值的4位二进制即可。二进制数转换成十六进制数时,整数部分从低位向高位方向每4位用一个等值的十六进制数来替换,最后不足4位时在高位补0凑满4位。
5)Pentium处理器中有哪几种整数类型?-7086在这几种整数类型中是怎样表示的?
6)389.625在Pentium处理器中使用32为浮点数是怎样表示的?为什么32位浮点数可表示的数值范围是10
~10
?
自测题1
题目解答
答案
第5章 数字媒体及应用
解析
本题主要是对数字媒体相关知识的考查,包括汉字编码标准比较、ASCII码和Unicode编码、汉字输入方法、数字文本类型及表示、Word功能、数字文本输出、数字图像获取与处理、图像文件格式、计算机图形软件等内容。题目给出了详细的文本内容,需根据内容总结答案。