logo
  • write-homewrite-home-active首页
  • icon-chaticon-chat-activeAI 智能助手
  • icon-pluginicon-plugin-active浏览器插件
  • icon-subjecticon-subject-active学科题目
  • icon-uploadicon-upload-active上传题库
  • icon-appicon-app-active手机APP
首页
/
计算机
题目

________5.1 文本与文本处理1)从下列三个方面对GB2312、GBK和GB180303个汉字编码[1]国家标准进行比较:(a) 字符集的内容(b) 内码的表示(c) 常用软件对它们的支持情况答:GB2312国标字符集由三个部分组成。第一部分是字母、数字和各种符号,包括拉丁字母、俄文、日文平假名、希腊字母、汉语拼音等共计682个(统称GB2312图形符);第二部分为一级常用汉字,共计3755个,按汉语拼音排列;第三部分二级常用汉字,共计3008个,因为不常用,所以按照偏旁部首排列。GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。根据ISO2022规定,在每个汉字的区号和位号分别加上32,得到的代码称为国标交换码(简称交换码)。高位为1的双字节(16位)汉字编码就称为GB2312汉字的机内码,又称内码。GBK是我国1995年发布的又一个汉字编码标准,全称《汉字内码扩展规范》。GBK字符集中一共有21003个汉字和803个图形符号,它与GB2312国标汉字字符集保持兼容。GBK字符集中的每一个字符都采用双字节表示。GBK汉字内码扩充规范应用:操作系统——Windows 95以上简体中文版,采用GBK代码,并提供了多种输入法和字体;应用软件——Office 95以上简体中文版本提供GBK码的检索和排序;互联网应用——许多网站的网页使用GBK代码,但目前还不是所有搜索引擎[2]都支持 GBK 汉字文本的搜索。国际标准化组织制定的ISO/IEC 10646标准,即“通用多8位编码字符集(简称UCS)以及由微软、IBM等计算机公司制定的与UCS完全兼容的Unicode(统一码[3]或了联合码)实现了所有字符在同一字符集中的统一编码。UCS/Unicode规定,全世界现代书面文字所使用的所有字符、符号都使用4个字节进行编码,记作UCS-4,其优点是编码空间极大(可以安排13亿个字符),能存储足够多的字符集。所谓CJK统一编码的汉字,是指中、日、韩、马以及我国的台湾、香港、澳门地区使用的汉字。GB18030-2000编码标准在GB2312和GBK的基础上进行了扩充,增加了4字节编码,包含汉字数目增加到了27000多个。2)ASCII码和Unicode编码是什么?与汉字编码有什么关系?答:美国标准信息交换码(American Standard Code for Information Interchange):使用7个二进位对字符进行编码(叫做标准ASCII码),称为ISO-646标准。标准ASCII码是七位的编码,但字节是计算机中最基本的处理单位,故以一个字节来存放一个ASCII字符。每个字节中多出来的一位一般保持为“0”,在数据传输[4]时可用作奇偶校验位。通用编码字符集UCS/Unicode:国际标准化组织制定的ISO/IEC 10646标准,即“通用多8位编码字符集(简称UCS)以及由微软、IBM等计算机公司制定的与UCS完全兼容的Unicode(统一码或了联合码)实现了所有字符在同一字符集中的统一编码。3)你常用的汉字键盘输入方法是哪一种?试分析其优缺点,提出改进意见。答:字形编码:将汉字的字形分解归类而给出的编码方法,重码[5]少、输入速度较快,如五笔字形法和表形码等。缺点:编码规则不易掌握。4)数字文本有哪些类型?在计算机中如何表示?与常规的纸质文本相比有哪些优缺点?列举数字文本的各种应用?答:数字文本,根据用途分为:简单文本、丰富格式文本和超文本[6]三类。简单文本(plain text)是由一连串的字符组成的,只含有用于表达正文内容的字符(包括汉字)以及回车、换行、制表等有限的几个打印(显示)控制字符,这种文本通常称为纯文本或ASCII文本,在PC中的文件名后缀为.txt丰富文本格式:排版(文本的格式化):对文字所使用的字体、字号、颜色、文字走向等进行设定,确定文本所在页面大小、文本在页面上的位置以及布局等。丰富文本格式:增加了许多格式控制和结构说明信息的文本。超文本是指除了传统的阅读方式之外,还可以通过链接、跳转、导航、回溯等操作,实现对文本内容更为方便的访问。超文本采用一种网状结构(非线性结构[7])来组织信息,各个信息块之间按照其内容的关系相互连接。如果超文本中的节点不单是文本节点,而且还包含图形、图像、声音或动画节点,这就把超文本推广到了多媒体的形式,这种基于多媒体信息结点[8]的超文本,有时也称超媒体[9]。Windows操作系统和其他一些软件中的帮助文件(HLP文件)就是一种典型的超文本。5)除了编辑排版功能之外,中文版Word还具有哪些中文文字处理功能?答:对字、词、句、段落进行添加、删除、修改等操作字的处理:设置字体、字号、字的排列方向、间距、颜色、效果等段落的处理:设置行距、段间距、段缩进、对称方式等页面布局的处理:设置页边距、每页行列数、分栏、页眉、页脚等其它的功能还有很多,不一一列举。6)数字文本的输出过程大致是怎样的?怎样阅读数字文本?你熟悉哪些文本阅读软件?答:文本输出过程:首先要对文本的格式描述进行解释,然后生成文字和图表的映像(bitmap),最后再传送到显示器或打印机输出。文本阅读器:承担上述文本输出任务的软件,也称为浏览器。它们可以是嵌入在文本处理软件中的一个模块,如微软的Word,也可以是独立的软件,如Adobe公司的Acrobat Reader,微软公司的IE等。5.2 图像与图形1)数字图像是怎样获取的?它分为哪几个步骤?有哪些专用的设备?答:图像的获取:从现实世界中获得数字图像的过程。图像获取的过程实质上是模拟信号[10]的数字化过程,它的处理步骤:取样、分色、量化[11]。图像获取设备有扫描仪、数码相机等。2)一幅具有1600万种颜色(真彩色)、分辨率为1280×1024的数字图像,在没有进行数据压缩[12]时,它的数据量是多少?答:颜色深度[13]为24位。所以图像的数据量=1280×1024×24/8=3.75MB3)常用的图像文件有哪些?各有什么特点?适合哪些应用?答:常用的图像文件格式有:BMP、TIF、GIF、JPEG、JP2GIF是目前因特网上广泛使用的一种图像文件格式,大约占60%,形成动画效果。TIFF大量使用于扫描仪和桌面出版。BMP是微软公司在Windows操作系统下使用的一种标准图像文件格式。JPEG标准[14]的特点:适用范围广;能处理各种连续色调的彩色或灰度[15]图像;算法复杂度适中;既可用硬件实现,也可用软件实现;图像的压缩比可控制(压缩比越低,图像质量越好;压缩比越高,图像质量越差)。4)数字图像处理[16]有哪些主要的应用?列举一至两种你熟悉的应用,并说明图像如何获取的。使用计算机进行了哪些处理?得到什么结果?答:数字图像处理:使用计算机对来自照相机、摄像机、传真机、扫描仪、医用CT机、X光机等的图像,进行去噪、增强、复原、分割、提取特征、压缩、存储、检索等操作处理。其余几问略。5)使用计算机制作合成图像(计算机图形)的软件有哪些?分别使用于什么应用领域?你会使用3D绘图软件制作一个3D景物的图像吗?其制作过程是怎样的?答:计算机合成图像的软件有:PHOTOSHOP、AUTOCAD等等。计算机合成图像的应用:计算机辅助设计和辅助制造(CAD/CAM)、利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等、作战指挥和军事训练 、计算机动画[17]和计算机艺术[18]、其他:电子出版、数据处理[19]、工业监控、辅助教学(CAI)、软件工程[20]等。“千字节”(KB),1KB = 210字节 = 1024B“兆字节”(MB),1MB = 220字节 = 1024KB“吉字节”(GB),1GB = 230字节 = 1024MB(千兆字节)“太字节”(TB),1TB = 240字节 = 1024GB(兆兆字节)3)比特的逻辑运算有哪几种?门电路[21]是什么?使用门电路可以做什么?答:逻辑运算有三种:逻辑加、逻辑乘、取反。门电路就是用于基本完成逻辑运算的电路。任何复杂的逻辑运算都可以用门电路的组合来实现。4)二进制[22]数、十进制[23]数如何相互转换?二进制数与八进制[24]数、十六进制[25]数如何相互转换?答:二进制数转换成十进制数只需要将二进制数的每一位乘上其对应的权值然后累加起来既可。十进制数转换成二进制数可以采取“除以2取余法”。八进制数转换成二进制数只要每一个八进制数改写成等值的3位二进制即可。二进制数转换成八进制数时,整数部分从低位向高位方向每3位用一个等值的八进制数来替换,最后不足3位时在高位补0凑满3位。十六进制数转换成二进制数只要每一个十六进制数改写成等值的4位二进制即可。二进制数转换成十六进制数时,整数部分从低位向高位方向每4位用一个等值的十六进制数来替换,最后不足4位时在高位补0凑满4位。5)Pentium处理器中有哪几种整数类型?-7086在这几种整数类型中是怎样表示的?6)389.625在Pentium处理器中使用32为浮点数是怎样表示的?为什么32位浮点数可表示的数值范围是10=-8~10=-8?自测题1

________

5.1 文本与文本处理

1)从下列三个方面对GB2312、GBK和GB180303个汉字编码[1]国家标准进行比较:

(a) 字符集的内容

(b) 内码的表示

(c) 常用软件对它们的支持情况

答:GB2312国标字符集由三个部分组成。第一部分是字母、数字和各种符号,包括拉丁字母、俄文、日文平假名、希腊字母、汉语拼音等共计682个(统称GB2312图形符);第二部分为一级常用汉字,共计3755个,按汉语拼音排列;第三部分二级常用汉字,共计3008个,因为不常用,所以按照偏旁部首排列。GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。根据ISO2022规定,在每个汉字的区号和位号分别加上32,得到的代码称为国标交换码(简称交换码)。高位为1的双字节(16位)汉字编码就称为GB2312汉字的机内码,又称内码。

GBK是我国1995年发布的又一个汉字编码标准,全称《汉字内码扩展规范》。GBK字符集中一共有21003个汉字和803个图形符号,它与GB2312国标汉字字符集保持兼容。GBK字符集中的每一个字符都采用双字节表示。GBK汉字内码扩充规范应用:操作系统——Windows 95以上简体中文版,采用GBK代码,并提供了多种输入法和字体;应用软件——Office 95以上简体中文版本提供GBK码的检索和排序;互联网应用——许多网站的网页使用GBK代码,但目前还不是所有搜索引擎[2]都支持 GBK 汉字文本的搜索。

国际标准化组织制定的ISO/IEC 10646标准,即“通用多8位编码字符集(简称UCS)以及由微软、IBM等计算机公司制定的与UCS完全兼容的Unicode(统一码[3]或了联合码)实现了所有字符在同一字符集中的统一编码。UCS/Unicode规定,全世界现代书面文字所使用的所有字符、符号都使用4个字节进行编码,记作UCS-4,其优点是编码空间极大(可以安排13亿个字符),能存储足够多的字符集。所谓CJK统一编码的汉字,是指中、日、韩、马以及我国的台湾、香港、澳门地区使用的汉字。GB18030-2000编码标准在GB2312和GBK的基础上进行了扩充,增加了4字节编码,包含汉字数目增加到了27000多个。

2)ASCII码和Unicode编码是什么?与汉字编码有什么关系?

答:美国标准信息交换码(American Standard Code for Information Interchange):使用7个二进位对字符进行编码(叫做标准ASCII码),称为ISO-646标准。标准ASCII码是七位的编码,但字节是计算机中最基本的处理单位,故以一个字节来存放一个ASCII字符。每个字节中多出来的一位一般保持为“0”,在数据传输[4]时可用作奇偶校验位。

通用编码字符集UCS/Unicode:国际标准化组织制定的ISO/IEC 10646标准,即“通用多8位编码字符集(简称UCS)以及由微软、IBM等计算机公司制定的与UCS完全兼容的Unicode(统一码或了联合码)实现了所有字符在同一字符集中的统一编码。

3)你常用的汉字键盘输入方法是哪一种?试分析其优缺点,提出改进意见。

答:字形编码:将汉字的字形分解归类而给出的编码方法,重码[5]少、输入速度较快,如五笔字形法和表形码等。缺点:编码规则不易掌握。

4)数字文本有哪些类型?在计算机中如何表示?与常规的纸质文本相比有哪些优缺点?列举数字文本的各种应用?

答:数字文本,根据用途分为:简单文本、丰富格式文本和超文本[6]三类。

简单文本(plain text)是由一连串的字符组成的,只含有用于表达正文内容的字符(包括汉字)以及回车、换行、制表等有限的几个打印(显示)控制字符,这种文本通常称为纯文本或ASCII文本,在PC中的文件名后缀为.txt

丰富文本格式:排版(文本的格式化):对文字所使用的字体、字号、颜色、文字走向等进行设定,确定文本所在页面大小、文本在页面上的位置以及布局等。丰富文本格式:增加了许多格式控制和结构说明信息的文本。

超文本是指除了传统的阅读方式之外,还可以通过链接、跳转、导航、回溯等操作,实现对文本内容更为方便的访问。超文本采用一种网状结构(非线性结构[7])来组织信息,各个信息块之间按照其内容的关系相互连接。如果超文本中的节点不单是文本节点,而且还包含图形、图像、声音或动画节点,这就把超文本推广到了多媒体的形式,这种基于多媒体信息结点[8]的超文本,有时也称超媒体[9]。Windows操作系统和其他一些软件中的帮助文件(HLP文件)就是一种典型的超文本。

5)除了编辑排版功能之外,中文版Word还具有哪些中文文字处理功能?

答:对字、词、句、段落进行添加、删除、修改等操作

字的处理:设置字体、字号、字的排列方向、间距、颜色、效果等

段落的处理:设置行距、段间距、段缩进、对称方式等

页面布局的处理:设置页边距、每页行列数、分栏、页眉、页脚等

其它的功能还有很多,不一一列举。

6)数字文本的输出过程大致是怎样的?怎样阅读数字文本?你熟悉哪些文本阅读软件?

答:文本输出过程:首先要对文本的格式描述进行解释,然后生成文字和图表的映像(bitmap),最后再传送到显示器或打印机输出。

文本阅读器:承担上述文本输出任务的软件,也称为浏览器。它们可以是嵌入在文本处理软件中的一个模块,如微软的Word,也可以是独立的软件,如Adobe公司的Acrobat Reader,微软公司的IE等。

5.2 图像与图形

1)数字图像是怎样获取的?它分为哪几个步骤?有哪些专用的设备?

答:图像的获取:从现实世界中获得数字图像的过程。图像获取的过程实质上是模拟信号[10]的数字化过程,它的处理步骤:取样、分色、量化[11]。图像获取设备有扫描仪、数码相机等。

2)一幅具有1600万种颜色(真彩色)、分辨率为1280×1024的数字图像,在没有进行数据压缩[12]时,它的数据量是多少?

答:颜色深度[13]为24位。

所以图像的数据量=1280×1024×24/8=3.75MB

3)常用的图像文件有哪些?各有什么特点?适合哪些应用?

答:常用的图像文件格式有:BMP、TIF、GIF、JPEG、JP2

GIF是目前因特网上广泛使用的一种图像文件格式,大约占60%,形成动画效果。

TIFF大量使用于扫描仪和桌面出版。

BMP是微软公司在Windows操作系统下使用的一种标准图像文件格式。

JPEG标准[14]的特点:适用范围广;能处理各种连续色调的彩色或灰度[15]图像;算法复杂度适中;既可用硬件实现,也可用软件实现;图像的压缩比可控制(压缩比越低,图像质量越好;压缩比越高,图像质量越差)。

4)数字图像处理[16]有哪些主要的应用?列举一至两种你熟悉的应用,并说明图像如何获取的。使用计算机进行了哪些处理?得到什么结果?

答:数字图像处理:使用计算机对来自照相机、摄像机、传真机、扫描仪、医用CT机、X光机等的图像,进行去噪、增强、复原、分割、提取特征、压缩、存储、检索等操作处理。

其余几问略。

5)使用计算机制作合成图像(计算机图形)的软件有哪些?分别使用于什么应用领域?你会使用3D绘图软件制作一个3D景物的图像吗?其制作过程是怎样的?

答:计算机合成图像的软件有:PHOTOSHOP、AUTOCAD等等。

计算机合成图像的应用:计算机辅助设计和辅助制造(CAD/CAM)、利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等、作战指挥和军事训练 、计算机动画[17]和计算机艺术[18]、其他:电子出版、数据处理[19]、工业监控、辅助教学(CAI)、软件工程[20]等。

“千字节”(KB),1KB = 210字节 = 1024B

“兆字节”(MB),1MB = 220字节 = 1024KB

“吉字节”(GB),1GB = 230字节 = 1024MB(千兆字节)

“太字节”(TB),1TB = 240字节 = 1024GB(兆兆字节)

3)比特的逻辑运算有哪几种?门电路[21]是什么?使用门电路可以做什么?

答:逻辑运算有三种:逻辑加、逻辑乘、取反。

门电路就是用于基本完成逻辑运算的电路。

任何复杂的逻辑运算都可以用门电路的组合来实现。

4)二进制[22]数、十进制[23]数如何相互转换?二进制数与八进制[24]数、十六进制[25]数如何相互转换?

答:二进制数转换成十进制数只需要将二进制数的每一位乘上其对应的权值然后累加起来既可。十进制数转换成二进制数可以采取“除以2取余法”。

八进制数转换成二进制数只要每一个八进制数改写成等值的3位二进制即可。二进制数转换成八进制数时,整数部分从低位向高位方向每3位用一个等值的八进制数来替换,最后不足3位时在高位补0凑满3位。

十六进制数转换成二进制数只要每一个十六进制数改写成等值的4位二进制即可。二进制数转换成十六进制数时,整数部分从低位向高位方向每4位用一个等值的十六进制数来替换,最后不足4位时在高位补0凑满4位。

5)Pentium处理器中有哪几种整数类型?-7086在这几种整数类型中是怎样表示的?

6)389.625在Pentium处理器中使用32为浮点数是怎样表示的?为什么32位浮点数可表示的数值范围是10~10?

自测题1

题目解答

答案

第5章 数字媒体及应用

解析

本题主要是对数字媒体相关知识的考查,包括汉字编码标准比较、ASCII码和Unicode编码、汉字输入方法、数字文本类型及表示、Word功能、数字文本输出、数字图像获取与处理、图像文件格式、计算机图形软件等内容。题目给出了详细的文本内容,需根据内容总结答案。

相关问题

  • 2.单选题 讯飞星火可以实现多种文案类型和语言风格的文本写作。讯飞星火(网页版)“内容写作”功能可选的“语言风格”不包括( )。A. 口语化B. 高情商C. 专业D. 热情

  • 下列哪项贪婪最佳优先搜索算法的描述正确()A. 贪婪最佳优先搜索不属于启发式搜索算法B. 贪婪最佳优先搜索是一种A*搜索算法C. 贪婪最佳优先搜索是一种广度优先搜索算法D. 贪婪最佳优先搜索属于有信息搜索算法

  • Windows中“复制”操作的快捷键是Ctrl+V。

  • 由脸书(Facebook)公司开发的深度学习编程框架是()A. TensorFlowB. PaddlePaddleC. PyTorchD. Mindspore

  • 网络安全包括物理安全[1]、逻辑安全、操作系统安全及联网安全,其中逻辑安全包括访问控制[2]、加密、安全管理及用户身份认证。A. 正确B. 错误

  • 程序=算法+()A. 数据结构B. 程序结构C. 控制结构[1]D. 体系结构

  • AdaBoosting采用多个单一分类器组成一个强分类器()A. 错误B. 正确

  • 以下哪种方法属于卷积神经网络的基本组件()。A. 卷积层B. 池化层C. 激活函数D. 复制层

  • 下列哪项关于监督学习算法的描述正确()A. 强化学习的训练效果一定优于监督学习B. 主要的监督学习方法包括生成方法和判别方法C. 广度优先搜索算法是一种监督学习算法

  • 7、 加强电脑安全防护,及时升级病 毒库,安装防火墙,及时查杀病毒和木马,是防范 电信网络诈骗的有效做法。A. 正确B. 错误

  • 在决策树建立过程中,使用一个属性对某个结点对应的数集合进行划分后,结果具有高信息熵(highentropy),对结果的描述,最贴切的是()。A. 纯度高B. 纯度低C. 有用D. 无用E. 以上描述都不贴切

  • 网络安全包括物理安全[1]、逻辑安全、操作系统安全及联网安全,其中逻辑安全包括访问控制[2]、加密、安全管理及用户身份认证。A. 正确B. 错误

  • 下列哪个方法属于知识图谱推理方法()A. 路径排序算法B. 深度学习推断C. 广度优先搜索D. 归纳逻辑程序设计

  • 4/5 以下属于人工智能实际应用的是()。A. 机器视觉B. 人脸识别C. 计算机辅助自动规划D. 智能工业机器人E. 刷卡门禁

  • 下列哪项属于因果推理模型()A. 因果图B. 神经符号推理C. 符号推理模型D. 结构因果模型

  • 网络诈骗中常见的“钓鱼网站”目的是()?A. 传播病毒B. 窃取个人信息C. 提供免费电影

  • 3.判断题K-means聚类算法对数据的尺寸敏感。()A. 对B. 错

  • 下列不属于量子机器学习算法的是()A. 量子支持向量机B. 量子主成分分析C. 薛定谔方程求解D. 深度量子学习

  • 下列哪个方法属于知识图谱推理方法()A. 广度优先搜索B. 深度学习推断C. 路径排序算法D. 归纳逻辑程序设计

  • 下列哪项不是求解对抗搜索问题的基本算法( ) A.反向传播算法 B.广度优先排序算法 C.Alpha-Beta剪枝算法D.最小最大搜索算法

上一页下一页
logo
广州极目未来文化科技有限公司
注册地址:广州市黄埔区揽月路8号135、136、137、138房
关于
  • 隐私政策
  • 服务协议
  • 权限详情
学科
  • 医学
  • 政治学
  • 管理
  • 计算机
  • 教育
  • 数学
联系我们
  • 客服电话: 010-82893100
  • 公司邮箱: daxuesoutijiang@163.com
  • qt

©2023 广州极目未来文化科技有限公司 粤ICP备2023029972号    粤公网安备44011202002296号