三国演义鲁肃演者:信息处理定义

来源:百度文库 编辑:高考问答 时间:2024/04/27 22:21:47

信息处理是用计算机对口语和书面语进行转换、传输、存贮、分析等加工的科学。

中文信息处理,是用计算机对中文(包括口语和书面语)进行转换、传输、存贮、分析等加工的科学。
中文信息处理技术是一门与语言学、计算机科学、心理学、数学、控制论、信息论、声学、自动化技术等多种学样相联系的边缘交叉性学科。随着科学技术的发展,中文信息处理技术已到社会生活的各个方面,它包括汉字信息处理和汉语信息处理两个部分。
汉字信息处理是中文信息处理的关键和基础,其难点是汉字编码问题。汉字编码的设计,应从系统的角度出发,根据不同用户(专业录入员、一般用户等)的需要制定出不同的技术指标,如:输入速度、存贮空间、处理效率、以及掌握输入方法所需的训练时间等。并且,应由国家统一评选出几种标准的编码方案,以实现汉字编码方案的标准化。
目前,我国已研制出了数百种汉字编码方案,其中部分方案已通过了上机试验,或已被采用。除此之外,还研制出了各种汉字输入键盘、汉字字库、仿真汉字终端、汉字打印机。汉字内码有效地解决了中西文兼容的问题;计算机激光汉字照排系统也已研制成功;同时,手写体和印刷体汉字识别的研究工作已取得了一定成绩。
汉语信息处理是汉字信息处理的进一步发展,它要在汉字输入的基础上,研究汉语的词汇、句法、语义、语境的自动处理问题,是中文信息处理的高级阶段。目前,汉语信息处理在机器翻译、汉语的人机对话和中文情报检索等方面,已经取得了一定的成果。机器翻译目前已研制出英汉、俄汉、法汉、日汉和汉外等系统,其中有的系统已经迈向了实用化和商品化的道路。现在,我国已出现了不少研究情报检索系统的单位,并取得了一定成果。情报检索的关键是情报检索语言的建立,词的切分问题也将直接影响情报检索系统的工作;目前全文情报检查系统已经实用化。至于汉语的人机对话,目前还只限于书面语部分,有关汉语语音的人机对话系统的研究还处于实验阶段,有的学者正设计中文听写机,以实现汉语口语的自动听写。
汉语信息处理,还包括言语统计、计算机辅助语言教学(编制各种语言教学软件)、语音识别和言语合成、编辑照排系统、方言研究、修辞学研究(用统计的方法研究风格特征,并进行风格比较等)、索引、词表和词典的编制工作等。
其中言语统计工作,由于自动切词的问题还没有彻底解决,所以许多统计是在人工辅助切词的基础上进行的。用计算机对汉语进行方言研究,即让计算机对各种方言特征,如声母、韵母、声调,鼻化、腭化等现象进行描写和比较。目前,我国已开始利用计算机进行方言研究和绘制方言地图的工作了。
中文信息处理技术,是自然语言信息处理的一个分支。它需要以大量的语言知识、背景知识为依据,对中文信息的人脑处理过程进行模拟。当前的中文信息处理系统,还处于初级阶段,许多处理过程,尤其是机器翻译、人机对话等,还需对汉语本身加以研究,附加某必要的选择条件和限制。例如,词汇限制,语句形式限制,语义和语用知识的限制,等待。