人工智能期末考试复习(贲可荣 张彦铎)

人工智能期末考试复习(贲可荣 张彦铎)

人工智能的3个主流学派:

  1. 逻辑学派(符号主义方法):物理符号系统(即符号操作系统)假设和有限合理性原理
  2. 仿生学派(联结主义方法):神经网络及神经网络间的连接机制与学习算法。
  3. 控制论学派(行为主义方法):控制论及感知—动作型控制系统

人工智能定义:是研究理解和模拟人类智能、智能行为及其规律的一门学科。主要任务—— 建立智能信息处理理论,进而设计可以展现某些近似于人类智能行为的计算系统。

物理符号系统的六种基本功能
(1)输入符号(input)
(2)输出符号(output)
(3)存储符号(store)
(4)复制符号(copy)
(5)建立符号结构:通过找出各符号间的关系,在符号系统中形成符号结构;
(6)条件性迁移(conditional transfer):根据已有符号,继续完成活动过程。

物理符号系统的假设:任何系统如果具有这6种功能,那么它就能够表现出智能;这种智 指的是人类所具有的那种智能。

人工智能的研究与应用领域:智能感知 智能推理 智能学习 智能行动

计算机模式识别系统由三部分组成:数据采集 数据处理 分类决策或模型匹配

专家系统组成:知识库 推理机

知识发现的四个特征:

  • 发现的知识用高级语言表示;
  • 发现的内容是对数据内容的精确描述;
  • 发现的结果(即知识)是用户感兴趣的;
  • 发现的过程应是高效的。

知识的表示方法主要分为:

  • 结构化方法(逻辑方法和产生式方法)
  • 非结构化方法(语义网络和框架)

知识的特性:

  • 1.相对正确性
  • 2.不确定性(随机性 模糊性 经验 不完全性引起的不确定性)
  • 3.可表示性与可利用性

知识的分类:

  • 1.按适应范围(常识性知识 领域性知识)
  • 2.按知识的作用及表示(事实性 过程性 控制性)
  • 3.按知识的结构及表现形式(逻辑性知识 形象性知识)
  • 4.按知识的确定性(确定性知识 不确定性知识)

知识表示=数据结构+处理机制

选择知识表示方法的原则:

  • (1)充分表示领域知识。
  • (2)有利于对知识的利用。
  • (3)便于对知识的组织、维护与管理。
  • (4)便于理解与实现。

智能的4要素:信息 知识 策略 行为

智能的4个能力包括

  • 获取有用信息的能力
  • 由信息生成知识(认知)的能力
  • 由知识和目的生成策略(决策)的能力
  • 实施策略取得效果(施效)的能力

信息、知识、智能之间的关系

  • 信息是基本资源; 知识是对信息进行加工所得到的抽象化产物; 策略是由客体信息和主体目标演绎出来的智慧化身,
    智能是把信息资源加工成知识、进而把知识激活成解决问题的策略并在策略信息引导下 具体解决问题的全部能力。
    总结:信息经加工提炼而成知识,知识被目的激活而成智能。

AI对知识表示方法的要求

  • (1)表示能力
  • (2)可理解性
  • (3)便于知识的获取
  • (4)便于搜索
  • (5)便于推理

经典逻辑推理:自然推理 归结推理 与或形推理

命题的两种类型:原子命题和复合命题

谓词公式化简为子句集的步骤

  • (1)消去谓词公式中的连接词 P→Q ⇔﹁ P∨Q P↔Q ⇔ (P∧Q)∨(﹁P∧﹁Q)
  • (2)把否定符号移到紧靠谓词的位置上
  • 反复使用双重否定律 ﹁(﹁P) ⇔ P 摩根定律﹁(P∧Q) ⇔﹁P∨﹁Q ﹁(P∨Q) ⇔﹁P∧﹁Q
    量词转换率﹁ (∀x)P(x) ⇔ (∃x) ﹁P(x) ﹁ (∃x)P(x) ⇔ (∀x)¬P(x)
  • (3)变量标准化
  • (4)化为前束形
  • (5)消去存在量词
  • (6)化为标准形
  • (7)略去全称量词
  • (8)消去合取词
  • (9)子句变量标准化

一阶谓词逻辑知识表示法的特点

  • 优点: 自然性 精确性 严密性 容易实现
  • 局限性: 不能表示不确定的知识 组合爆炸 效率低

归结推理:在定理证明系统中,已知一公式集F1,F2,…,Fn,要证明一个公式W (定理)是否成立,即要证明W是公式集的逻辑推论时,一种证明法就是要证明F1∧F2∧…∧Fn→W为永真式。

产生式知识表示

  • 确定性规则知识的产生式表示
  • 不确定性规则知识的产生式表示
  • 确定性事实性知识的产生式表示
  • 不确定性事实性知识的产生式表示

产生式与谓词逻辑中的蕴含式的区别

  • (1)除逻辑蕴含外,产生式还包括各种操作、规则、变换、算子、函数等。
  • (2)蕴含式只能表示精确知识,而产生式不仅可以表示精确的知识,还可以表示不精确知识。

产生式系统的要素:

  1. 一个综合数据库
  2. 一组产生式规则
  3. 一个控制系统

控制策略可分为两类:

  • 不可撤回方式 (Irrevocable)
  • 试探性方式 (Tentative)
    1. 回溯方式(Backtracking)
    2. 图搜索方式 (Graph-search)

三种控制方式比较
不可撤回方式相当于沿着单独的一条路向下延伸搜索下去;
回溯方式则不保留完整的搜索树结构,只记住当前工作的一条路径,回溯就是对这条路 径进行修正;
图搜索方式则记下完整的搜索树 。

架系统和语义网络是人工智能中最常用的两种结构化知识表示方法,

面向对象的表示方法是很有发展前途的结构化知识表示方法。

语义网络是由节点和边组成的一种有向图。其中节点表示事物、对象、概念、行为、性质、状态等;有向边表示节点之间的某种联系或关系。

框架表示法:一种结构化的知识表示方法,已在多种系统中得到应用。
框架(frame):一种描述所论对象(一个事物、事件或概念)属性的数据结构。

  • 一个框架由若干个被称为“槽”(slot)的结构组成,每一个槽又可根据实际情况划分为 若干个“侧面”(faced)。
  • 一个槽用于描述所论对象某一方面的属性,有一个槽值或者有若干个侧面。
  • 一个侧面用于描述相应属性的一个方面,有若干个侧面值。
  • 槽和侧面所具有的属性值分别被称为槽值和侧面值。用< >括的槽值是框架名。
  • 框架是一种经过组织的结构化知识表示方法。每个框架形成一个独立的知识单元,其上的操作相对独立,从而使框
  • 架表示有较好的模块性,便于扩充。
  • 框架表示中的附加过程侧面使框架不但能描述静态知识,而且还能反映过程性知识,而且把两者有机地融合在一起,形成一个整体系统。
  • 不足:框架结构本身还没有形成完整的理论体系,框架、槽和侧面等各知识表示单元缺 乏清晰的语义,其表达知识的能力尚待增强,支持其应用的工具尚待开发。

脚本(script)是一种结构化的表示,用来描述特定上下文中固定不变的事件序列。
脚本组成

  • 进入条件(entry condition):要调用这个脚本必须满足的世界描述。 ’
  • 结果(result):脚本一旦终止就成立的事实。
  • 道具(prop):支持脚本内容的各种“东西”。
  • 角色任务(role):各个参与者所执行的动作。
  • 场次(scene)。

知识图谱本质上是语义网络(semantic network)知识库

  • 图的结点代表实体(entity)或者概念(concept), 图的边代表实体/ 概念之间的各种语义关系,比如说两个实体之间的相似关系。
  • 知识表示 知识图谱构建 知识图谱应用

逻辑表示方法的优点:(1)严格性 (2)通用性 (3)自然性(4)明确性(5)模块性
不足:(1)效率低 (2)灵活性差

搜索就是找到智能系统的动作序列的过程。

求解问题包括:

  • 目标表示
  • 搜索
  • 执行

搜索可以根据是否使用启发式信息分为:

  • 1.盲目
    只是可以区分出哪个是目标状态。 一般是按预定的搜索策略进行搜索。 没有考虑到问题本身的特性,这种搜索具有很大的盲目性,效率不高,不便于复杂 问题的求解。
  • 2.启发式搜索
    在搜索过程中加入了与问题有关的启发式信息,用于指导搜索朝着最有希望的方向 前进,加速问题的求解并找到最优解。

按表示方式分:

  • 状态空间搜索
  • 与或树搜索

搜索策略评价标准:完备性 时间复杂性 空间复杂性 最优性

搜索控制策略:

  • 不可撤回的控制策略
  • 试探性控制策略: 回溯型 图搜索

启发式搜索:如果在选择节点时能充分利用与问题有关的特征信息,估计出节点的重要性,就能在搜索时选择重要性较高的节点,以便求得最优解。
用来评估节点重要性的函数称为评估函数。
评估函数为:f(x)=g(x)+h(x)
g(x)——从初始节点S0到节点x的实际代价;
h(x)——从x到目标节点Sg的最优路径的评估代价,它体现了问题的启发式信息,其 形式要根据问题的特性确定,h(x)称为启发式函数。

在图搜索策略的基础上,给出A*算法。
评估函数f :f(n) = g* (n)+h* (n)
g* (n)为起始节点到节点n 的最短路径的代价,
h* (n)是从n 到目标节点的最短路径的代价

推理是人类的思维过程,它是从已知事实(证据)出发,通过运用相关的知识逐步推出某个结论的过程。
其中已知事实知识是构成推理的两个基本要素。

不确定性推理就是从不确定性初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的思维过程。

由于证据规则的不确定性,导致了所产生的结论的不确定性

不确定性推理反映了知识不确定性的动态积累传播过程,推理的每一步都需要综合证据和规则的不确定因素,通过某种不确定性测度,寻找尽可能符合客观实际的计算模式,通过不确定测度的传递计算,最终得到结果的不确定测度

在专家系统中,不确定性表现在证据、规则和推理三个方面

要实现对不确定性知识的处理,要解决

  1. 不确定知识的表示问题(规则的不确定性、事实的不确定性)
  2. 不确定知识的计算问题
    (1)不确定性的传递算法
    (2)结论不确定性合成
    (3)组合证据的不确定性算法
  3. 不确定性表示
  4. 计算的语义解释问题

两种不确定性推理

  1. 模型方法(数值法 非数值法)
  2. 控制方法

推理系统的定理集合随着推理过程的进行而单调地增大

在C-F模型中,确定性因子定义为信任与不信任的差,CF(H,E)定义为:CF(H,E)=MB(H,E)-MD(H,E)

MB(Measure Belief,MB)称为信任增长度
MD(Measure Disbelief,MD)称为不信任增长度
当MB(H,E)>0时,有P(H,E)>P(H),这说明由于E所对应的证据的出现增加了H的信任程度,但不信任程度没有变化。
当MD(H,E)>0时,有P(H,E)<P(H),这说明由于E所对应的证据的出现增加了H的不信任程度,而不改变对其信任的程度。

若CF(H,E)>0,则P(H|E)>P(H)。说明由于前提条件E所对应证据的出现增加了H为真的概率,即增加了H的可信度,CF(H,E)的值越大,增加H为真的可信度就越大。
若CF(H,E)<0,则P(H|E)<P(H)。这说明由于前提条件E所对应证据的出现减少了H为真的概率,即增加了H为假的可信度,CF(H,E)的值越小,增加H为假的可信度就越大。

根据CF、MB、MD的定义,可得性质:
(1)互斥性: 对同一证据,它不可能既增加对H的信任程度,又同时增加对H的不信任程度,这说明MB与MD是互斥的。即有如下互斥性,
当MB(H,E)>0时,MD(H,E)=0
当MD(H,E)>0时,MB(H,E)=0
(2)值域
0≤MB(H,E)≤1
0≤MD(H,E)≤1
-1≤CF(H,E)≤1
(3)典型值
当CF(H,E)=1时,有P(H|E)=1,它说明由于E所对应证据的出现使H为真。此时,MB(H,E)=l,MD(H,E)=0
当CF(H,E)=-1时,有P(H|E)=0,说明由于E所对应证据的出现使H为假。此时,MB(H,E)=O,MD(H,E)=1
当CF(H,E)=0时,则P(H|E)=P(H),表示H与E独立即E所对应的证据的出现对H没有影响。
(4)对H的信任增长度等于对非H的信任增长度

模糊集合的定义
论域:所讨论的全体对象,用 U 等表示。
元素:论域中的每个对象,常用a,b,c,x,y,z表示。
集合:论域中具有某种相同属性的确定的、可以彼此区别的元素的全体,常用A,B等表示。
在经典集合中,元素a和集合A的关系:a属于A 或 a不属于A,即只有两个真值“真”和“假”。

模糊决策:最大隶属度法 、加权平均判决法、中位数法

机器学习的基本结构:

  1. 环境:向系统的学习部分提供某些信息。
  2. 学习:利用这些信息修改知识库,以增进系统执行部分完成任务的效能。
  3. 执行:根据知识库完成任务,同时把获得的信息反馈给学习部分。

选择表示方式时要兼顾以下4个方面:

  1. 表达能力强
  2. 易于推理
  3. 容易修改知识库
  4. 知识表示易于扩展

强化学习(reinforcement learning),又称再励学习或评价学习。所谓强化学习就是智能系统从环境到行为进行映射的学习,目的是使强化信号(回报函数值)最大。强化学习主要包括**感知、行动、奖赏(评价)**三个环节。

有监督学习:网络的输出有一个评价的标准,网络将实际输出和评价标准进行比较,由其误差信号决定连接权值的调整。评价标准是由外界提示给网络的,相当于由有一位知道正确结果的教师示教给网络,故这种学习又称为有教师学习。在这种学习中网络的连接权值一般根据δ规则进行调整。
无监督学习(无教师学习):一种自组织学习,此时网络的学习完全是一种自我调整的过程,不存在外部环境的示教,也不存在来自外部环境的反馈来指示网络期望输出什么或者当前输出是否正确。无监督学习可以实现主分量分析 (Principle Component Analysis)、聚类 (Clustering)、编码 (Encoding)以及特征映射 (Feature Mapping)的功能。

有监督学习具有分类精细、准确的优点,但学习过程复杂。
无监督学习具有分类灵活、算法简练的优点,但学习过程较慢。

混合学习过程一般事先用无监督学习抽取输入数据的特征,然后将这种内部表示提供给有监督学习进行处理,以达到输入输出的某种映射。

NN的性质和能力:

  1. 非线性
  2. 输入输出映射
  3. 适应性
  4. 证据响应
  5. 背景信息
  6. 容错性
  7. VLSI实现
  8. 分析和设计的一致性
  9. 神经生物类比

神经元模型:

  1. 突触
  2. 加法器
  3. 激活函数

网络结构:单层前馈网络、多层前馈网络、递归网络

深度学习是一类基于神经网络的机器学习算法,网络结构包含两个以上非线性隐含层。

简述误差反向传播学习算法的主要思想。
误差反传算法的主要思想是把学习过程分为两个阶段:第一阶段
(正向传播过程)给出输入信息通过输入层经隐含层逐层处理并计算每个单元
的实际输出值;第二阶段(反向过程),若在输出层未能得到期望输
出值,则逐层递归的计算实际输出与期望输出之差值(误差)以便根据此差值
调节权值。

什么是可信度?由可信度因子 CF(H,E)的定义说明它的含义
人们在长期的实践活动中,对客观世界的认识积累了大量的经验,当面临一个新事物或新情况时,往往可用这些经验对问题的真、假或为真的程度作出判断。这种根据经验对一个事物或现象为真的相信程度称为可信度。
在 C-F 模型中,知识是用产生式规则表示的,其一般形式为:
IF E THEN H (CF(H, E))
其中,CF(H, E)是该条知识的可信度,称为可信度因子。
CF(H, E)反映了前提条件与结论的联系强度。它指出当前提条件 E 所对应的证据为真时,它对结论 H 为真的支持程度,CF(H, E)的值越大,就越支持结论 H 为真。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平