人工智能引论¶
约 2438 个字 3 张图片 预计阅读时间 8 分钟
Note
纯补天产物,仅供参考。
知识表达与推理¶
目前,代表性的知识表达方法有命题逻辑、谓词逻辑、产生式规则、框架表示法及知识图谱
命题逻辑¶
-
逻辑:进行正确推理和充分论证的研究
-
命题:能确定为真或为假的陈述句
-
原子命题:不包含其他命题作为其组成部分的命题,又称简单命题
-
复合命题:包含其他命题作为其组成部分的命
-
命题联结词:与、或、非、条件、双向条件
-
-
逻辑等价:给定命题 \(p\) 和命题 \(q\),如果 \(p\) 和 \(q\) 在所有情况下都具有相同的真假结果,那么 \(p\) 和 \(q\) 在逻辑上等价,记作 \(p \equiv q\)
-
逻辑推理:逻辑推理是根据某种特定策略,从前提出发推出结论的过程。用符号 \(\implies\) 来表示推理过程,\(\implies\) 的左侧表示推理的前提,\(\implies\) 的右侧表示推理的结论。
- 假言推理:\(\alpha \rightarrow \beta, \alpha \implies \beta\).
- 与消解:\(\alpha_1 \land \alpha_2 \land \cdots \land \alpha_n \implies \alpha_1, \alpha_2, \cdots, \alpha_n\)
- 与导入:\(\alpha_1, \alpha_2, \cdots, \alpha_n \implies \alpha_1 \land \alpha_2 \land \cdots \land \alpha_n\)
- 双重否定:\(\lnot (\lnot \alpha) \implies \alpha\)
- 单项消解:\(\alpha \lor \beta, \lnot \beta \implies \alpha\)
- 归结:\(\alpha \lor \beta, \lnot \beta \lor \gamma \implies \alpha \lor \gamma\)
谓词逻辑¶
-
命题逻辑无法表达局部与整体、一般与个别的关系
-
谓词逻辑:刻画主体(个体和群体)之间逻辑关系的方法,原子命题被分解为个体、谓词和量词
-
个体:所研究领域中可以独立存在的具体或抽象的概念
-
谓词:用来刻画个体属性或者描述个体之间 关系 存在性的元素,其值为真或为假,是一个从定义域到 \(\{T, F\}\) 的映射
-
量词:用于描述群体的共同属性
- 全称量词:表示一切的、所有的、凡是、每一个等,用符号 \(\forall\) 表示
- 存在量词:表示存在、有一个、某些等,用符号 \(\exists\) 表示
-
只包含个体谓词和个体量词的谓词逻辑称为一阶谓词逻辑
-
约束变元和自由变元:约束变元受到全称量词或存在量词的约束,自由变元则不受约束
-
谓词逻辑推理:
- 全称量词消去:\(\forall x P(x) \implies P(y)\)
- 全称量词引入:\(P(y) \implies \forall x P(x)\)
- 存在量词消去:\(\exists x P(x) \implies P(c)\)
- 存在量词引入:\(P(c) \implies \exists x P(x)\)
知识图谱推理¶
-
知识图谱:有向图,用于描述现实世界中实体与实体之间的关系
- 节点:表示客观世界中的一个实体
- 两个节点之间的连线:表示节点之间的某种关系
-
知识图谱中存在连线的两个实体可表达为三元组形式,这种三元组也可以表示为一阶逻辑(FOL)的形式
-
知识图谱推理:根据已有的知识图谱推导出节点之间的其他关系,常见的两种方法是归纳逻辑程序设计和路径排序算法
-
归纳逻辑程序设计(ILP):使用一阶谓词逻辑进行知识表示,通过修改和扩充逻辑表达式对现有知识归纳,完成推理任务。
-
FOIL(一阶归纳学习器):ILP 的代表性方法,通过 序贯覆盖 实现推理,目标是得到以目标谓词 \(P\) 为结论的推理规则
- 规则头:目标谓词 \(P\),需要得到一个以 \(P\) 为结论的推理规则
- 训练样例:
- 正例集合 \(E^+\):已有知识图谱中满足 \(P\) 的实例
- 反例集合 \(E^-\):已有知识图谱中与 \(P\) 矛盾的实例,通常通过两个已知存在与 \(P\) 矛盾的关系的实体来构造
- 背景知识集合:知识图谱中的其他谓词实例化结果
- 推理过程:从空集开始,逐步添加目标谓词的前提约束谓词,直到构成的推理规则不覆盖任何反例
-
决策依据:信息增益值
\[ \mathrm{FOIL\_ Gain} = \hat{m_+} \cdot \left(\log_2 \frac{\hat{m_+}}{\hat{m_+} + \hat{m_-}} - \log_2 \frac{m_+}{m_+ + m_-} \right) \]每次选择信息增益值最大的谓词加入前提约束谓词集合,加入后需要将不符合该形式的实例从 \(E^+\) 和 \(E^-\) 中删除,进行下一轮迭代.
-
路径排序算法(PRA):将实体之间的关联路径作为特征,来学习目标关系的分类器
- 确定目标关系和训练样例(正例、负例)
- 特征抽取:生成并选择路径特征集合
- 特征计算:计算每个训练样例对应的特征值
- 分类器训练:根据特征值和样例类型训练目标关系的分类器
- 预测:对于测试样例,根据路径计算特征值,使用分类器进行预测
-
分布式表示下的知识推理:将个体和谓词抽象为分布式表达(向量表达),然后学习度量函数,与自然语言处理的方法类似
概率推理¶
-
概率图:用概率描述两个相连节点之间的关联,称为概率图,反映了推理过程中的不确定性. 一般分为 贝叶斯网络 和 马尔可夫网络 两大类.
-
贝叶斯网络:有向无环图,用有向边来表示节点和节点之间的单向概率依赖.
- 贝叶斯网络满足局部马尔可夫性:给定一个节点的父节点的情况下,该父亲节点有条件地独立于它的非后代节点(Hint:计算条件概率的时候可以不用考虑其父节点之外的条件)
-
马尔可夫网络:无向图,用无向边来表示节点和节点之间的双向概率依赖.
- 马尔可夫逻辑网络:在概率统计中引入谓词逻辑而融入结构化知识,在一阶谓词逻辑中添加不确定性而对严格推理进行松绑,可以更好的反映客观世界的复杂性
-
给定一个由若干规则构成的集合,给集合中的每条推理规则赋予一定的权重,则可通过以下公式计算断言 \(x\) 成立的概率:
\[ P(X = x) = \frac{1}{Z} \exp \left( \sum_{i} w_i n_i(x) \right) \]其中 \(Z = \displaystyle\sum_{x \in \mathscr{X}} \exp \left( \sum_{i} w_i n_i(x) \right)\) 为归一化常数,\(n_i(x)\) 为推导 \(x\) 所涉及的第 \(i\) 条规则的取值,\(w_i\) 为规则 \(i\) 的权重
计算方法:根据给定条件确定上式中的逻辑表达式取值
因果推理¶
-
辛普森悖论:在总体样本上成立的某种关系在分组样本中不一定成立,甚至结论相反. 说明忽略某些某些因数可能会改变已有的结论
-
变量关联关系的三种来源:
- 因果关联:\(T\) 导致 \(Y\),则称 \(T\) 与 \(Y\) 之间存在因果关联
- 混淆关联:\(T\) 与 \(Y\) 有共同的原因变量,则称 \(T\) 与 \(Y\) 之间存在混淆关联
- 选择关联:\(T\) 与 \(Y\) 有共同的结果变量,则称 \(T\) 与 \(Y\) 之间存在选择关联
-
因果推理:从复杂数据中甄别因果关联,常见模型有潜在结果框架(Neyman-Rubin 因果模型)和结构因果模型
-
(结构因果模型中的)因果图:有向无环图
-
使用因果图可以方便地表示多个变量的联合概率分布:
\[ P(x_1, x_2, \cdots, x_n) = \prod\limits_{j=1}^n P(x_j \mid x_{pa(j)}) \]图模型上的独立性假设将“高维”估计问题转化为“低维”概率分布问题.
维度灾难:当变量数较多、数据量不足、因果图结构未知时,估计联合概率分布十分困难
-
-
随机对照实验:影响结果的输入变量只有一个是随机变化的,其他均保持不变,那么结果变量的变化一定是由该输入变量引起的.
-
因果干预:改变明确存在关联关系的某变量取值,研究变量取值改变对结果变量的影响.
-
do 算子:计算当系统中一个变量取值发生变化、其他变量保持不变时,系统输出结果是否变化
具体地,对 \(X\) 进行干预时,引入 do 算子,记作 \(do(X=x)\). \(P(Y=y \mid do(X=x))\) 表示对 \(X\) 进行干预后,令其为 \(x\) 时,\(Y\) 取值为 \(y\) 的概率.
-
因果效应:\(P(Y=y \mid do(X=x))\)
- 可用引入干预后的操纵图模型中的条件概率(即操纵概率) \(P_m(Y=y \mid X=x)\) 来表示
-
操纵图:将因果图中所有指向被干预变量 \(X\) 去除后,剩下的图被称为操纵图
-
调整公式:
\[ P(Y=y \mid do(X=x)) = P_m(Y=y \mid X=x) = \sum\limits_{z} P(Y=y \mid X=x, Z=z) \cdot P(Z=z) \] -
因果效应的通式:设 \(PA\) 为 \(X\) 的父节点集合,则 \(X\) 对 \(Y\) 的因果效应可以表示为:
\[ P(Y=y \mid do(X=x)) = \sum\limits_{z} P(Y=y \mid X=x, PA=z) \cdot P(PA=z) \]
因果图与操纵图
-
反事实推理:
-
反事实计算步骤:溯因、动作、预测
搜索与问题求解¶
机器学习¶
神经网络与深度学习¶
- 赫布理论:神经元之间持续、重复的经验刺激可导致突触传递效能增加