人工智能概率的认识及优化建议丨人工智能预测技巧
【人工智能概率的认识及优化建议丨人工智能预测技巧】lot物联网小编为你整理了的相关内容,希望能为你解答。
点击关注异步社区头条号,程序员的思想汇IT学习的集散地
人工智能入门其实一点也不难,跟着我一起交流,相信你会事半功倍。专栏《100节课带你从小白入门人工智能》,结合多年教学经验、精心撰写,堪称“人工智能的百科全书”。涵盖了人工智能简史、搜索方法、知情搜索、博弈中的搜索、人工智能中的逻辑、知识表示、产生式系统、专家系统、机器学习和神经网络、遗传算法、自然语言处理、自动规划、机器人技术、高级计算机博弈、人工智能的历史和未来等主题。对人工智能一无所知的小白一样可以轻松入门。
小复习上一章节我们讲了人工智能入门100讲:人工智能的不确定性模糊集
8.4 概率理论和不确定性有些人认为,概率论起源于1654年。当时,布莱兹·帕斯卡(Blaise Pascal)的一个朋友对赌博问题感兴趣,结果,Pascal和皮埃尔·德·费马(Pierre de Fermat)之间有了一系列的数学交流。概率理论在处理不确定性方面起着重要的作用,这不足为奇。但是它有一个障碍,阻碍了它得到更广泛的接受。大多数人在评估风险时都是主观的(而不是分析性的)。例如,比起驾驶汽车,人们更害怕乘坐飞机。然而,在统计学上,众所周知的事实是,乘坐飞机比驾驶汽车更安全。
人物轶事
洛特菲·扎德(Lotfi Zadeh)
洛特菲·扎德(1921年生),出生于阿塞拜疆的巴库,同时也是伊朗人的后裔,长期居住在美国。与他所提出的著名概念一样,他的背景横跨了边界——他是一个国际人。“问题不在于我是美国人、俄罗斯人、伊朗人、阿塞拜疆人,还是别的什么地方的人,”他会这样告诉你,“我受到所有这些人和文化的塑造,在这些人之中,我感觉到很舒服。”
Zadeh 10岁时,随家人回到了他父亲的故乡伊朗。1942年,他毕业于德黑兰大学,获得电气工程学士学位。第二次世界大战期间,他随家人搬到了美国。他于1946年在麻省理工学院获得硕士学位,于1949年获得哥伦比亚大学博士学位。
1959年,他加入了伯克利大学电气工程系,1963年,他担任了电气工程系和计算机科学学院(EECS)的院长。
以下是贝蒂·布莱尔对Zadeh进行采访的一个片段。
问:“早在1965年发表关于模糊逻辑的初步论文时,你认为模糊逻辑会被接受吗?”
Zadeh:“嗯,我知道它会变得很重要。事实上,我曾想将它封在一个有日期的信封中,并附上我的预测,然后在二三十年之后打开它,看看我的直觉是否正确。我意识到这篇论文标志着一个新的方向。我曾经这样想过:有一天,模糊逻辑将成为伯克利电气工程计算机系统学院中最重要的事情之一。我从来没有想过这会成为一个世界性的现象。我的期望还是相对中庸的。”
从采访中我们可以看出,Zadeh认为模糊逻辑在经济学、心理学、哲学、语言学、政治学和其他社会科学等诸多领域都会有广泛的应用。他对只有如此少数的社会科学家开发其应用的可能性感到惊讶。早在1965年,Zadeh并没有指望模糊逻辑主要用于工程师的工业过程控制和“智能”消费产品。“智能”消费产品的例子包括手持式摄像机(模糊逻辑弥补了抖动的手部动作)以及微波炉(我们只要按下一个按钮,就能够完美地烹饪食物)。
因为Zadeh觉得“模糊逻辑”准确地描述了理论的精髓,所以他更加确定要用这个术语。他曾经考虑过其他术语,如“软”“不清晰”“难以区分”和“弹性”,但是他觉得这些术语不能更准确地描述他的方法。
模糊逻辑是一种“粗略”而不是“精练”的做法,这意味着它比传统的计算方式更经济,更容易实现。他给出了一个停车的例子:如果一个人在一个间隔只有1/10英寸的停车场中找到一辆车,这将是一项非常困难的任务,但是可以使用更“粗略”的方法。
在编写关于模糊逻辑的论文时,马克·霍普金斯(Mark Hopkins)得到了广泛的回应,并在以下领域中发现了模糊逻辑的应用:财务、地理、哲学、生态学、农业过程、水处理、丹佛国际机场的行李处理、卫星图像的遥感图像、手写识别和核科学以及股票市场和天气。西雅图的波音公司报道说,它已经将模糊逻辑集成到了海军6号自动驾驶仪的控制器中,该飞行器伸出一根长天线与潜艇进行通信。
Hopkins发现了模糊逻辑应用于生物医学领域的其他例子,包括诊断乳腺癌、类风湿关节炎、绝经后的骨质疏松症和心脏病,监测糖尿病的麻醉、血压和胰岛素,作为术后疼痛控制器,产生大脑的磁共振图像,建立智能床边监护仪和医院通信网络。
迄今为止,应用模糊逻辑最为普遍的国家是日本、德国和美国。由于这个概念是如此广泛,因此其应用的可能性是无限的,它几乎可以应用于任何领域。
参考资料
Zadeh L A. Fuzzy sets. Information and Control 8:338 –353, 1965.
对概率理论进行任何讨论的起点都是从执行某个过程的实验开始过程,例如,考虑两次抛出一枚均匀硬币的实验。
{!-- PGC_COLUMN --}在第4章中,我们研究了这个例子,并用概率理论中一些基本原理来正确分析博弈中涉及概率的部分。实验S的样本空间是所有可能结果的集合(结果有时称为样本点集合)。在例子中,硬币抛出两次,S为{(H,H),(T,T),(T,H),(H,T)}。
请注意,对于第一次正面、第二次背面的结果,与只出现一次背面的结果,我们是做了区分的。样本空间S由4个样本点组成,因此,有24或16个事件是可能的:
E1 = {(T,H,(H,T)},对应于一个正面和一个背面。
E2 = {(T,T),(H,H)},每次抛的事件都导致了相同的面朝上。
E3 = {(T,T),(T,H)},第一次抛出是背面的事件。
……
最后,事件Ei的概率定义为:
P(Ei)=发生Ei的数目除以可能结果的总数
例如,刚刚描述的事件E3的概率等于:
P(E3)= 2/4或1/2,当均匀硬币被抛出时,对应于该事件有两个样本点,而| S |等于4。
概率测度遵循如下3个基本公理。
对于任何事件E:P(E)>=0。P(S)= 1 //当投掷两枚硬币时,肯定会发生一些结果。如果事件E1和E2相互排斥,则P(E1∪E2)= P(E1) P(E2)。例如,如果E1对应于在硬币投掷两次时两次都是正面,E2对应于两次都是背面,那么E1∪E2是对应于发生了两个正面或两个背面的事件。此事件的概率等于:
P(E1∪E2) = P(E1) P(E2) = 1/4 1/4 = 1/2
满足这3个公理的函数被称为概率函数。
示例8.2
一个瓮里有9颗弹珠,3个弹珠是蓝色的,3颗弹珠是深粉红色的,3颗弹珠是红色的。从瓮里一次性随机抽出两颗弹珠(你的眼睛是闭着的),两个弹珠都是红色的概率是多少?
P(2r) = (3C2) / (9C2) = 3/36 = 1/12分子表示的是可以取出的两颗红色弹珠方法的数目。编号红色弹珠:r1,r2和r3。然后,这些事件中都取出了两颗红色弹珠:{r1,r2}、{r1,r3}和{r2,r3}。分母对应于取出两颗弹珠所得到结果的总数,如{r1,r2}、{p1,p2}、{p1,p3}等。
假设在示例8.2中,不能通过分析得出概率,那么你可以通过进行以下一系列实验来代替分析:从瓮中连续10次取出两颗弹珠(每次尝试后,还回弹珠)。从瓮中抽出两颗弹珠,连续取出100次、1000次……。随着实验重复的次数越来越多,我们认为,获得两颗红色弹珠的频率接近于此事件的概率。这个观察有一个更正式的定理,这就是所谓的大数法则。事实上,在此书的后面章节中(见第12章),我们会将概率的这个观点应用到蒙特卡洛练习中求得π的近似值。
假设E1是当均匀硬币被抛出两次时第一次正面朝上的事件,E2是当硬币被抛出两次时第二次背面朝上的事件,那么发生E1和E2事件(E1,E2)的联合概率等于{H,T}。也就是说,当均匀硬币被抛出两次时,第一次正面朝上、第二次背面朝上的概率,P(E1,E2)= P(第一次抛掷时H)×P(第二次抛掷时T)= 1/2×1/2 = 1/4。
再次思考示例8.2。假设已知取出的两颗弹珠都是相同的颜色,请计算出两颗弹珠都是红色的概率。实质上,样本空间从(9C3)缩小到3×(3C2),希望计算得到的是条件概率:
P(两个红色|两颗弹珠都是相同的颜色)
P(2r |两个相同颜色)=(3C2)/(3×(3C2))= 1/3
在现实生活中,概率理论应用于许多情况。银行对房主偿还抵押贷款的概率感兴趣;医生在治疗有某些症状的患者时,会权衡几种相互矛盾的诊断发生的概率;人们在赛马场上对一匹马下赌注时,可能会考虑赢的机会大小。
在考虑条件概率时,一个重要的结果是贝叶斯定理。假设一些事件的概率B > 0,那么P(A | B)可以通过以下计算得到:
P (A|B) = [P (B|A) P (A)] / P (B)
示例8.3 贝叶斯理论
假设要对监狱里的所有新囚犯进行简单的体格检查。假设80%的健康人可以通过这个检查,60%的具有轻度疾病的个人可以通过这个检查,30%的具有严重疾病的囚犯也可以通过这个检查。假设,25%的新囚犯身体健康(事件E1),50%有轻度疾病(E2),25%有严重疾病(E3)。对于一个通过这个体格检查的囚犯(事件B),这个囚犯身体状况良好的条件概率是多少?
P(B|E1) = 0.8, P(B|E2) = 0.6, P(B|E3) = 0.3, P(E1) = P(E3) = 0.25, P(E2) = 0.50
使用贝叶斯定理,得到:
P(B | E1)= 0.8,P(B | E2)= 0.6,P(B | E3)= 0.3,P(E1)= P(E3)= 0.25,P(E2)= 0.50
P(健康囚犯|通过健康检查)= P(E1 | B)
= P(B | E1)P(E1)/
P(B | Ei)P(Ei)
= [(0.8)×(0.25)/(0.8)×(0.25) (0.6)×(0.5) (0.3)×(0.25)] = 0.35
一开始,我们可能认为随机选择的新囚犯有0.25的概率身体状况良好,但是,在通过体格测试之后,这个概率上升到了0.35。
我们经常用贝叶斯网络来应对不确定性。假设你患了皮疹,去医院看病。为了妥善治疗,医生必须确定导致这种皮疹的原因。常见原因包括对药物或食品的过敏反应,或与动物(也许是宠物)的接触。
医生可能会看到图8.7所示的情况:
这是一个贝叶斯网络,其中节点代表变量。可能造成症状的 3 个变量以箭头指向所导致的症状。p1、p2和p3标记了这些弧的概率。这些概率是如何得到的?这是医生根据先前诊断这种疾病的经验对这种情况做出的主观评估。由于过敏症(MSG、花生、玉米淀粉)和环境因素(猫、狗)造成的发病率较为常见,因此医生可能会得出结论:p1远小于p2或p3。
图8.7 分析症状的贝叶斯网络
8.5 本章小结本章简要介绍了用于处理人工智能中不确定性的两种工具。正如我们所看到的,生活不是非黑即白,也有许多灰色区域。例如,人到了几岁才被认为是成熟了?在美国,年满18岁就可以入伍;但是在纽约州的酒吧点酒,你必须年满21岁。要竞选总统,你必须年满35岁。我们认为成熟是一个模糊的概念。在许多现代应用的控制中,从数码相机到洗衣机,模糊逻辑已经实现了广泛的应用。
概率论起源于人们希望了解在概率游戏中能够取胜的机率。制药公司在测试其产品有效性时,采用了这个工具。许多专家系统用概率来应对这些系统所得到的推论中固有的不确定性。本章绝对不是完整的。事实上,我们还没有讨论过处理人工智能系统不确定性的第三种方法。Dempster-Shafer理论测量了分配给事件概率的置信度。人们相信,对于一些事件E,bel(E)<=P(E),这定义为E所导致的所有结果的总和。事件E的合理性,pl(E)是不与E矛盾的所有结果的总和,因此,P(E)<=pl(E)。在传感器融合中经常用到这个方法。例如,天文学家在观察遥远的星星时,可以使用光学望远镜、光谱仪和射电望远镜。这些工具所得到的观察结果可能会互相矛盾。Dempster-Shafer理论提供了一个用演算来解决相互矛盾的证据。
讨论题
1.列出日常生活中与模糊集相对应的5件事情。
2.关于明确集和模糊集,回答如下问题:
a.令S是具有n个元素的明确集,S将有多少个子集?
b.如果S是具有n个元素的模糊集,S将有多少个子集?
3.给出日常生活中一个模糊推理的例子。
4.“模糊逻辑和概率基本上是一样的。”讨论这个论断。
5.A~B表示集合的差,或者说在A中但不在B中的所有元素。选择一个合适的度量来计算两个集合之间的差(例如:max,min,etc)。
6.令X = {a,b,c}。使用隶属函数符号列出X的所有子集。
7.在分析以下情况时,你认为模糊逻辑优于概率论吗(或反之亦然)?
a.新药的有效性。
b.评估公路安全。
c.天气报告的准确性。
d.购买彩票所涉及的风险。
e.购买股票所涉及的风险。
f.分析附近湖泊的污染水平。
8.给出日常生活中应用条件概率的一个例子(可能是不知不觉地运用的)。
练习
1.令全集为X = {x1, x2, x3}。思考以下几个集合:
A = 0.2 / x1 0.1 / x2 0.2 / x3
B = 0.2 / x1 0.4 / x2 0.7 / x3
a.A∪B =?
b.A∩B=?
c.Ac∩Bc=?
2.为以下各项给出模糊隶属函数:
a.某人X超过100磅重。
b.星球Y比太阳大得多。
c.汽车Z的成本约为30 000美元。
d.对于x<=5,μA(x)= 0,当x > 5时μA(x)= 1 (x-5)-2。
3.思考本章讨论的高个子的例子。给出下列集合的隶属函数:
a.非常高的人
b.不是很高的人
4.给出以下集合的隶属函数:
M:成熟的人
Y:年轻人
O:老人
a.对以下人群进行分类:
i.18岁
ii.21岁
iii.42岁
iv.61岁
b.对于上述的部分B的iii,请解释一下,基于你的答案,如何去模糊化(即从你的模糊分类中如何获得年龄为42岁的人)?
5.我们有许多种方式来评判电视是“国产品牌”还是“外国品牌”。例如,美国电视机的许多组件是在墨西哥或亚洲制造的。同样也有这样的实例,具有外国名字的电视机的实际产地就是本国。请给出两个模糊隶属函数,一个用于外国电视机(μF(x)),一个用于国内品牌(μD(x))。对于60%的μF(x)和μD(x),你的定义是什么?
a.假设以下规则与上述规则具有相同的隶属函数:
规则1:如果电视机是国内电视机,那就维持关税不变(征收进口税)。
规则2:如果电视机是外国电视机,则提高关税。
对于具有40%外国品牌的电视机,你有什么推论?
6.假设在度假胜地旅游的人,从长期看来,有1%的机会患有皮肤癌(太阳暴晒)。该度假胜地设有诊所来帮助检测这种疾病。假设诊所使用的筛查技术得出的假阳性率(即20%没有得病的人被会检测出癌症阳性)为0.2,假阴性率为0.1(即10%皮肤癌患者的测试结果为阴性)。假设某个人的测试结果为皮肤癌阳性,他实际患有这种疾病的概率是多少?
7.如果打赌的人认为自己的打赌从长远来看不会不输不赢,那么认为这样的打赌是公平的。下列的哪些打赌会被视为是公平的?
a.抛掷均匀硬币。你支付1美元来猜,如果猜测正确,你可以获得2美元。
b.你支付5美元来抛掷两个骰子。如果总点数为7或11,你可以获得20美元作为回报。
8.“荷兰赌”是打赌者所认为的庄家注定亏本的某些赌注的混合。思考这样一种情况(三卡问题):有三张卡片,一张是两面红色(RR),一张一面是红色、另一面是白色(RW),第三张则是两面都是白色(WW)。闭上眼睛,抽出一张卡片,抛到空中。
a.P(选中RR卡)=?
b.P(显示W)=?
c.P(不是-RR |显示R)=?
d.下列是公平打赌,还是“荷兰赌”:
Ⅰ.你支付1美元来猜卡片。
如果猜中,你赢得3美元。
Ⅱ.显示R
你支付1美元来猜卡片。
如果猜中,你赢得2美元 。
Ⅲ.如果显示R但不是RR卡片,你赢得1美元。
如
果显示R而且是RR卡片,你输掉1美元。
本专栏答案的获取方式关注我,私信获取
如果你想获取更多的IT学习知识,请关注异步社区头条号
以上内容为【人工智能概率的认识及优化建议丨人工智能预测技巧】的相关内容,更多相关内容关注lot物联网。