howie's profile一个老愤青的独白PhotosBlogListsMore ![]() | Help |
|
|
Numb3rs Season 2 Episode 12/13Episode 12
Poisson Distribution: 泊松分布。它描述的是一定时间内事件发生的概率,而事件是以已知的平均概率发生的。泊松分布适合于描述单位时间内随机事件发生的次数。 Wiki上的公式: If the expected number of occurrences in this interval is λ, then the probability that there are exactly k occurrences (k being a non-negative integer, k = 0, 1, 2, ...) is equal to where
Courtship modelling: 求爱模型。两个英国数学家讨论的关于如何给女人送礼物的模型。—。—||| 这个模型的结论就是,通常,男人给女人的礼物,对于他本人来说是贵重的但是对女人来说是没什么用处的东西,比较有效。原因是,贵重的东西表示男人愿意建立长期的关系,而没有实际用处的东西可以让那些拜金的女人们敬而远之。所以,我觉得也许送一个全球限量版纸尿布比较有用,哈哈。
Episode 13
Exploding Soda Bottle Experiment: Charlie在里面表演了一次可乐喷泉的实验。以前我也看过,就是往Pepsi里面放Mentos,然后水就像喷泉一样涌出来,于是有人攻击说可乐多么可怕,对人体有害云云。其出现时间跟互联网上传言可乐杀精基本相同。其实大致原理是这样的,在可乐瓶里面有很多的二氧化碳气体,它们是在灌装的时候被压进瓶中的。由于水的表面张力它们被束缚在可乐中。它们的作用就是从你的身体里带走热量。然而,当扔进去Mentos以后呢,它逐步溶解出来的凝胶会破坏水的表面张力,使得二氧化碳聚集形成气泡。为什么反应这么剧烈呢?因为1. Mentos表面有很多的细孔,便于气泡生成;2. Mentos比较沉,可以很快的沉入瓶底,所以瓶底部产生的大量二氧化碳气泡就会带着可乐喷出瓶口。这基本原理跟拿着可乐瓶摇几下是一样的,用Charlie的话说,就是破坏了热力学平衡。 Numb3rs Season 2 Episode 11Diffie-Hellman Protocol:一种加密协议,由通信双方通过协商生成公共密钥的算法。其原理是,通信双方A和B先确认两个素数p和q,其中p是大素数而q是p的原根。原根的意思就是如果p和q互质,对于所有d<p满足q^d≡1(mod p),d的最小值等于φ(p),则q是p的原根。其中φ(p)为所有小于p且与p互质的整数的个数。产生公共密钥的过程就是,在确定p和q以后,A和B各自指定一个大数,譬如a和b,计算C=q^a (mod p)和D=q^b (mod p)并互相发给对方。双方接收数据后再计算得公共密钥K=C^b=D^a,因为显然(q^a (mod p))^b (mod p) = (q^ab) (mod p)。本集里面说这个算法是很难破解的,原理在于基于大素数p的离散对数运算是很困难的,其原理类同于RSA。 Pascal's principle:帕斯卡原理,就是对于静止的流体,其对各个方向的压力是相同的。 本集Charlie在分析纵火因素的时候还用到了principal components analysis,被称为主成分分析的统计学方法,我不懂,也就不说了…… Numb3rs Season 2 Episode 10Torus: 环面。几何意义上,环面是由一个圆围绕和它共面的轴旋转而形成的。拓扑学上,环面是两个圆的积的闭合曲面。 Voronoi Diagram:维诺图。对于平面上离散分布的点,维诺图就是对这个平面的一种凸多边形划分,使得每个凸多边形仅包含一个点,且多边形内的任意一点到该点的距离都小于这点到其他点的距离。更形象的说明就是,比如北京城内有很多麦当劳,维诺图就是对北京城的一个划分,每一部分都是一个凸多边形,而住在这个凸多边形里面的人,到这个凸多边形内的麦当劳店的距离,都小于他去其他麦当劳店的距离。所以这个凸多边形区域,就是这家麦当劳所覆盖的区域。这个有很多应用,最简单的就是上面举的例子。比如我知道北京所有肯德基店面的分布,我就能找出一片区域,并得到一个坐标,使得我在这里开一家麦当劳,可以尽可能的降低肯德基对我的影响,同时尽可能的覆盖更多的人群。 当然,现实不是这样的。肯德基和麦当劳的老板只考虑商圈,只考虑潜在的客流量,而不学数学。所以在肯德基旁边,你多半会发现一家麦当劳。这也许是不符合利益最大化原则的。比如在西外,一百米内就有两家麦当劳和两家肯德基,虽然它未必比在新街口开一家更赚钱,因为客户显然被分流了,对于单独的一家店,收入自然减少了。但就这个案例来讲,从某种意义上说,大部分的客户,对于吃肯德基还是麦当劳,是没有什么忠诚度的。这个时候地段显然更重要一点。 可见,学好数学是多么有用啊。 Numb3rs Season 2 Episode 9Euler图就不说了。熵(Entropy)也不说了。 Steiner Tree:它类似于最小生成树问题,就是指对于有权图G, 生成一棵树T,使得对于G的顶点集V的子集S,T包含S的所有顶点且各边的权重和最小。Steiner数跟最小生成树的区别在于它可以向图中添加点来减少权重之和。对于欧式空间中的Steiner树问题,要想用最短的线段连接起所有点,加入的Steiner点必然是3度点且其3条边之间的角度都为120度。Steiner Tree是一个NP完全问题。 Soap Bubble Theory:肥皂泡理论。Charlie用这个来诠释Steiner Tree.事实上肥皂泡总是趋向于用最小的表面积来占据一定大小的空间。有个Plateau's laws: 1.肥皂泡表面总是光滑的。 2.肥皂泡上某一部分的平均曲率总是等于这部分上任意一点的曲率。 3.当3个肥皂泡相结合时,它们之间形成的边之间的夹角是120度。 4.当4个肥皂泡相结合是,边的夹角是arccos(-1/3)=109.47度 Numb3rs Season 2 Episode 8这周过得很快,但是没怎么看Numb3rs,主要是周三请了一天假去公安局申请护照。 一切都很顺利,最大的收获就是通过周二和周三两个晚上的下载,Numb3rs第四季和第五季都下完了,第三季还差6集吧,哈哈。 超级杯的票组委会是黑定我们了,票价高得离谱 于是我决定,抵制组委会,在家看直播。我不知道为什么有人说这是一生只有一次的机会,等我拿下护照,随时都可以去罗马看现场,不到200块人民币就能搞定一张北看台的球票,凭什么要给这帮黑心鬼赚钱。国航直飞罗马的航班也只要四五千就够了。BTW,去开罗的机票加税才三千多,哈哈哈哈哈。去雅典的要一万多:(欧洲航空公司就是狗屎…… 回来说Numb3rs,这集讲得是抓捕一个非法制造安非他命http://baike.baidu.com/view/40844.htm的恋童癖…… 里面提到的理论: 群行为(Folcking behaviour):http://en.wikipedia.org/wiki/Flocking_(behaviour) 是指动物的群体性行为,通常被认为是由大量独立的不受指挥的个体在某些简单的规则下形成的群体行为。在它的简单模型里,规则有三条:1.个体之间是相互排斥的,独立的;2.个体运动的方向是趋向于群体的平均运动方向的;3.个体的位置是要趋向于群体的中心的。这就好像大地震的时候大家往广场上跑,每个人跑的方向是不同的,但是大致方向是相同的;每个人之间都会保持一段距离,但是大家又不会太分散。这个理论就可以拿来去研究人类的行为。当大家不知所措的时候,如果有几个人能出来带头,甭管对不对,大家都会跟着他们走。即使有反对意见,也很可能保留了。 steganography:是指一种技术,把信息隐藏在其他信息里,让别人无法意识到隐藏的信息的存在。最简单的例子就是在一个图片里面隐藏另一个图片,也是片子里的例子。片子里面提到了Pradeep Sen 在SIGGRAPH 2005 上提到的一种方法Dual Photography 这个结果让Pradeep Sen本人都很惊讶,谁会想到自己的论文当年就能上电视了呢? Numb3rs Season 2 Episode 4/5/6/7E04 这集没用到太多数学知识,只是构造了一个公司的组织架构树来分析每个人的利益关系。里面涉及了一些经济知识,嗯。 E05 这集讲的是暗杀,也没用到多少东西,涉及到了换位密码和博弈论的一点东西 E06 为了调查释放光气(Phosgene,COCl2,剧毒)的人,Charlie首先用到了渗透理论(Percolation Theory)去寻找释放毒气的人。这个理论http://baike.baidu.com/view/1819511.htm我完全不懂…… 后来Charlie又用到高斯散布模型(Gaussian dispersioin model)根据毒气散布情况寻找最初释放点。这个模型是假设气体的扩散是遵从正态分布的(http://en.wikipedia.org/wiki/Normal_distribution),就是说气体沿某个方向扩散的高度和远度是符合正态分布曲线的。它主要应用于扩散源位于地表或接近地表位置的情况。http://en.wikipedia.org/wiki/Normal_distribution LDA(Linear discriminant analysis), 线性判别分析,主要是用来寻找一种判别标准,可以对某个单独的样本分析其类别。http://en.wikipedia.org/wiki/Linear_discriminant_analysis 好多的公式啊…… E07 这一集还用到了傅立叶级数……http://en.wikipedia.org/wiki/Fourier_series 还有数据挖掘,但是都没讲什么东西。http://en.wikipedia.org/wiki/Data_mining 剩下的时间都是Charlie和Marshall之间的明争暗斗,虽然对于他们之间说的我都不明白…… Numb3rs Season 2 Episode 3首先,我没想到Wolfram同志也关心Numb3rs。不过这的确是一个推销他产品的好机会。显然关心Numb3rs里面的数学知识的人,多半就来自他产品的目标客户群。 http://numb3rs.wolfram.com/season2.html Chvátal's art gallery theorem:Chvátal是一位捷克籍的计算机学家,布拉格之春的时候逃亡到了加拿大,他主攻图论和组合数学。这个理论是讲,在一个有N面墙的美术馆里,所需要的保安/摄像头的最小数目的上限,是└n/3┘。这里└n/3┘表示小于等于n/3的最大整数。这里还有一个推论,对于有n面墙和h个洞(指视线无法穿透的区域,如展厅中间占了个大胖子)的美术馆,则最少需要至多└(n+h)/3┘个保安或者摄像头。这一理论还表明,要在这样的美术馆外面设置保安,其数量要远多于在室内安置的保安(不考虑房间内大胖子的情况)。 http://en.wikipedia.org/wiki/Art_gallery_theorem Spherical Trigonometry:首先解释一下Spherical Triangle,球面三角。它是从一个球的球心引出3条射线,跟球面交于3点,这3条半径和3个焦点所围成的区域就是球面三角。Charlie在剧中拿出了一个日晷(Sundial)。他用日晷的原理来计算某地点的纬度。这里,我们把一个物体垂直放置在地面,根据物体的高度和影子的长度,我们可以算出当时太阳的仰角。根据球面三角,我们可以计算出太阳在天空的轨迹。又由于不同纬度太阳在天空中划过的距离是不同的,所以Charlie根据两个时刻的影子照片就可以算出拍摄照片的纬度。同样,根据球面三角的性质,我们也可以算出对于当前地点太阳位于最高点时的时间,有了这个时间,我们就可以算出当地的经度。 另外,随着时间的变化,太阳在天空中飞行的速度是不一样的,这是显而易见的。所以单纯的立一个棍子去计算时间是非常不准确的,除非你对它作出修正。这就是为什么正确的日晷应该是在圆盘上垂直放置一个直角三角形,其斜边指向正北,而顶点指向北极星。 http://en.wikipedia.org/wiki/Spherical_trigonometry Numb3rs Season 2 Episode 2一维元胞自动机:在Charlie试图破解汽车密码锁的时候,Amita提到了这个理论。在一维空间上离散分布的一个个单元,每个单元都有一个状态,这个状态来自于某个有限的状态集。在破解密码时,这个状态集就是0-9这十个数字。每个单元成为一个元胞,元胞的状态是随离散的时间变化的,其当前状态仅仅取决于前一时刻的状态和周围元胞的状态。这种变化遵从一定的规则。这个系统就叫做元胞自动机。它可以是一维的,也可以是多维的。片子里的处理方法,就是通过已知的各个时刻的状态,求出整个自动机变化的规则,对于破解密码来说,就是生成伪随机密码的算法。 Wolfram的离散可计算理论:我没有找到这个的说明,但是我想它说的应该就是Stephen Wolfram同志。之所以提起他,我想大概跟他在CalTech读书工作过有关吧,哈哈。因为没有找到相关资料,也不好解释什么,但是我发现了Wolfram同志的A New Kind of Science的在线版:http://www.wolframscience.com/nksonline/toc.html 顺便说一下,Wolfram同志就是Mathematica的发明人。还有,去年Wolfram Alpha上线了,挺有意思的。http://www00.wolframalpha.com/ 法雷序列(Farey sequences):Farey序列是一系列的最简分数,N级Farey序列就是所有分母不大于N的最简分数的集合。比如N=3时,Farey序列就是0/1, 1/3, 1/2, 2/3, 1/1。构造Farey序列的方法就是在两个数之间插入中间值。其计算方法如下:对于N级Farey序列中相邻的两个分数a/b和c/d,如果b+d<=N+1的话,那么在他们中间插入(a+c)/(b+d)。实际上我困惑的是他们怎么把这个应用于追踪赌徒上的。 Wiki上的说明 http://en.wikipedia.org/wiki/Farey_sequence Wolfram同志的网站上也有 http://mathworld.wolfram.com/FareySequence.html Numb3rs Season 2 Episode 1我发现了一个关于NUMBERS的博客,是东北大学的教授写的对每一集numbers的注解,很NB。 http://nuweb2.neu.edu/math/cp/blog/ 虽然我写不出这么深奥的博客,甚至有可能对理论的理解出现偏差和错误,我还是想继续下这个系列。有时候学习就是一种复述的过程,通过复述可以更好的理解,更好的记忆,更容易发现错误的认知。 自吹自擂后,继续。 这一集还是用到了贝叶斯理论,Charlie举了一个非常常见的例子,就是用贝叶斯算法过滤垃圾邮件。整个过滤过程可以描述为:通过对大量的垃圾邮件和非垃圾邮件的分析,寻找出它们各自的特征,比如说,当什么词出现的时候,它有多大的几率是垃圾邮件。这是一个自我学习的过程,通过积累不断完善自己的特征库,当一封邮件过来时,通过分析这些特征词来判断,它有多大概率是垃圾邮件。当这个概率值超过某个阈值时,就可以设定它是垃圾邮件了。由于通过自我学习我们知道一个词在邮件中出现的概率,在垃圾邮件中出现的概率,所以很容易通过贝叶斯定理求出当它出现时,邮件是垃圾邮件的概率。 片子里的大部分都在提决策论(Decision Theory)。http://en.wikipedia.org/wiki/Decision_theory 我本科的毕业论文就是跟这个有关的东西,虽然那个时候我把Decision想的太简单了。现在回想起来那篇论文太差了,根本算不上论文,其主要原因是我数学太烂了,哈哈哈哈。 在这部片子里,Charlie提到了基于贝叶斯分析的Reverse Decision Theory。它的目的是寻找事件A和事件B之间的关系。如果我们知道事件A的边际概率,也知道事件B对于事件A的条件概率,那么我们就可以得到事件A对于事件B的条件概率。用片子里的例子就是说,如果我们知道一次谋杀发生的概率,也知道一个人成为杀人犯的概率,那么我们就可以求出,当一场谋杀发生时,这个人是这次案件的凶手的概率。 Numb3rs Season 1 Episode 12&13第一季看完了。 12集里面提到了在背景噪音中提取特定模式的信号的技术。这种技术应该广泛应用在军用领域,比如雷达、声纳…… 我没有找到专门的网页来介绍这种技术,但是应该有很多的。 13集里面提到了两个数学名词。 贝叶斯定理(Bayes theorem):这应该是概率论里面最基础的定理之一。它是用来描述事件的条件概率和边缘概率之间的关系。 http://zh.wikipedia.org/wiki/%E8%B4%9D%E5%8F%B6%E6%96%AF%E5%AE%9A%E7%90%86
马尔可夫链:指一系列事件依次发生,下一事件发生的概率仅与当前的状态相关,与之前的状态无关。 Numb3rs Season 1 Episode 11这集讲到了Van Eck phreaking http://zh.wikipedia.org/wiki/Van_Eck_phreaking Van Eck phreaking讲的是无论是在CRT还是LCD上,要显示图形就必然伴随发射出电磁波,不同的图形其电磁波是不同的,我们可以通过天线来截获这个电磁波,然后分析并还原成原来的图像。也就是说,对于显示器而言,只需要一个触角天线,而不用摄像头,别人就可以看到你屏幕上显示的一切。 Numb3rs Season 1 Episode 10这集讲的是博弈论里面的囚徒困境。 基础的博弈论知识没什么好写的了,我甚至都还记得纳什的那篇论文。 前10集里面有4集用到了我所没学过的数学知识,这就意味着在剩下的部分,我有40%的几率去学到新的知识,当然,从某个角度讲,能写进电视剧的数学知识应该不是很多的,所以,这个概率应该会低于40%,但已经是很让人开心的事情了。 鉴于space终于恢复了,换个背景音乐,庆祝一下,仔细听哦,哈哈。(请使用IE) Numb3rs Season 1 Episode 9这集讲的是Regression To The Mean. 我在百度上找到临床医学的解释 向均数回归. 这只是这个理论的一种应用而已。 Wiki上有说明 http://en.wikipedia.org/wiki/Regression_toward_the_mean 它大概的意思就是说在同一条件下的随机变量,其联合分布是趋向于一个均数的。用Wiki上的定义就是说,对于随机变量X1,X2, 它们的边缘分布都是U,那么如果X1为某个已知值C时,X2的期望值在U和C之间的区域。 这个理论的实际意义在于,我们的实验数据,总是会向一个平均值去趋近。比如在百度的临床医学的例子里,病人的化验指标会向正常值趋近。这就表明,我们的实验数据并不能真实表现我们要检测的理论的实际效用,除非我们能保证实验对象的随机性,并且有控制组的实验对象做参照,还要排除其它因素引起实验数据的偏差或对实验过程的误导,否则特定的实验对象的测试数据总是趋向于一个平均值。 在这一集里面,这个理论用于将特定的罪犯从一系列的案件中分离出来。一个Shooter射击的精度,在不同环境下总是会产生一定的随机波动,但是在多次射击后,还是能体现出他本身的射击水平。也就是说,一个普通人可能偶尔运气好打个十环,但是长期来看,他的成绩是比不上一个专业的sniper的。 Numb3rs Season 1 Episode 8这集提到了Pyramid Theory,虽然我不知道这是什么,但是意思上跟在国际象棋棋盘上放米粒那个差不多,第i个数是第i-1个数的2倍。但是电视剧里面有个问题,如果要每个账户窃取2块钱的话,要攒到2的19次方美元,就需要至少2的18次方个账户,20多万个账户怎么会这么容易就被找到并且发生转账还没有被发现呢? 找到了几个相关的数论里的东西,还挺有意思的。 Numb3rs Season 1 Episode 7Grounded Theory http://en.wikipedia.org/wiki/Grounded_theory 一种研究方法,通过收集数据,系统性的分析整理,逐步归纳出理论。整个过程分为四步,从数据归纳出Code,从Code归纳出Concept,从Concept归纳出Category,最后从Category总结出Theory. Numb3rs Season 1 Episode 6Kasiski Examination http://en.wikipedia.org/wiki/Kasiski_examination Kasiski测试是用来破解多密码替换加密算法的。它的工作方式是通过寻找密文中重复的字符串,计算重复出现的字符串之间的间距,而这间距通常是密码长度的倍数。通过计算这些间距的最大公约数得到密码的长度。 PS:每集Numb3rs都会涉及一个数学理论,我决定每集都学习一下,至少了解一下,哈哈。 目前第一季涉及的数学问题包括: 随机性-这个在以前跟冯同学上的机器人课的时候遇到过,随机行为会造成有序的结果; 海登堡不确定性理论(Uncertainty Principle)-大家都知道的吧; 图论-通过已知点集合构建生成树寻找根节点; 建筑-Structural Corruption,计算在多重因素影响下的建筑物的强度 素数-这个就是我在网络安全课程里面学的东西,分解一个数为素数乘积是很难很难的啊。里面提到了Goldbach猜想,但是我没看出之间有什么显而易见的关系。 继续学习ing。 VeryCD恢复了,space还在被封中。 |
|
|