终极算法读书笔记01(5.8)

小龙 2017-5-25 其他工具 0 0

这本书的全名是《终极算法-机器学习和人工智能如何重塑世界》,刚读完这本书的前面两章,但是已经基本可以判断这是今年读过的一本高含金量的书籍,关键是这本书的易读性很好,没有想像的那么多枯燥的理论和公式,而是把复杂的道理浅显的方式讲了出来。

首先在序里面就谈到了机器学习算法和遗忘计算机算法不同,它是从数据中做推断,它们自己会去弄明白做事的方法。简单来说就是原来的计算机算法往往是我们人已经知道了算法,然后把特定的问题域匹配到具体的算法上,然后让机器去计算出结果;而现在的机器学习算法是人不知道算法,只知道大量的数据(包括输入和输出),而需要机器从这些数据的学习和训练中推导出算法,这就是最大的不同点。

机器学习算法在重塑整个世界,包括科学,技术,政治,经济,战争的方方面面。

机器学习算法的基础是数据,这个数据包括了数据的输入,也包括了最终的输出结果,而学习算法要做的就是从大量的输入和输出中找出最恰当的算法公式,因此数据量越大,越多,往往算法最终的准确度就越高。

在序里面提到了一个关键,即 心理学家丹诺曼提出的概念模型,代指为了有效利用某项技术而需要粗略掌握的知识,而不需要深入到这个知识内部的具体原理 。注意这个概念和我在前面将学习方法和模式的时候就谈到过,刚开始要不求甚解,而这个不求甚解需要掌握的就是这个概念模型。

机器学习的五大学派,后面的第3章到第7章就是围绕这五大学派详细展开描述。

符号学派: 将学习看作逆向演绎,并从哲学,心理学,逻辑学中寻求洞见。 联结学派: 对大脑进行逆向分析,灵感来源于神经科学和物理学。 进化学派: 通过计算机模拟进化,利用遗传学和进化生物学知识。 贝叶斯学派: 学习本质是一种概念推理,其理论根基在统计学。 类推学派: 通过相似性判断的外推来进行学习,并受心理学和数学最优化影响。

对于这五种学派的详细内容,将在后续的读书笔记中详细解释。

机器学习的革命

注意书里面有一段关键的内容来解释传统算法和学习算法的区别。

传统的算法是你将数据输入到计算机,计算机本身是利用算法来进行计算和处理,最终输出你需要的结果;而机器学习算法刚好是颠倒的,即你输入到计算机中的是输入数据和输出数据,而计算机最终输出给你的是有价值的算法。这就是两者最大的区别。

这个算法需要不断的学习和训练,因此数据量和样本数越多,算法就越准确。注意为什么最终会得出这个算法,这个算法存在的逻辑是如何的?计算机也搞不清楚,本身也不需要搞清楚,计算机只知道这个最终输出给你的算法是最匹配已有历史输入和输出数据的。

在机器学习中,知识往往是以统计模型的形式存在,而技能则是以程序的形式存在。这句话有点难以理解,我们可以把这个简化描述下,即:

if(知识点X1,知识点X2,...,知识点XN) Then or You Should do(知识点XY)

人的思考和经验积累也一样,即不是单纯的积累知识点,而是应该积累上面这种经验模式或者叫算法模式。这和我上篇文章谈的知识和经验中的一些观点又是相同的。

工业革命是手工业自动化,而机器学习使自动化本身自动化。在公司发展壮大后,往往会经历三个阶段:

 

1.所有事情都人工完成。

2.所有事情或大部分事情通过计算机自动完成。(但是思考并形成可重复自动化运行的算法是人做的)

对于机器学习算法本身,其方法本身和人类的思考方法也是类似的,即产生假设,验证,放弃或完善,反复的修正和迭代。那么人形成算法的过程和机器最大的区别在哪里的?


1.人往往是期望通过最少的现场归纳出普适的定律或法则,形成解释世界的精确模型公式。

但是在人的算法过程中,并不是所有的现象都是线性的,都可以用模型精确描述,包括后面人类遇到的NP难题等,往往并没有一个精确模型或最优解。而机器学习则打开了这个全新的非线性模型世界。

终极算法

发明一种通用的算法可以归结为发现宇宙最深层次的规律,所有现象都遵循该规律,然后找出计算的有效方法来将其和数据结合起来。(有点道德经里面一生二,二生三,三生万物的味道)。

本书的一个重要假设是: 所有知识,无论是过去,现在还是未来的,都有可能通过单个通用学习算法来从数据中获得。我们将该算法称为终极算法。 机器学习算法的首要任务是区别可以预测的事与不可预测的事。但是终极算法的目标则是学习一切能够认知的东西。

在机器学习中,复杂性存在于数据中,而终极算法要做的就是消化这种复杂性。

终极算法就是等式U(X)=0

这个公式要表达的是某未知数X(可能很复杂)的某函数U(可能很复杂)等于0。每个等式都可以简化为这种形式,例如,F=ma等于F-ma=0,如果你把F-ma当作F的一个函数U,则U(F)=0。

最后再来说明下对五大学派的阐述:

符号学派: 所有的信息都可以简化为操作符号 联结学派: 学习就是大脑要做的事情,因为我们要做的就是对大脑逆向演绎 进化学派: 所有形式的学习都源于自然选择 贝叶斯学派: 所有掌握的知识都有不确定性,而且学习知识过程也是一种不确定性推理 类推学派: 学习的关键是认识到不同场景中的相似性,并且有这种相似性推导出其他相似性

转载请注明来自华盟网,本文标题:《终极算法读书笔记01(5.8)》

喜欢 (0) 发布评论