漫话人工智能：从二进制到未来智能社会

客户端扫购有惊喜

编辑推荐

内容简介
本书是一本面向大众读者的人工智能科普书籍，从介绍人工智能背后的逻辑、数学知识引入主题，接着用生动的语言将计算机和人工智能的诞生、算法科学、机器学习与大数据、计算机视觉、语音识别等有趣的知识融入本书，最后科普了人工智能在智能农业、智能医疗、自动驾驶等不同领域的应用。本书语言生动、深入浅出、图文并茂，列举案例贴近生活，适合作为对人工智能感兴趣的读者了解相关知识的科普读物，也可以作为大中学生、培训机构的入门教材。
作者简介

目录
1 智能源起 1.1 从三段论到人工智能 1.2 机器的语言 1.3 从石子到机械 1.4 模拟人类思维 1.5 漫说AI：乔治·布尔的故事 2 机器的进化 2.1 差分机：纯机械之巅 2.2 图灵机：假想的机器 2.3 第一台计算机之谜 2.4 人工智能诞生 2.5 漫说AI：目前第一位程序员 3 “智”优算法 3.1 智能的五大支柱 3.2 蚂蚁的智慧 3.3 算法也遗传 3.4 机器的智力测试 3.5 漫说AI：约翰·霍兰德与遗传算法 4 机器“爱”学习 4.1 像人一样学习 4.2 构建神经网络 4.3 训练人工大脑 4.4 战胜人类 4.5 大数据浪潮 4.6 漫说AI：MapReduce如何处理数据？ 5 感知万物 5.1 机器的眼睛 5.2 可计算的味道 5.3 听懂人类的声音 5.4 无“触”不在 5.5 接近人脑 5.6 漫说AI：握不住杯子的高智商机器人 6 未来新世界 6.1 智能物流 6.2 智造产业链 6.3 智慧农业 6.4 机器医生 6.5 自动驾驶 6.6 机器人的崛起 6.7 漫说AI：人工智能的未来
精彩书评

书摘
4.1 像人一样学习顾名思义，“机器学习”是研究如何教会机器像人一样学习，并让机器通过学习来掌握解决问题的能力。早在 2001 年我（本书第一作者）准备出国读研究生时，申请了很多与计算机和人工智能相关的专业，当第一次看到“机器学习”这个词时，脑中就浮现出这样的画面：一个机器人通过观察人类掌握了人类的本领。幸运的是，我被布里斯托大学的机器学习硕士专业录取并选择了这个专业，从而开始正式进入人工智能领域中这个最重要的分支。在过去的 20 年里，我见证了这一研究领域从默默无闻到举世瞩目的变化。学习与搜索纵观科学发展的过程，我们首先观察自然现象，然后用定量的观察数据来描述。为了解释数据背后的原理，科学家用数学语言，即公式或方程来拟合观察数据。如果提出的公式不但能很好地拟合过去的数据，还可以很好地预测未来将要发生的数据，那么这个公式或者方程则会成为公认的科学理论。同理，机器学习也是接近一样的过程：首先我们收集一些用于训练机器的数据，然后利用自己的经验来假设这些数据生成的规律或者分类的标准是由某一种类型的函数所定义的，我们的目标就是根据给定的数据来“训练”出这些函数的参数，这个过程就是机器“学习”的过程。一个典型的机器学习过程如图 4-1 所示。线性拟合是指用一个线性函数通过调整参数来拟合给定的训练数据。图4-1(a)是给定的训练数据，图 4-1(b)、(c)、(d)中考虑了用不同的线性方程来拟合给定数据，其中图 4-1(d)中表示的参数是拟合优选的线性方程。假设我们给定的一组数据是由平面坐标所定义的，我们想用一个函数来描述横坐标 x 与纵坐标 y 的关系，我们可以假设它们的关系是线性关系，用 y = ax+ b 来表示，我们要做的就是找到合适的 a 与 b 的值，从而确定一条最合适的曲线来拟合给定的数据。所以从这个角度来讲，我们可以将机器学习的过程看成是给定模型下的参数调整。如果由参数 a 和 b 构成了一个新的空间，这个空间中的每一个点 a’和b’以图 4-1 中的例子来说明，都能构成一条直线 y = a ' x + b ' , 所以我们需要的是在这个 a 和 b 所构成的“假设空间”中搜索出合适的参数来解释（或者说拟合）给定的训练数据。这就是机器学习的一个核心思想，机器学习可以看成是在由参数构成的假设空间中进行搜索。还有一个重要但是没有回答的问题就是我们如何去假设什么类型的函数，比如给定一些数据（如图 4-2 中的彩色圆点），我们可以用直线（红色）、二次多项式（黑色）或者更复杂的多项式（绿色）来拟合这些数据，即找到红色圆点和蓝色圆点之间的边界。我们通过不断学习，找到的优选参数如图 4-2 中的 3 条线所示。在这个案例中，你会发现红色直线无论怎么调参数，也无法更好地描述边界。而绿色的曲线虽然可以完美地把数据分开，但是因为数据中大概率会夹杂着很多噪音，绿色的曲线把噪音也拟合了。这就类似于为了去一个期待已久的音乐会，你买了一副高保真、超清晰的耳机，的确你在现场可以把音乐听得很清楚，但是如果耳机太灵敏，音乐厅里的咳嗽声、翻东西甚至地板摩擦的图4-2??欠拟合与过拟合的定性描述声音你也听得一清二楚，反而干扰了你对音乐的欣赏，这种情况叫做“过拟合” 。相对应地，红色直线所代表的分类函数就是“欠拟合” ，而黑色的二次多项式函数在两者之间找到了一个比较好的平衡。在实际的研究中，我们可以使用与训练数据不同但是分布相同的一组数据来验证并找到优选的分界函数，这组数据称为测试数据。学习的类型如果一定要将机器学习分几个大范畴的话，可以根据数据是否有标签大致分为监督学习、非监督学习和增强学习（还有一个小类别是半监督学习，这里暂且忽略）。监督学习的英文是 Supervised Learning，顾名思义，是指有一个“导师”为所有的数据提供一个标签。比如给定的一幅图像是小猫或是小狗；给定的一个手写数字是 0 或是 8 ；给定一段评论是肯定的 106 或是否定的；给定一张人脸是开心、悲伤或是愤怒的。这些标签都是通过人的经验和判断来给定的，我们来利用数据特征与标签的关联关系建立一个机器学习的数学模型来进行描述。 K- 近邻是一种较为容易理解的监督学习算法。我们对于一个陌生数据标签或类别的判断，取决于这个数据 K 个“邻居”的标签，即用邻居中用得最多的标签作为新数据的标签。想象一下，假设一个班级的同学只喜欢两种运动，一种旧不懂中文，他们只是在遵循规则而已。塞尔以此为依据认为神经网络不足以让人工智能具备自己的思维。另一些反对者也认为人工神经网络的学习是为了更好地执行某一项特定的任务，因此也不会让人工智能具有思维意