小书：《深度学习的数学》

深度学习是当前十分流行的人工智能途径。它从生物学上的神经元和神经网络得到启发，将人工神经单元连接为层、多层组成网络，能够实现自主学习，并已成功应用于图像识别、语音识别、语言翻译等领域。

数据、算力和算法是深度学习的重要资源。一定的数学知识是理解深度学习算法的基础。幸运的是，这些数学基础只是大学里的入门级内容。然而，它们还需要经过适当的整合，才能有助于理解深度学习。

我最近读的《深度学习的数学》，就是将数学基础整合、帮助理解深度学习算法的一本小书。它是两位日本作者撰写的，而我读的是中文译本。

本书仅以200多页的内容，由浅入深地将深度学习的数学基础阐述明白了。神经网络以图示表示，非常直观。很多数学概念，如向量和矩阵、多元函数的偏导数、复合函数求导、误差反向传播算法、卷积等，都变得非常简明易懂。

由于我多年来的学习和工作都与数学关系不大，在理解误差反向传播的原理上，相当有难度。障碍主要是多元复合函数的求导。通过图示，理清变量之间的依赖关系，终于豁然开朗。

本书的示例算法是基于Excel的。这大概是为了照顾没有Python语言基础的读者。我用Keras写过一些深度学习的小项目，因此并不需要做这个练习。

我的下一步是阅读《动手学深度学习》。

题图来自于https://unsplash.com/photos/jIBMSMs4_kA，感谢原图作者的分享。