小书:《深度学习的数学》

深度学习是当前十分流行的人工智能途径。它从生物学上的神经元和神经网络得到启发,将人工神经单元连接为层、多层组成网络,能够实现自主学习,并已成功应用于图像识别、语音识别、语言翻译等领域。

数据、算力和算法是深度学习的重要资源。一定的数学知识是理解深度学习算法的基础。幸运的是,这些数学基础只是大学里的入门级内容。然而,它们还需要经过适当的整合,才能有助于理解深度学习。

我最近读的《深度学习的数学》,就是将数学基础整合、帮助理解深度学习算法的一本小书。它是两位日本作者撰写的,而我读的是中文译本。

本书仅以200多页的内容,由浅入深地将深度学习的数学基础阐述明白了。神经网络以图示表示,非常直观。很多数学概念,如向量和矩阵、多元函数的偏导数、复合函数求导、误差反向传播算法、卷积等,都变得非常简明易懂。

由于我多年来的学习和工作都与数学关系不大,在理解误差反向传播的原理上,相当有难度。障碍主要是多元复合函数的求导。通过图示,理清变量之间的依赖关系,终于豁然开朗。

本书的示例算法是基于Excel的。这大概是为了照顾没有Python语言基础的读者。我用Keras写过一些深度学习的小项目,因此并不需要做这个练习。

我的下一步是阅读《动手学深度学习》。

题图来自于https://unsplash.com/photos/jIBMSMs4_kA,感谢原图作者的分享。

发表回复