我准备这样学习深度学习

我开始了我的深度学习,对于以前没有搞过深度学习的人来说,有点吃力,不过我的学习方法比较适合我,首先我去看了一下基本的数学原理,这里推荐一本书,叫做《深度学习的数学(图灵出品)》([日]涌井良幸,涌井贞美) ,把书里的推导和 Excel 演算都动手实践的话,感觉原理基本上搞的差不多,会一些基本的原理和术语后,我就开始找一些 demo 来跑,这些 demo 能跑通,我就开始换不同的数据源,换不同的场景,这大概是我的学习路径。

看数学原理和搞明白术语

推荐这本书,《深度学习的数学(图灵出品)》([日]涌井良幸,涌井贞美)

找开源项目

我正好有这个需求,手上有一些注册用户,默认是没有填写性别的,如果要给对方发促销邮件,最好是知道基本的性别,所以这是一个真实的场景。

自己从 0-1 去实现性别预测,肯定不现实,所以我优先去找开源项目,还真找到一个,人家还写成了论文,说根据名字可以预测性别。

GitHub – roscibely/gender-classification: Predicting Gender Using Character-level Machine Learning 🙋 🙋‍♂️

跑起来

把上面这个开源项目,拉到本地的 GPU 机器,我去,没想能能跑起来,并且结果还不错。

换数据

接下来就是根据自己的数据进行训练,看看效果,换成自己的数据,跑出来的结果也算让人满意。

补充知识

项目跑起来了,也能解决自己的真实需求了,但是有几个概念还没有搞明白,比如 LSTM 的原理是什么?为什么要 one-hot 编码? one-hot 编码中文名字是否有问题?Bidirectional 是什么意思?为什么只用 64 filter? 带着这种问题再去反向查找,学习就比较快了。

20221206VNc7H9

发表评论