这个文档将作为我们已经做过分享,或者将要进行分享的主题的一个索引。主要分为四个大块:常见机器学习算法,自然语言处理,深度学习以及高级机器学习算法。常见机器学习算法主要是介绍一些spark mllib中已经实现的算法,通常要求对数学原理、mllib中的代码实现,以及如何应用于实际问题的解决等方面都要比较熟练的掌握。深度学习主要是针对一些常见的概念、优化的trick等的介绍,以及在流行深度学习框架上解决实际问题。而高级机器学习算法,通常对数学原理以及如何使用等做介绍。
以下将按照这个分类列出相应的topic。
常见机器学习算法
已分享
- SVM
- Logistic Regression
- KMeans
- Bistecting KMeans
- Decision Tree
- Random Forest
- Gradient-boosted tree
- 关联规则
- ALS
- LDA
- Gaussian Mixture
- PIC
- Factor Analysis
- Survival Regression
- Isotonic Regression
- BFGS and L-BFGS
- Factorization Machines & Online Optimization
-
将分享
One-vs-Rest classifier
- boosting and bagging
- SGD
- 其它最优化算法
- 集成学习相关算法介绍
自然语言处理
深度学习
コースの周先生Tensorflow
Introduction
- Style
- Basics
- Graph
- Summary
- Artificial neural network
- Autoencoder
- Convolution neural network
- Recursive neural network
- Distributed
已分享
- MXNet框架从原理到代码
- 深度信念网络在蛋白质突变检测中的应用
- RBM
- DBN
- CNN
- Deep auto encoder
- LSTM
- RNN
将分享
- tensor,conv,pooling
- BP
高级机器学习算法
已分享
- TODO
将分享
- 强化学习相关算法介绍
- 迁移学习相关算法介绍
源码解析
将分享
1.deeplearning4j中深度学习和NLP源码分享
2.tensorflow源码分享