Teaching ML

这个文档将作为我们已经做过分享,或者将要进行分享的主题的一个索引。主要分为四个大块:常见机器学习算法,自然语言处理,深度学习以及高级机器学习算法。常见机器学习算法主要是介绍一些spark mllib中已经实现的算法,通常要求对数学原理、mllib中的代码实现,以及如何应用于实际问题的解决等方面都要比较熟练的掌握。深度学习主要是针对一些常见的概念、优化的trick等的介绍,以及在流行深度学习框架上解决实际问题。而高级机器学习算法,通常对数学原理以及如何使用等做介绍。

以下将按照这个分类列出相应的topic。

常见机器学习算法

已分享

  1. SVM
  2. Logistic Regression
  3. KMeans
  4. Bistecting KMeans
  5. Decision Tree
  6. Random Forest
  7. Gradient-boosted tree
  8. 关联规则
  9. ALS
  10. LDA
  11. Gaussian Mixture
  12. PIC
  13. Factor Analysis
  14. Survival Regression
  15. Isotonic Regression
  16. BFGS and L-BFGS
  17. Factorization Machines & Online Optimization
  18. Anomaly(Outlier)Detection

    将分享

  19. One-vs-Rest classifier

  20. boosting and bagging
  21. SGD
  22. 其它最优化算法
  23. 集成学习相关算法介绍

自然语言处理

  1. NLP介绍
  2. 最大熵模型
  3. Word2Vec
  4. 分词和HMM
  5. 时间序列分析

深度学习

コースの周先生Tensorflow

Introduction

  1. Style
  2. Basics
  3. Graph
  4. Summary
  5. Artificial neural network
  6. Autoencoder
  7. Convolution neural network
  8. Recursive neural network
  9. Distributed

已分享

  1. MXNet框架从原理到代码
  2. 深度信念网络在蛋白质突变检测中的应用
  3. RBM
  4. DBN
  5. CNN
  6. Deep auto encoder
  7. LSTM
  8. RNN

    将分享

  9. tensor,conv,pooling
  10. BP

高级机器学习算法

已分享

  1. TODO

将分享

  1. 强化学习相关算法介绍
  2. 迁移学习相关算法介绍

源码解析

将分享

1.deeplearning4j中深度学习和NLP源码分享
2.tensorflow源码分享