- Survival analysis
- Normal equation for least squares
- Online hypothesis testing
- New feature transformers (ChiSqSelector, QuantileDiscretizer, SQL transformer)
- Bisecting K-Means clustering
青云 Spark 服務(wù)新增1.6.0 版本
相比之前的版本,1.6.0?主要變化包括:性能的提升、新的 Dataset API 以及增加了一些機器學(xué)習(xí)算法。具體體現(xiàn)在:
Spark Core/SQL 更新了一些 API 包括新增 Dataset API; 性能有極大提升比如 Parquet, SQL 查詢等。
Spark Streaming 更新了一些 API 包括 Python Streaming Listener API;增加一些信息在 UI 上的顯示。
MKlib 在以下幾個方面增加了新的算法和新的模型,如: