Greenplum 机器学习工具集和案例

Yandong Yao

Pivotal 研发总监

毕业于中科院软件所,作为 Pivotal 中国研发中心创始团队骨干成员,发起了Greenplum 中国开源社区,同时领导Greenplum 和 HAWQ 中国工程团队成为大数据和机器学习意见领袖。加入 Greenplum/Pivotal之前,曾在Sun Microsystem 与 Symantec 系统和存储部门工作多年,拥有多项国内外专利。

演讲概要

Pivotal Greenplum是唯一的开源无共享大规模并行处理(MPP)数据库,专为商业智能处理和高级数据分析而设计。Greenplum 使用了全世界最先进的基于成本的开源查询优化器,能够针对海量数据提供无与伦比的分析查询性能,各种功能完备,具备强大的灵活性和可扩展性,并可以与各种流行的算法库和软件集成。本次报告主要针对机器学习、数据挖掘等高级分析场景,重点介绍相关工具集和各种成功案例。

听众收益

开拓机器学习思路,学习 Greenplum 这一流行大数据平台和机器学习的巧妙结合。