课程时长

15

每周5节课, 每节课2-3小时

下次开课

2019年7月24日 19:00

第一节为免费试听课

建议预修课程

适合所有学生

商业分析与数据科学两大方向,强化培养面试技能!

2019年最新改版,针对学员的职业规划,分商业分析和数据科学两个方向教学。前两个月共同上课,夯实基础,后一个月,分班上课,有针对性的准备面试。两个方向课程时间不冲突,您如果学有余力,也可以全方面准备。

由近20位工业界一线的数据科学家和机器学习专家联合授课,师生比高达1:5。90+课时,结合最新人工智能与数据科学岗位要求,从编程能力、模型理解、项目经验三个角度提升您的综合实力。

课程案例包括用户黏性分析、文本聚类、Spark程序开发、深度学习等多个数据科学领域当前热门问题。

本课程已帮助众多学员拿到科技、金融、咨询等行业数据科学家、机器学习工程师、数据分析、商业分析等岗位offer。

AI & Data Engineering Introduction
试听课

课程概述

主讲老师:Jason老师

一门课程,两条路径

根据不同的职业路径,您可以选择商业分析或数据科学两个课程。两门课程资源共享,帮助您横向拓宽发展机会,收获理想的offer。

Track I

商业分析Track

注重加强您的案例分析能力和数理统计知识,夯实SQL和Python基础,帮助您顺利通过商业分析岗位面试。

Data Analysis
Data Manipulation
Data Visualization
Business Communication
Case Studies
  • 基于商业分析岗位的面试要求,为您定制最合适的学习方案。
  • 4+ Data Challenge和Case Study项目,帮您提升简历,拿到面试机会。
  • 课程设置了一系列数据可视化、数据操作及商业软实力课程。
  • 由在IT、金融、能源、咨询等行业有多年商业分析经验的老师授课。

Track II

数据科学Track

为您深入讲解分布式系统和深度学习等前沿知识,并通过4+个机器学习项目帮助您拿到数据科学岗位offer。

Big Data
Deep Learning
Machine Learning
Apache Spark
TensorFlow
  • 课程涵盖数据科学岗位所需的编程、模型、统计、大数据系统、深度学习等重要知识点。
  • 手把手教您完成4+个机器学习前沿项目。
  • 通过模拟面试课程,帮您解密数据科学岗位面试。
  • 由Apache Spark核心开发工程师和数据科学家亲自授课。

10+ 热门Spark、Machine Learning与Business Analysis项目

  • Apache Flink流数据实时计算

    流计算可以为商业智能系统和人工智能系统提供实时数据,从而使得用户可以或直接的通过报表、或间接的通过算法模型得到实时更新的信息。

    本项目以手机游戏数据为例,带您使用Flink SQL计算不同队伍的实时分数及排行榜,进而掌握流计算的基本原理。

    Stream Computing
    Flink SQL
    Algorithm
  • 基于Kubeflow开发机器学习和AI算法Pipeline

    随时工业界数据量的不断增大,怎样建立一套更加高效、自动化的系统来支持整套数据分析工作流?Kubeflow正是解决这一问题的新兴大热平台。

    本项目以Google Cloud为平台,以Tensorflow作为框架,以疾病数据库作为训练数据,带领同学利用Kubeflow开发云端和本地的机器学习和AI算法pipeline,熟悉大型数据集处理全过程。

    众多公司,如Google、IBM、Cisco、Apple等,都非常青睐具有Kubeflow相关操作经验的求职者。

    Machine Learning Pipeline
    Kubeflow
    Google Cloud Platform
    Kubernetes
  • YouTube用户评价情感分析项目

    使用大数据和机器学习算法去分析和了解用户行为,是数据科学家分析互联网用户行为的必备技能之一。掌握Spark ML 去处理大规模的自然语言数据,更是当下最为热门的一项技能。

    通过本项目,您将学习设计合理的metric来评估ML模型,运用Spark ML、NLP等相关技术对用户评论数据进行清洗,选取数据特征,构建监督模型,对用户评论进行分类,并处理unbalanced data,预测用户评论的语义偏好,学习使用AutoML来加速模型调试过程,分析评论隐藏话题信息。

    AutoML
    Pyspark
    Spark ML
    NLP
    Comment Prediction
    Topic Analysis
  • 旧金山犯罪数据分析和预警

    大数据分析是算法工程师必备的技能,合格的算法工程师需要掌握从数据收集到数据建模的整个流程,最后才能保证从数据中发现可能的规律,并建立机器学习模型。

    本项目以旧金山地区犯罪数据为列,带领学员建立从数据采集、清洗、存储、分析的一整套数据分析的工作流。通过对于不同地区犯罪数据,天气数据的分析和建模,建立可能的犯罪事件预测机制。

    Spark RDD
    Spark SQL
    OLAP
    Regression
    Data Pipeline
  • Movie Lense和Netflix 电影数据分析和推荐系统

    推荐系统是互联网公司的现金奶牛。无论是Google、Facebook等IT巨头,还是Uber、Airbnb、Pinterest各类初创公司,都需要一套高性能的推荐系统。推荐系统的设计与开发能力是各大顶尖科技公司普遍看重的能力之一。

    本项目带领您成为推荐系统设计与开发专家。本项目以Netflix电影数据为训练数据,带领学员掌握主流的推荐系统的算法,并熟练使用Spark Machine learning pipeline建立自己的协同过滤算法,并部署推荐系统到生产型环境。

    Recommendation System
    Collaborative Filtering
    Matrix Factorization
    Spark ALS Model
  • 点击率(CTR)预测系统

    在在线广告中,点击率(CTR)是评估广告效果的一个非常重要的指标。因此,点击预测系统是必不可少的,并广泛用于赞助搜索和实时出价。同时CTR也是在求职数据科学家DS、数据工程师DE、数据分析师DA等职位时,最加分的内容之一。

    本项目中,以用户的点击日志数据为基础,涉及了数据科学的三个主要流程:1. 数据的ETL 2. 数据的OLAP和统计分析 3.机器学习模型建模和预测。其中在数据的ETL阶段,我们采用Spark dataframe 来做数据的预处理。在OLAP阶段,使用Spark SQL 来做大数据分析和统计建模。在机器学习模型阶段,使用Spark ML pipeline中的分类和回归模型。主要介绍XGboost的原理、调优,以及CTR预测中的应用。

    CTR Prediction
    Kaggle
    Spark ML
    XGBOOST
    ETL
    OLAP
  • 基于Auto-Encoder-Decoder 的电影推荐

    随着深度学习技术的飞速发展,越来越多的互联网公司开始在推荐系统中使用深度学习。相对于传统的推荐系统,深度学习可以实现端到端的学习。

    本项目以深度学习模型auto-encoder-decoder网络为基础,以imdb电影数据为训练数据,使用tensorflow建立auto-encoder-decoder模型。通过模型提取用户及电影特征,最终实现电影的自动推荐。

    Auto-encoder-decoder
    Recommendation System
    Tensorflow
    Movie Recommendation
    End-to-end Training
  • Twitter 流数据情感分析

    流数据分析将会是下一代的数据分析的基本模式。流数据分析减少了数据落地带来的高负荷和数据分析的延迟。在互联网公司最为看重的实时数据分析场景中,大规模流数据的处理和建模,是面试官非常看重的一项技能。

    本项目以Twitter的流数据为基础,带领学员建立一整套的流数据分析和建模的引擎。本项目基于Kafka建立数据分发的工作流,然后利用Spark Streaming和Spark Structured streaming清理和分析流数据,最后使用Spark ML离线建立的文本数据分析模型,进行Twitter数据中的用户情感分析。

    Streaming Data
    Social Network
    Semantic Analysis
    LDA Model
    Spark Streaming
    Spark Structured Streaming
    Abnormal Detection
  • 基于深度学习模型CNN的图像分类

    图像分类是计算机视觉最重要的任务之一,同时也被各大互联公司在其产品中大规模应用。卷积神经网络(CNN)在图像分类大数据集imagenet上取得了非常好的效果。

    本项目以深度学习模型CNN为基础,基于大数据集imagenet的已训练好的模型权重,使用tensorflow + transfer learning技术针对用户自定义数据集(汽车数据为应用场景)进行优化,建立汽车图像分类和相似图像搜索的深度学习模型,帮助深度学习技术能快速在生产型环境下的应用,从而优化汽车图片数据的分析。

    Image Classification
    CNN
    Tensorflow
    Transfer Learning
    Fine-tune Model
    ImageNet
    Pre-train Model
  • 时间序列数据分析和股票大盘指数预测

    时间序列(Time Series)是我们在日常生活和社会工作中十分常见的一种数据,它是通过将一系列时间点上的观测值按等时间间隔测量来获取的数据集合,比如商业活动中,服装公司的年销售量;每日股票的价格波动;气象学中某城市的年降水量,月平均气温;城市污染PM2.5 指数 等等,因此对时间序列的研究广泛存在于各行各业。

    本项目以LSTM为基础,以股票数据作为训练数据,带您通过TensorFlow,建立时间序列数据分析的深度学习模型。最终实现个股的伴随时间的未来变化趋势,以及对应的大盘指数的变化预测和分析。

    Time Series Data
    LSTM
    RNN
    TensorFlow
    Stock Price Prediction
  • 供应链数据分析与预测

    在零售业、制造业、以及医疗产业等诸多商业领域中,对于产品需求的准确预测与企业收入息息相关,过量的预测会导致存储费上涨,产品使用寿命缩短;反之,过于保守的预测带来的库存紧缺则会削弱消费意愿,影响品牌形象。因此,对于处在工业4.0转型期中的大企业,如何利用大数据浪潮中的有效信息来进行产品需求预测成为一个重要的课题。

    在本项目中,我们将一起分析处理某知名传统企业历史销售数据和产品数据,并建立模型来预测新旧产品的未来需求。同时,我们也会对大数据时代下传统企业的供应链诉求和求职机遇有进一步理解。

    Supply Chain
    Product Demand Forecast
    Sales Data
  • 纽约出租车数据与股市走向关系分析

    随着计算机技术的提高,我们现在很容易从不相关的数据中挖掘出隐藏的信息。比如十八世纪的时候,股票价格会随着来往的船只而波动,因为来往的商船传递着最新的消息。又有研究发现,公司高管拜访白宫的出入记录可以预测未来该公司股票的走向。这里,我们将遵循相同的思路,分析研究纽约出租车和股市的关系。看似纷繁复杂的纽约交通是否隐藏着有趣的信息呢?

    在大作业的实战中,同学们将会运用之前学习过的所有知识来合理探索数据,包括商业问题的数据化,提出合理问题,并对数据进行归纳整理,选择合理统计模型,验证猜想。

    Python Dashboard
    Segmentation Analysis
    Statistical Model
    Poisson Regression
  • E-Commerce营销策略优化

    2017年,全球零售电子商务营业额达到了2.290万亿美元,约占零售总额的10.1%,预计到2021年将达到4.479万亿美元。2018年是线上线下零售革命——“未来零售”落地生根发芽、蓬勃发展的一年。

    在本项目中,同学会通过分析某知名电商网站销量和产品信息,系统化的学习个性化设计,新顾客吸引与鼓励顾客再购物方法,商业推销途径优化,然后建立一个网页产品销量预测模型。

    E-commerce
    Business Analysis
    Data Visualization
    Product Insight
  • 网络流量建模及预测

    时间序列分析及预测是目前工业界热门问题, 在金融业、电商业、共享行业等多个领域都有广泛应用。涵盖的应用场景包括: Uber/Lyft汽车到达时间预测, 物流投递时间预测, 大数据环境下网络流量监控及资源配置等。

    本项目以ARIMA为基础,以维基百科真实流量数据作为训练数据,带领同学建立时间序列数据分析模型,预测未来网络流量,从而帮助网站服务器合理分配资源,有效应对网站崩溃等问题。

    Time Series Data
    ARIMA
    RNN
    Web Traffic Prediction
    LSTM
    GRU

工业界顶级专家,培养一流数据科学人才

课程由20余位老师实时直播授课,为您提供最紧贴工业界,最系统的知识讲解和求职指导。

授课团队由Google, Facebook, Airbnb, McKinsey & Company, Hortonworks等顶级科技、咨询公司的Senior Data Scientist、Machine Learning Engineer和Business Analyst组成。

还有Apache Spark、Apache Hadoop的代码贡献者和管理者委员会成员亲自授课。

Our team consists of senior data scientist, machine learning engineer, and business analyst from Google, Facebook, McKinsey & Company, Hortonworks, Apache Spark, Apache Hadoop, etc.

读懂人工智能,充实您的求职技能点

20余位Google, McKinsey等顶级科技、咨询公司的资深数据科学家、机器学习工程师和商业分析师实时实时直播授课。教师团队还有Apache Spark、Hadoop的管理者委员会成员。
2018-09-13-Data-Hightlight1

工业界顶级专家

直播授课

10+节统计课程全面更新,针对数据科学面试的最新面试趋势,强化培训case study及实验设计应考技能。
2018-09-13-Data-highlight2

统计模块全面更新

全方位增强实力

基于数据科学岗位的面试要求的,依托来Offer超强算法与编程的教学经验,用30+Python课程,帮助您快速入门,建立算法和编程知识体系,自信应对面试。
2018-09-13-Data-hightlight3

30+ Python课程

夯实编程基础

本课程针对学员的不同职业规划,分商业分析和数据科学两个方向教学,由资深数据科学家和高级商业分享师,针对不同岗位的面试要求,有针对性的帮您提升。
2018-09-13-Data-hightlight4

BA与DS两个方向

分班教学

来自一线科技/咨询公司的老师们,还会为您量身修改简历,并培训同学对简历中各项内容的英文描述能力。同时,他们还会与您进行1V1的模拟面试,帮您抓住面试机会。
2018-09-12-SDE-liangdian3

个性化简历修改

模拟面试

来Offer与硅谷众多一线IT公司人力资源部门及猎头公司均保持良好的合作关系,拥有超过千人、遍布硅谷各大IT公司的强大校友资源,为您提供强有力的内推支持。
2018-09-12-SDE-liangdian5

强大内推网络

助力求职

课程大纲

第 1 阶段

机器学习理论+Python编程基础

您将学习Python语法、基本的线性数据结构和搜索算法、以及工业界主流的传统机器学习模型,夯实数据科学基础。

上课频率: 1个月,每周5节课,每节课2-3小时

  • Introduction of Data Science

    Fundamentals of Probability

    [Coding] Python Basics 1 variable and syntax

  • [Coding] Python Basics 2 function and class

    Linear Regression & Logistic Regression I

    [Coding] Python Basics 3 base data structure

    [Coding] Python Binary Search

    Logistic Regression II & Regularization

  • [Coding] Python Array Basic Sorting

    Model Evaluation

    [Coding] Python LinkedList and Recursion I

    [Coding] Python LinkedList & Recrusion I cont

    Nonlinear Models I

  • [Coding] Python Practice

    Nonlinear Models II & Feature Selection

    [Coding] Python Advanced Sorting and Practice

    [Coding] Python Review

    PCA & Unsupervised Learning

第 2 阶段

概率与统计知识 & Python编程进阶

您将进一步学习Python、数据结构和算法知识,锻炼Coding能力,并学习数理统计、概率等相关的重要知识点。

上课频率: 3周,每周5节课,每节课2-3小时

  • Data Manipulation in Python 1

    [Coding] Python Queue and Stack

    Data Manipulation in Python 2

    [Coding] Python Review

    [Coding] Exam 1

  • Machine Learning Project 1 - Customer Churn Prediction

    [Coding] Python Binary Tree

    [Coding] Recursion II - recursion on tree

    Machine Learning Project 2 - NLP and Topic Modeling

    [Coding] Python Practice

  • Introduction to statistics

    [Coding] Python Binary Search Tree

    [Coding] Python review

    A/B testing 1

    [Coding] Python Heap

    A/B testing 2

  • A/B testing 3

    [Coding] Python Review

    A/B testing 4

    [Coding] Python Hashtable

    Inference in regression

  • [Coding] String I

    Python review

    SQL I

    [Coding] Recursion III DFS

    [Coding] Recursion III DFS cont

    SQL II

第 3 阶段

OA经典案例分析与简历辅导

本阶段,您将学习经典Online Assessment破题思路,了解如何选择track,并获得深入准备和提升简历。

上课频率: 1 周, 每周5节课,每节课2-3小时

  • [Coding] Exam 2

    SQL III

    Stats review

    [Coding] Probability, Sampling, Randomization

    Resume and interview preparation

    Career guide: BA vs DS

    Online Assessment - deep dive 1

    Online Assessment - deep dive 2

第 4 阶段

4+案例分析与项目实战,加强您的分析能力和统计知识,夯实SQL和Python基础,提升沟通等软实力,帮助您顺利通过商业分析岗位面试。

上课频率: 1个月,每周4节课,每节课2-3小时

  • BA track introduction

    BA track mock interview

    Final project presentation

    [Coding-for-BA] Queue, Stack

  • eCommerce deep dive 1: System design

    eCommerce deep dive 2: Data driven marketing

    eCommerce deep dive 3: Data lab

    [Coding-for-BA] HashTable

  • eCommerce deep dive 4: Data lab

    Data visualization In Tableau

    Data visualization in Python

    [Coding-for-BA] String practice

  • Case study deep dive 1

    Case study deep dive 2

    Case study deep dive 3

    Anomaly Detection 1

  • Anomaly Detection 2

    Anomaly Detection 3

    Supply chain data 1

    Supply chain data 2

  • SQL Lab

    Mock interview session 1

    Review of BA/DA track

* 每期课程均有不同程度的修改,实际课纲以上课公布为准

常见问题

2019年7月24日 19:00 (还有6 天)

$6,500 USD

  • 班主任责任制,及时追踪进度
  • 5大互动平台,7天24小时答疑
  • 全明星导师,全程实时直播授课
  • 1v1简历修改、模拟面试与内推
  • 10大工业级别项目,提高动手能力
  • 30+ Python课程,突破编程面试
免费试听

限时优惠

最新优惠活动请咨询课程顾问

QR Code

扫描上方二维码
联系来Offer课程顾问

咨询课程与报名