加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

今晚直播:我是怎么搞定机器学习和数据分析的!

发布时间:2020-12-14 03:15:31 所属栏目:大数据 来源:网络整理
导读:机器学习有多火? 大数据和人工智能火爆2016——前者对大量的资料做出分析, 后者让机器看起来更聪明 ——为了让这些成为现实,机器学习作为核心工具,不可或缺。 ?多个大型科技公司积极拥抱机器学习——微软正在使用机器学习升级Office;谷歌在谷歌云开放机

机器学习有多火?


大数据和人工智能火爆2016——前者对大量的资料做出分析,后者让机器看起来更聪明——为了让这些成为现实,机器学习作为核心工具,不可或缺。


?多个大型科技公司积极拥抱机器学习——微软正在使用机器学习升级Office;谷歌在谷歌云开放机器学习平台,亚马逊也基于自己的云计算平台AWS提供机器学习——他们借机器学习技术大大提升用户在自家云平台上开发应用程序的兴趣——用户只需要较低的成本来开展自己的工作。事实上,微软、亚马逊以及谷歌都已经推出了API——让用户更轻松地将智能融入到自己的应用中去。(更多请见《公共云为业界带来了机器学习服务》)这样的例子不胜枚举。 到目前,机器学习已经实现了一些重大创新:举世瞩目之中,谷歌AlphaGo成功击败世界围棋冠军李世石,这是人工智能发展史上浓重的一笔。我们不得不认为,这种成功在未来会出现更多。?


为什么机器学习的框架都偏向于Python?


1. Python是解释语言,这让写程序方便不只一点。举例来说,在C等编译语言里写一个矩阵乘法,需要自己分配操作数(矩阵)的内存、分配结果的内存、手动对BLAS接口调用gemm、最后如果没用smart pointer还得手动回收内存空间。Python几乎就是import numpy; numpy.dot两句话的事。当然现在很多面向C/C++库已经支持托管的内存管理了,这也让开发过程容易了很多,但解释语言仍然有天生的优势——不需要编译时间。这对机器学习这种需要大量prototyping和迭代的研究方向是非常有益工作效率的

2. Python的开发生态成熟,有很多非常有用的库可以用。除了上面说到的NumPy,还有SciPy、NLTK、os(自带)等等不一而足。Python灵活的语法还使得包括文本操作、list/dict comprehension等非常实用的功能非常容易高效实现(编写和运行效率都高),配合lambda等使用更是方便。这也是Python良性生态背后的一大原因。相比而言,Lua虽然也是解释语言,甚至有LuaJIT这种神器加持,但其本身很难做到Python这样,一是因为有Python这个前辈占领着市场份额,另一个也因为它本身种种反常识的设计(比如全局变量)。不过借着Lua-Python bridge和Torch的东风,Lua似乎也在寄生兴起。

3. 写程序方便对做机器学习的人很重要。因为经常需要对模型进行各种各样的修改,这在编译语言里很可能是牵一发而动全身的事情,Python里通常可以用很少的时间实现。

4. Python的效率不差。解释语言的发展已经大大超过许多人的想象。


总结:好写、支持全面、好调、速度不慢。

基于这种情况,CSDN联合唐宇迪老师联合出品《Python数据分析与机器学习实战直播课


  • 使用Python数据分析最流行的库Numpy,Pandas,Matplotlib,Scikit-learn结合真实数据集展开可视化特征分析与机器学习建模和评估。

  • 每次课程涉及一个完整的案例,基于案例讲解python库的使用以及如何建立机器学习模型,对涉及到的机器学习算法给出最通俗易懂的解释,帮助大家快速掌握经典机器学习算法,并应用在实际的案例中。


直播时间:今晚直播!共6周!下方有微信群!每周约直播1小时哦!


直播平台:CSDN学院

主讲嘉宾:唐宇迪??主要研究深度学习领域,精通机器学习。

第一周:使用 Pandas 与 Matplotlib 分析科比职业生涯数据 ? ??


分享内容(2017.03.20)

1. Pandas 数据分析库核心使用方法

2. Matplotlib 可视化库画图方法

3. 使用 Pandas 对数据进行处理和分析

4. 使用 Matplotlib 展示科比生涯数据中每项数据


第二: 信用卡欺诈检测

分享内容(2017.03.27 )

1.机器学习经典算法逻辑回归原理

2.数据样本不平衡解决方案

3.基于逻辑回归的欺诈预测

4.逻辑回归算法中的阈值

5.数据生成策略

第三kaggle 案例之泰坦尼克号船员获救预测


分享内容(2017.03.31

1.机器学习算法之决策树与随机森林模型

2.船员数据预处理

3.输入特征提取

4.基于随机森林模型预测获救可能

5.建立级联模型分阶段预测

第四:基于 tensorflow 的 mnist 数据集预测


2017.04.10?

1. tensorflow 基本使用方法

2. mnist 数据集简介与预处理

3. 构造网络模型

4. 使用卷积神经网络进行特征生成

5. 训练网络模型生成结果

第五:kaggle 案例之员工离职预测

2017.04.17


1.数据特征分析

2.特征数据预处理

3.聚类算法模型

4.特征对结果的影响程度


第六:鸢尾花数据集主成分分析与基于 NLP 的股票预测



04.24?)

1.PCA 原理

2.将 PCA 应用于鸢尾花数据进行降维并可视化展示效果

3.股票数据简介

4.自然语言预处理数据

5.建立预测模型


Q&A

问:错过了直播,可以看视频么?

答:可以反复观看


问:资料课件能下载么?

答:能


问:有问题课后怎么问老师?

答:专属微信群,老师长期答疑

问:在哪报名?(重要的扫码哦)

加我,拉您入群


加我,拉您入群

备注python,否则无法拉入群!切记切记)

备注python,否则无法拉入群!切记切记)

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读