首頁 > 選課中心 > 人工智能 > 【快班】Python機器學習Kaggle案例實戰
【快班】Python機器學習Kaggle案例實戰
此課程所屬 【python數據分析師職業方向】, 【人工智能職業方向】專業,報名專業套餐,可享受0元學習特惠!點擊了解詳情
隨報隨學 共10課 ★★☆
開課時間 課程周期 難易度
招生中

立即報名
模型 算法 數據分析 機器學習 案例 方法
課程介紹
本課程是《機器學習》《Python機器學習》課程的姐妹篇,旨在加強學員的實際訓練,以案例作為基本講解單元,圍繞案例講解分析思路,特征和模型選擇,編寫代碼等。
本課程的受眾主要是沒有經過專業訓練的IT專業人員,他們可能是程序員,運維,IT系統架構師等等,也適合沒有經過科班訓練的數據分析師。數據分析是一個業務+算法+IT的交叉領域,同時熟悉這三方面知識的人,可以玩轉大數據,產生無窮無盡的花樣,產生巨大的價值。但很無奈的情況是這種人才太少,IT人員即使熟悉本公司的業務,但同時又熟悉算法的人極少。一般只能做一些簡單的維度統計,指標計算等等,如果說到開發更高智能的系統,知識上鞭長莫及。本課程的目標,正是要打破知識的鴻溝,向IT人員普及算法知識,并把這些知識用于實際項目,把中國的機器學習應用能力提高一個臺階。
每期班的學員都會被加入到一個微信群,除了平時的問題解答外,還會另外安排約5次固定時間微課思路分享和答疑,與10次講授共計學習時間約十幾周左右。

Kaggle簡介:
Kaggle創立于2010,是一個專注于舉辦數據科學周邊的線上競賽的網站。它吸引了大量數據科學家、機器學習開發者的參與,為各類現實中的商業難題開發基于數據的算法解決方案。競賽的獲勝者、領先者,在收獲對方公司提供的優厚報酬之外,還將引起業內科技巨頭的注意,獲得各路 HR 青睞,為自己的職業道路鋪上紅地毯。
Kaggle 是當今較大的數據科學家、機器學習開發者社區,其行業地位獨一無二。
課程目標:
課程從已完結的競賽中選取了10個比較有代表性的案例,通過分析優勝參賽者的解決思路和方法,從中學習問題的解決思路、數據的預處理方法,各種機器學習、深度學習等領域中的優秀算法,讓學員可以將這些方法解決各種實際數據分析問題。

課程大綱
第一課:Crowdflower Search Results Relevance
案例介紹:預測來自電子商務站點的搜索結果的準確性,將搜索得到的網頁按相關性排序
獲獎者所用方法:通過ensemble learning整合多個模型的結果
涉及算法:Ensemble learning

第二課:Santander Product Recommendation
案例介紹:根據銀行客戶1.5年內的行為數據,預測用戶會下一步會投資的新產品
獲獎者所用方法:通過XGBoost構建了多個基本模型,然后將基本模型整合為一個總模型
涉及算法:XGBoost

第三課:TalkingData Mobile User Demographics
案例介紹:根據用戶的手機應用下載和使用行為來預測用戶的人口統計數據(年齡、性別等)
獲獎者所用方法: 先預測性別的概率;使用性別的預測值作為額外的特征加入到模型中,預測年齡;通過條件概率得到兩個目標變量的預測概率
涉及算法:兩段預測,XGBoost

第四課:Facebook V: Predicting Check Ins
案例介紹:預測用戶會在哪個地方登陸Facebook
獲獎者所用方法:特征選擇:數據塊的最近鄰計算;模型構建:基于XGBoost的兩步模型
涉及算法:XGboost
 
第五課:Avito Duplicate Ads Detection
案例介紹:為了避免賣家發布各種經過少量改動的廣告導致買家難以分辨,參賽者需要設計一個模型,自動識別配對中的廣告是否同一個廣告
獲獎者所用方法:特征選擇:采用了FTIM方法測試特征的不穩定性,提出過度擬合的特征。通過XGBoost和Keras構建一層模型;然后通過底層模型構建XGBoost 和隨機森林,最終綜合兩者結果得到最終結果
涉及算法:FTIM;元模型

第六課:Outbrain Click Prediction  
案例介紹:在一組針對用戶推薦內容中,預測用戶點擊每個鏈接的可能,將這些推薦內容按照點擊可能的大小排序
獲獎者所用方法:兩步元模型:通過LibFFM構建第一層模型,再使用XGBoost和Keras構建第二層模型
涉及算法:LibFFM;XGBoost;Keras框架

第七課:Click-Through Rate Prediction
案例介紹:預測某個廣告是否會被點擊
獲獎者所用方法:將數據拆分成不同的子集,構建不同的子模型,再整合
涉及算法:LIBFFM

第八課:Avito Context Ad Clicks
案例介紹:預測俄羅斯最大的一般分類網站的用戶在瀏覽網站時,是否點擊上下文廣告
獲獎者所用方法:預處理:散列技巧和消極的抽樣。 學習方法:FFM、FM和XGBoost。
涉及算法:FFM;FM;XGboost

第九課:Rossmann Store Sales
案例介紹:預測Rossmann公司各個門店的6周銷售量
獲獎者所用方法:分類特征的處理:創建了一種 Entity Embedding(實體嵌入)的方法去代表在多維空間中的分類特征。
涉及算法:Entity Embedding;神經網絡

第十課:Amazon.com - Employee Access Challenge
案例介紹:根據員工的職業角色,預測員工的訪問需求
獲獎者所用方法:11個模型的線性組合:使用不同特征訓練的GBM模型,GLNNET模型,隨機森林模型,logistic回歸模型
涉及算法:GBM模型,GLNNET模型,隨機森林模型,logistic回歸模型
授課講師
tigerfish,知名數據庫網站ITPUB創始人,知名數據分析網站煉數成金創始人。數據庫專家,數據分析專家,有豐富的IT領域、數學領域的知識經驗。他將帶領他的數據分析團隊完成整個授課工作。 他將負責大部分算法講解和思路分析部分。
何翠儀,中山大學統計學專業畢業,煉數成金專職講師,在過去曾負責多門煉數成金數據分析課程的助教工作,目前正在主持建設煉數成金的認證題庫系統。她將負責代碼講解部分。

何翠儀,畢業于中山大學統計學專業,煉數成金專職講師。
在煉數成金上開設了多門關于數據分析與數據挖掘相關的課程,如《大數據的統計學基礎》、《大數據的矩陣基礎》《金融時間序列分析》等,也曾到不同的公司開展R語言與數據分析的相關培訓。對數據分析有深刻認識,曾與不同領域公司合作,參與到多個數據分析的項目中,如華為、廣州地鐵等
課程環境
Python2或3較新版本
授課對象
對機器學習有興趣的朋友,特別適合想學習算法的IT專業人員或非科班出身的數據分析人員。最好能有一些線性代數,統計等數學基本知識,沒有也無妨,可以在課程期間快速補強。
收獲預期
能獨立完成某些特定場景的分析工作,勝任數據分析師,機器學習程序員等流行職位的技術要求
課程學費
學費:400元(固定學費:300元 + 逆向學費:100元)
新穎的課程收費形式:“逆向收費”約等于免費學習,課程收取300元固定收費 + 100元逆向學費,學習圓滿則全額獎勵返還給學員!
特別說明如下
本門課程本來打算完全免費,某位大神曾經說過“成功就是正確的方向再加上適度的壓力”。考慮到講師本身要付出巨大的勞動,為了防止一些朋友在學習途中半途而廢,浪費了講師的付出,為此我們計劃模仿某些健身課程,使用“逆向收費”的方法。 在 報名時每位報名者收取400元,其中300元為固定 收費,另外100元是暫存學費,即如果學員能完成全部課程要求,包括完成全部的書面作業,則100元全款退回。如果學員未能堅持到完全所有的學習計劃任務,則會被扣款。期望這種方式可以轉化為大家強烈的學習愿望和驅動力!
課程授課方式

1、 學習方式:老師發布教學資料、教材,幻燈片和視頻,學員通過網絡下載學習。同時通過論壇互動中老師對學員進行指導及學員之間相互交流。

2、 學習作業:每課均有布置課后作業,學員完成書面作業后則可進入下一課學習。

3、 老師輔導:通過論壇站內信及郵件等多種方式與老師進行一對一互動。

4、 完成課程:最后一課作業交納后,老師完成作業批改,即可完成課程并取回相應剩余的逆向學費。

聯系我們
咨詢Email :edu01@dataguru.cnedu02@dataguru.cn
課程入門討論咨詢QQ群:706821899(群內有培訓公開課視頻供大家免費觀看)
咨詢QQ: 點擊這里給我發消息 點擊這里給我發消息
您是否對此課程還有疑問,那么請 點擊進入FAQ,您的問題將基本得到解答
全國統一咨詢熱線: 4008-010-006
最新技術熱點、 最新行業資訊,最新培訓課程信息,盡在煉數成金官方微信,低成本傳遞高端知識!技術成就夢想!歡迎關注!
打開微信,使用掃一掃功能,即刻關注煉數成金官方微信賬戶,不容錯過的精彩,期待您的體驗!!!

授課老師

其他快班課程

【快班】Node.js Web開發實戰
【快班】漫步華爾街
【快班】目標檢測模型YOLOV3原理及實戰
【快班】Cloudera Hadoop管理認證實戰
【快班】【強化學習系列】強化視覺導航技術導引
【快班】PostgreSQL初識與提高
【快班】區塊鏈新時代:技術原理與實操
【快班】Python全棧學習——Python基礎及Web開發
【快班】端到端(End TO End)--由傳統方法到深度學習
【快班】【百萬年薪系列】寬度學習實戰及算法解析
【快班】敏捷Agile快速入門
【快班】安全滲透測試工具之Burp Suite使用精講
【快班】Python全棧學習——Python自動化測試
【快班】系統運維之基礎服務進階實戰
【快班】Elastic Stack實戰
【快班】測試架構師核心技術
【快班】python網絡爬蟲應用實戰
【快班】locust性能測試實戰
【快班】大話流式處理系統 Flink 核心原理
【快班】PyTorch – 深度學習全棧工程師進階案例實戰
【快班】MySQL高可用原理、架構與實戰
【快班】快速成為深度學習全棧工程師
【快班】Python數據可視化實戰
【快班】股票投資高手武器系列之纏論系統
【快班】基于R的Kaggle實戰案例詳解
【快班】計算機視覺:從入門到精通,極限剖析圖像識別學習算法
【快班】黃金Quant工——量化金融分析師入門
【快班】DL4CV實戰——構建基于深度學習的智能圖像識別系統
【快班】Web全棧開發理論與實踐
【快班】Oracle DB Performance Tuning(DSI系列Ⅳ)
【快班】精準安防場景理解及語義分割
【快班】【免費公開課】Python 的安裝與部署
【快班】計算機視覺算法詳解與實戰開發
【快班】Python金融業數據化運營實戰
【快班】人臉識別精準安防講習班
【快班】Oracle SQL Tuning(DSI系列Ⅲ)
【快班】人臉識別90天速成特訓班
【快班】Python3入門到精通實戰特訓
【快班】基于軟件學習數據挖掘算法與案例
【快班】股票投資基礎之技術分析
【快班】股票投資基礎之基本面分析
【快班】Python機器學習
【快班】python3接口自動化測試開發實戰
【快班】【免費公開課】《Hadoop入門手冊》——CDH集群安裝
【快班】Datastage基礎及開發實踐
【快班】Tensorflow工程師職場實戰技
【快班】互聯網金融中的交易反欺詐模型
【快班】OpenAI強化學習實戰
【快班】Node.js項目實戰:從編寫代碼到服務器部署
【快班】Java Web開發精講
【快班】JavaScript從入門到精通
【快班】讓服務飛起來:實時計算及其應用
【快班】突擊pyspark:數據挖掘的力量倍增器
【快班】贏在大數據-人工智能的應用實踐
【快班】【免費公開課】《數據科學入門手冊》——DSX架構與部署
【快班】【免費公開課】數據科學無難事
【快班】【免費公開課】《Hadoop入門手冊》之 虛擬機的安裝和使用
【快班】【免費公開課】玩轉數據藝術-數據展示技巧應用實戰
【快班】【免費公開課】玩轉數據科學——IBM DSX
【快班】【免費公開課】《Hadoop入門手冊》——Apache Hadoop集群安裝
【快班】【免費公開課】贏在大數據-數據化運營落地實戰
【快班】大數據管理
【快班】Streams流計算引航公開課
【快班】抽樣調查
【快班】LATEX公式排版系統引航
【快班】Watson Analytics數據分析應用實戰公開課
【快班】數據陷阱解讀
【快班】R七種武器之文本挖掘包tm
【快班】R七種武器之可視化JS庫HTMLWidgets包
【快班】R七種武器之數據加工廠plyr
【快班】R七種武器之交互化展示包shiny
【快班】R七種武器之網絡爬蟲RCurl
【快班】R七種武器之數據可視化包ggplot2
【快班】R七種武器之金融數據分析quantmod
【快班】Java經驗談
【快班】Go語言實戰編程
【快班】DB2 V11新特性全解析
【快班】DB2數據庫引航公開課
【快班】STATA統計分析入門
【快班】初識正則表達式
【快班】perl語言入門
【快班】Scala語言入門
【快班】Spark企業級大數據項目實戰
【快班】知識圖譜實戰
【快班】【百萬年薪系列】視覺的盛宴:深度玩轉人臉識別
【快班】深入淺出設計模式
【快班】Oracle特殊恢復原理與實戰(DSI系列)
【快班】Puppet 運維自動化
【快班】ROS機器人操作系統實戰
【快班】開啟智慧眼-深度玩轉計算機視覺與機器認知
【快班】 深度學習框架Keras學習與應用
【快班】zabbix企業級實踐
【快班】Qt編程快速入門
【快班】python web框架企業實戰詳解
【快班】python魔鬼訓練營
【快班】數據治理及數據倉庫模型設計
【快班】金融的人工智能革命
【快班】軟件架構必備基礎
【快班】MySQL性能優化最佳實踐
【快班】Spark源碼導讀
【快班】Spark大數據平臺應用實戰
【快班】金融時間序列分析
【快班】左飛的機器學習十八般算法武藝詳解
【快班】計算機視覺與深度學習實戰
【快班】Hadoop集群原理與運維實踐
【快班】OpenCV計算機視覺產品實戰
【快班】黃美靈的Spark ML機器學習實戰
【快班】DevSecOps安全交付應用實戰
【快班】JavaScript突擊-從精通到項目實戰
【快班】R語言魔鬼訓練營
【快班】基于案例學習bash腳本編程
【快班】量化投資基礎計算與模型
【快班】老板說服術之玩轉數據展示
【快班】區塊鏈技術從入門到精通
【快班】深入淺出Git
【快班】Oracle高可用
【快班】數據庫系統實現技術內幕
【快班】Goldengate從入門到精通
【快班】PL/SQL實戰魔鬼訓練營
【快班】Oracle 12c特性解讀-容器數據庫和災備
【快班】Oracle DBA從小白到入職實戰應用
【快班】MySQL DBA從小白到大神實戰
【快班】深入淺出Oracle
【快班】深度學習PostgreSQL
【快班】Oracle 12C RAC集群原理與管理實戰
【快班】Mycat從入門到精通
【快班】基于案例學SQL優化
【快班】ELKStack及Solr企業級搜索引擎實戰
【快班】大型電商分布式系統實踐
【快班】深入理解Storm與大數據實戰
【快班】深入淺出Spring
【快班】Java魔鬼訓練營
【快班】面試突擊-數據結構與算法速成
【快班】JAVA極客特訓
【快班】深入JVM內核—原理、診斷與優化
【快班】Excel數據分析師突擊—從入門到精通到項目實戰
【快班】人工智能前沿系列之生成式對抗網絡
【快班】基于案例學習時間序列分析
【快班】自己動手實踐神經網絡
【快班】 深度學習框架Tensorflow學習與應用
【快班】自然語言處理軟件實驗
【快班】Redis技術實戰
【快班】推薦系統
【快班】Zookeeper分布式系統開發實戰
【快班】Python數據分析案例實戰
【快班】Python金融投資分析實踐
【快班】Kafka原理剖析及實戰演練
【快班】實戰Java高并發程序設計
【快班】MongoDB實戰
【快班】應用系統架構優化方法與案例實戰
【快班】金融市場基礎
【快班】Python自然語言分析
【快班】Python突擊—從入門到精通到項目實戰
【快班】HBase從入門到精通
【快班】Hive數據倉庫實踐
【快班】Hadoop數據分析平臺
【快班】數據分析與SAS
【快班】比特幣
【快班】機器讀心術之文本挖掘與自然語言處理
【快班】機器讀心術之神經網絡與深度學習
【快班】快速上手Jmeter性能測試工具
【快班】軟件性能測試
【快班】軟件自動化測試Selenium2
【快班】大數據必知的java基礎
【快班】快速數據挖掘平臺RapidMiner
【快班】R語言編程技巧
【快班】深入BI之Kettle篇
【快班】基于案例學Java服務器端程序設計
【快班】Scala從基礎到開發實戰
【快班】供應鏈物流—電商發展的“核”動力
【快班】詳解SQL與PL/SQL
【快班】Oracle職業直通車
【快班】深度玩轉Excel
【快班】Hadoop應用開發實戰案例
【快班】大數據的Linux基礎
【快班】機器學習
【快班】量化投資
【快班】SPSS數據分析入門與提高
【快班】Python數據分析
【快班】NoSQL與NewSQL數據庫引航
【快班】大數據算法導論
【快班】大數據的矩陣計算基礎
【快班】R語言數據分析、展現與實例
【快班】大數據的統計學基礎

GMT+8, 2020-12-24 03:27 , Processed in 0.177929 second(s), 32 queries .

(*^▽^*)MG黑暗故事游戏规则 粤26选5开奖结果 以太坊行情图 好友麻将ios 博彩网5151bo一Welcome 不朽情缘金身状态 体彩组三表 股票app开发 美人捕鱼教程 飞鱼直播间 黑龙江快乐十分基本 捕鱼大师工具箱 好运彩靠谱吗 江西多乐彩今日开奖 广东快乐10分计划网 期货风险控制策略 香港麻将游戏单机