煉數成金 門戶 培訓 查看內容

Python機器學習Kaggle案例實戰

2017-5-15 10:02| 發布者: 仙豆| 查看: 67787| 評論: 0|原作者: cruiser

模型 算法 數據分析 機器學習 案例 方法

快速報名入口
快班報名:【快班】Python機器學習Kaggle案例實戰 (隨報隨學)
本課程是《機器學習》《Python機器學習》課程的姐妹篇,旨在加強學員的實際訓練,以案例作為基本講解單元,圍繞案例講解分析思路,特征和模型選擇,編寫代碼等。
本課程的受眾主要是沒有經過專業訓練的IT專業人員,他們可能是程序員,運維,IT系統架構師等等,也適合沒有經過科班訓練的數據分析師。數據分析是一個業務+算法+IT的交叉領域,同時熟悉這三方面知識的人,可以玩轉大數據,產生無窮無盡的花樣,產生巨大的價值。但很無奈的情況是這種人才太少,IT人員即使熟悉本公司的業務,但同時又熟悉算法的人極少。一般只能做一些簡單的維度統計,指標計算等等,如果說到開發更高智能的系統,知識上鞭長莫及。本課程的目標,正是要打破知識的鴻溝,向IT人員普及算法知識,并把這些知識用于實際項目,把中國的機器學習應用能力提高一個臺階。

每期班的學員都會被加入到一個微信群,除了平時的問題解答外,還會另外安排約5次固定時間微課思路分享和答疑,與10次講授共計學習時間約十幾周左右。

Kaggle簡介:
Kaggle創立于2010,是一個專注于舉辦數據科學周邊的線上競賽的網站。它吸引了大量數據科學家、機器學習開發者的參與,為各類現實中的商業難題開發基于數據的算法解決方案。競賽的獲勝者、領先者,在收獲對方公司提供的優厚報酬之外,還將引起業內科技巨頭的注意,獲得各路 HR 青睞,為自己的職業道路鋪上紅地毯。
Kaggle 是當今較大的數據科學家、機器學習開發者社區,其行業地位獨一無二。

課程目標:
課程從已完結的競賽中選取了10個比較有代表性的案例,通過分析優勝參賽者的解決思路和方法,從中學習問題的解決思路、數據的預處理方法,各種機器學習、深度學習等領域中的優秀算法,讓學員可以將這些方法解決各種實際數據分析問題。

課程大綱:
第一課:Crowdflower Search Results Relevance
案例介紹:預測來自電子商務站點的搜索結果的準確性,將搜索得到的網頁按相關性排序
獲獎者所用方法:通過ensemble learning整合多個模型的結果
涉及算法:Ensemble learning

第二課:Santander Product Recommendation
案例介紹:根據銀行客戶1.5年內的行為數據,預測用戶會下一步會投資的新產品
獲獎者所用方法:通過XGBoost構建了多個基本模型,然后將基本模型整合為一個總模型
涉及算法:XGBoost

第三課:TalkingData Mobile User Demographics
案例介紹:根據用戶的手機應用下載和使用行為來預測用戶的人口統計數據(年齡、性別等)
獲獎者所用方法: 先預測性別的概率;使用性別的預測值作為額外的特征加入到模型中,預測年齡;通過條件概率得到兩個目標變量的預測概率
涉及算法:兩段預測,XGBoost

第四課:Facebook V: Predicting Check Ins
案例介紹:預測用戶會在哪個地方登陸Facebook
獲獎者所用方法:特征選擇:數據塊的最近鄰計算;模型構建:基于XGBoost的兩步模型
涉及算法:XGboost
 
第五課:Avito Duplicate Ads Detection
案例介紹:為了避免賣家發布各種經過少量改動的廣告導致買家難以分辨,參賽者需要設計一個模型,自動識別配對中的廣告是否同一個廣告
獲獎者所用方法:特征選擇:采用了FTIM方法測試特征的不穩定性,提出過度擬合的特征。通過XGBoost和Keras構建一層模型;然后通過底層模型構建XGBoost 和隨機森林,最終綜合兩者結果得到最終結果
涉及算法:FTIM;元模型

第六課:Outbrain Click Prediction 
案例介紹:在一組針對用戶推薦內容中,預測用戶點擊每個鏈接的可能,將這些推薦內容按照點擊可能的大小排序
獲獎者所用方法:兩步元模型:通過LibFFM構建第一層模型,再使用XGBoost和Keras構建第二層模型
涉及算法:LibFFM;XGBoost;Keras框架

第七課:Click-Through Rate Prediction
案例介紹:預測某個廣告是否會被點擊
獲獎者所用方法:將數據拆分成不同的子集,構建不同的子模型,再整合
涉及算法:LIBFFM

第八課:Avito Context Ad Clicks
案例介紹:預測俄羅斯較大的一般分類網站的用戶在瀏覽網站時,是否點擊上下文廣告
獲獎者所用方法:預處理:散列技巧和消極的抽樣。 學習方法:FFM、FM和XGBoost。
涉及算法:FFM;FM;XGboost

第九課:Rossmann Store Sales
案例介紹:預測Rossmann公司各個門店的6周銷售量
獲獎者所用方法:分類特征的處理:創建了一種 Entity Embedding(實體嵌入)的方法去代表在多維空間中的分類特征。
涉及算法:Entity Embedding;神經網絡

第十課:Amazon.com - Employee Access Challenge
案例介紹:根據員工的職業角色,預測員工的訪問需求
獲獎者所用方法:11個模型的線性組合:使用不同特征訓練的GBM模型,GLNNET模型,隨機森林模型,logistic回歸模型
涉及算法:GBM模型,GLNNET模型,隨機森林模型,logistic回歸模型

授課時間:
課程將于2020年12月30日開課,課程持續時間大約為15周

授課對象:
對機器學習有興趣的朋友,特別適合想學習算法的IT專業人員或非科班出身的數據分析人員。較好能有一些線性代數,統計等數學基本知識,沒有也無妨,可以在課程期間快速補強。

收獲預期:

能獨立完成某些特定場景的分析工作,勝任數據分析師,機器學習程序員等流行職位的技術要求

授課講師:
tigerfish,知名數據庫網站ITPUB創始人,知名數據分析網站煉數成金創始人。數據庫專家,數據分析專家,有豐富的IT領域、數學領域的知識經驗。他將帶領他的數據分析團隊完成整個授課工作。 他將負責大部分算法講解和思路分析部分。

何翠儀,畢業于中山大學統計學專業,煉數成金專職講師。
在煉數成金上開設了多門關于數據分析與數據挖掘相關的課程,如《大數據的統計學基礎》、《大數據的矩陣基礎》《金融時間序列分析》等,也曾到不同的公司開展R語言與數據分析的相關培訓。對數據分析有深刻認識,曾與不同領域公司合作,參與到多個數據分析的項目中,如華為、廣州地鐵等

課程試聽:


新穎的課程收費形式:“逆向收費”約等于免費學習,僅收取100元固定收費+300元暫存學費,學習圓滿則全額獎勵返還給學員!

特別說明如下:
本門課程本來打算完全免費,某位大神曾經說過“成功就是正確的方向再加上適度的壓力”。考慮到講師本身要付出巨大的勞動,為了防止一些朋友在學習途中半途而廢,浪費了講師的付出,為此我們計劃模仿某些健身課程,使用“逆向收費”的方法。
在 報名時每位報名者收取400元,其中100元為固定 收費,另外300是暫存學費,即如果學員能完成全部課程要求,包括完成全部的書面和互動作業(每周不超過2小時),則300元全款退回。如果學員未能堅持到完全所有的學習計劃任務,則會被扣款。期望這種方式可以轉化為大家強烈的學習愿望和驅動力!

課程授課方式:
1、 學習方式:老師發布教學資料、教材,幻燈片和視頻,學員通過網絡下載學習。同時通過論壇互動中老師對學員進行指導及學員之間相互交流。
2、 學習作業:老師每周布置書面及互動作業,學員需按時按質完成作業。
3、 老師輔導:根據作業批改中發現的問題,針對性給予輔導,幫助大家掌握知識。
4、 結業測驗:通過測驗,完成學業。

附圖:煉數成金大數據課程地圖
[attach]176898[/attach]

您是否對此課程還有疑問,那么請 點擊進入 FAQ,您的問題將基本得到解答
全國統一咨詢熱線 4008-010-006

課程現開始接受報名,報名方式
網上報名 請點擊:Python機器學習Kaggle案例實戰
咨詢Email :edu01@dataguru.cnedu02@dataguru.cn
課程入門討論咨詢群:
706821899(群內有培訓公開課視頻供大家免費觀看)
咨詢QQ: 2222010006 (上班時間在線)

技術熱點、 行業資訊,培訓課程信息,盡在煉數成金官方微信,低成本傳遞高端知識!技術成就夢想!歡迎關注!
打開微信,使用掃一掃功能,即刻關注煉數成金官方微信賬戶,不容錯過的精彩,期待您的體驗!!!


快速報名入口
快班報名:【快班】Python機器學習Kaggle案例實戰 (隨報隨學)
13

鮮花

握手
1

雷人
1

路過

雞蛋

剛表態過的朋友 (15 人)

相關閱讀

熱門頻道

  • 大數據
  • 商業智能
  • 量化投資
  • 科學探索
  • 創業

 

GMT+8, 2020-12-24 05:06 , Processed in 0.138890 second(s), 34 queries .

(*^▽^*)MG黑暗故事游戏规则 浙江6 1开奖时间 卡五星麻将在线玩 长春麻将小鸡飞蛋三风蛋 11选5任四最牛玩法 四肖期期准三肖选一肖 481组选12中奖规则 什么是百搭麻将 江淮安徽麻将APP 一码中奖了 甘肃十一选五助手app 天津快乐十分走势一定牛 海南环岛自行车赛直播 九星福州麻将安卓版 乐乐安徽麻将俱乐部 凤凰时时彩平台官网 体彩江西11选五玩法