今天聽了一場講座,主題是關於"AI機器學習"的相關應用",不論是相關的基礎知識或是目前市場上的應用都精闢解說,在短短的3小時內也實機操作了目前免費的"Microsoft Azure Machine Learning Studio"這套雲端AI training平台,這下參與費用500也算值得拉,不同以往用過的Azure服務,這次更人性化、更簡單,有興趣的人可以趁免費測試時間多玩玩,既然學習了,就在此記錄下相關技法供需要者使用:
Step 1:
進入Microsoft Azure Machine Learning Studio網址如下,只要是Azure的帳號都可以登入使用,沒有的就申請一個,程序簡單打打信箱收收信而已,所以不再此多做介紹。
網址:https://studio.azureml.net/
Step 2:
進入平台後會看到他大概的配置如下圖。
Step 3:
我們先匯入一個資料Sample供機器學習(也就是日後演算的框架)。
點選左下角的New,左側工具列選擇DATASET,從FROM LOCAL FILE匯入資料,我整理了一份由政府提供的環境監測資料,就用它來做為範例練習練習吧。
範例網址:https://goo.gl/sWRnQj
Step 4:
再來點選左下角的New,選擇EXPERIMENT,然後點選Blank experiment建立空白實驗。
Step 5:
建立好新實驗,會進入流程編輯頁面。
Step 6:
先從左側Module工具列中的My Datasets中拉取我們的檔案。
Step 7:
在Module搜尋列中打上select columns搜尋Select Columns in Dataset的Module,將它拖曳到編輯流程中,並把我們的資料Module與select columns連結起來。
Step 8:
此時會看到Select Columns in Dataset旁有個紅色驚嘆號,那是因為我們還沒讓他選擇所需的列,所以點選Select Columns in Dataset右側出現的工作欄中點選Launch column selector
我們選擇我們想預測的"PM2.5",再來選擇我們覺得可能會影響的數值:
AMB_TEMP(溫度)、WIND_SPEED(風速)與WS_HR(小時風速值)
選完後使用兩欄位中間的箭頭將其移至參考值。
Step 9:
找到 Split Data ,拖曳至編輯流程中,將它與Select Columns in Dataset連起來,在右側跳出的工作欄中修改Fraction of rows的參數,修改為0.8。
(0.8代表以資料的80%為訓練材料,因為我們資料量不多,所以%越多越好,剩下20%做為資料驗證的模型材料)
完成調整後先SAVE,再來點選RUN讓系統產生資料。
Step 10:
我們選用"線性回歸演算法",搜尋Linear Regression,拖曳至編輯流程中。
Step 11:
我們要開始訓練AI了,搜尋Train Model拖曳至編輯流程中,並把Linear Regression與 Split Data 連上Train Model。
Note!:若沒先RUN過,Train Model會產生紅色驚嘆號,先刪除Train Model,RUN過後再將Train Model拖曳回來即可。
Step 12:
點選Train Model右側跳出的工作欄中點選Launch column selector,進行設定。
我們想預測的"PM2.5",選擇"PM2.5"使用中間箭頭將其移至預測欄。
Step 14:
完成連線後先SAVE,再來點選RUN讓系統產生資料。
Step 15:
於Score Model右鍵選擇Score Dataset裡的Visualize來觀看預測數據。
最右邊的Scored Labels是預測出來的值,當然~~因為我們資料量不足且比較種類太少所以有的準確有的不準確。
Step 16:
現在我們將流程轉成實驗服務並將其發布上網,點選下方功能列的Predictive Web Service
等待流程轉換完後,先點選RUN,之後點選DEPLOY WEB SERVICE來發行我們的預測模組。
發布後就能看到你的預測模組相關的訊息,到這裡簡單展示一下"Microsoft Azure Machine Learning Studio"這套雲端AI training平台的功能,其實這只是冰山一角拉,若有興趣的朋友們可以Google一下有許多文章與功能介紹。
進入Microsoft Azure Machine Learning Studio網址如下,只要是Azure的帳號都可以登入使用,沒有的就申請一個,程序簡單打打信箱收收信而已,所以不再此多做介紹。
網址:https://studio.azureml.net/
Step 2:
進入平台後會看到他大概的配置如下圖。
Step 3:
我們先匯入一個資料Sample供機器學習(也就是日後演算的框架)。
點選左下角的New,左側工具列選擇DATASET,從FROM LOCAL FILE匯入資料,我整理了一份由政府提供的環境監測資料,就用它來做為範例練習練習吧。
範例網址:https://goo.gl/sWRnQj
Step 4:
再來點選左下角的New,選擇EXPERIMENT,然後點選Blank experiment建立空白實驗。
Step 5:
建立好新實驗,會進入流程編輯頁面。
Step 6:
先從左側Module工具列中的My Datasets中拉取我們的檔案。
Step 7:
在Module搜尋列中打上select columns搜尋Select Columns in Dataset的Module,將它拖曳到編輯流程中,並把我們的資料Module與select columns連結起來。
Step 8:
此時會看到Select Columns in Dataset旁有個紅色驚嘆號,那是因為我們還沒讓他選擇所需的列,所以點選Select Columns in Dataset右側出現的工作欄中點選Launch column selector
我們選擇我們想預測的"PM2.5",再來選擇我們覺得可能會影響的數值:
AMB_TEMP(溫度)、WIND_SPEED(風速)與WS_HR(小時風速值)
選完後使用兩欄位中間的箭頭將其移至參考值。
Step 9:
找到 Split Data ,拖曳至編輯流程中,將它與Select Columns in Dataset連起來,在右側跳出的工作欄中修改Fraction of rows的參數,修改為0.8。
(0.8代表以資料的80%為訓練材料,因為我們資料量不多,所以%越多越好,剩下20%做為資料驗證的模型材料)
完成調整後先SAVE,再來點選RUN讓系統產生資料。
Step 10:
我們選用"線性回歸演算法",搜尋Linear Regression,拖曳至編輯流程中。
Step 11:
我們要開始訓練AI了,搜尋Train Model拖曳至編輯流程中,並把Linear Regression與 Split Data 連上Train Model。
Note!:若沒先RUN過,Train Model會產生紅色驚嘆號,先刪除Train Model,RUN過後再將Train Model拖曳回來即可。
Step 12:
點選Train Model右側跳出的工作欄中點選Launch column selector,進行設定。
我們想預測的"PM2.5",選擇"PM2.5"使用中間箭頭將其移至預測欄。
Step 13:
找到Score Model拖曳至編輯流程中,並將它與Train Model、Split Data連結起來。Step 14:
完成連線後先SAVE,再來點選RUN讓系統產生資料。
Step 15:
於Score Model右鍵選擇Score Dataset裡的Visualize來觀看預測數據。
最右邊的Scored Labels是預測出來的值,當然~~因為我們資料量不足且比較種類太少所以有的準確有的不準確。
Step 16:
現在我們將流程轉成實驗服務並將其發布上網,點選下方功能列的Predictive Web Service
等待流程轉換完後,先點選RUN,之後點選DEPLOY WEB SERVICE來發行我們的預測模組。
發布後就能看到你的預測模組相關的訊息,到這裡簡單展示一下"Microsoft Azure Machine Learning Studio"這套雲端AI training平台的功能,其實這只是冰山一角拉,若有興趣的朋友們可以Google一下有許多文章與功能介紹。
By:Ender
Day:2018/10/07
Time:01:53am
Revision :REV 2.01
沒有留言:
張貼留言