本課程涵蓋文字資料分析與探勘的主要技術,採用R或Python語言做為文字探勘工具,著重於自然語言處理的統計基礎。以實作方式進行自然語言處理流程貫穿中英文文字案例的講解,期能讓學員挖掘出潛藏於組織內外部文字資料中的價值。
資策會「文字資料探勘實作班」將於2017年4月29日開辦,相關資訊請參閱課程網頁,或電(02)6631-6533,黃小姐。
課程網址: http://www.iiiedu.org.tw/ites/TEXT.htm
課程大綱:
1. 文字資料探勘 partⅠ
‧ 文字資料探勘簡介與應用案例
‧ 文件記號化
‧ 詞袋模型與詞頻計算(文件詞項矩陣)
‧ 字詞關聯與文字雲
‧ 屬性挑選與維度縮減
2. 文字資料探勘 partⅡ
‧ 詞項與文件群集
‧ 文件分類
‧ 詞性標注
‧ n元(n-gram)模型
‧ 主題模型
‧ 分散式文字資料處理
詳細內容請參考課程網址:http://www.iiiedu.org.tw/ites/TEXT.htm
資策會「文字資料探勘實作班」將於2017年4月29日開辦,相關資訊請參閱課程網頁,或電(02)6631-6533,黃小姐。
課程網址: http://www.iiiedu.org.tw/ites/TEXT.htm
課程大綱:
1. 文字資料探勘 partⅠ
‧ 文字資料探勘簡介與應用案例
‧ 文件記號化
‧ 詞袋模型與詞頻計算(文件詞項矩陣)
‧ 字詞關聯與文字雲
‧ 屬性挑選與維度縮減
2. 文字資料探勘 partⅡ
‧ 詞項與文件群集
‧ 文件分類
‧ 詞性標注
‧ n元(n-gram)模型
‧ 主題模型
‧ 分散式文字資料處理
詳細內容請參考課程網址:http://www.iiiedu.org.tw/ites/TEXT.htm