terasoft
文本分析工具箱

Text Analytics Toolbox. 文本分析工具箱

Introduction

文本分析工具箱提供用於前處理,分析和建模文本數據的演算法和視覺化的相關工具。使用此工具箱建立的模型可用於情緒分析,預測性維護和主題建模等應用。

文本分析工具箱包括用於處理來自如設備日誌,新聞報導訂閱,問卷,操作報告和社群媒體等來源的原始文字的工具。使用此工具箱,您可以從常見的文件格式擷取文字,前處理原始字串,擷取指定的單詞,將文字數字化及建立統計模型。

使用如潛在語意分析(latent semantic analysis,LSA),隱含狄利克雷分布(latent Dirichlet allocation,LDA)和詞嵌入(word embeddings)等機器學習技術,您可以從高維度字串資料中找到分群並建立特徵。使用文本分析工具箱建立的特徵可以與來自其他資料源的特徵相結合,以利機器學習模型使用數字和其他類型的特徵。

本工具箱使用需搭配MATLAB、Statistics and Machine Learning Toolbox。建議搭配Parallel Computing Toolbox、Neural Network Toolbox

Key Features