热血街头官网

在線體驗

產品下載

NLPIR大數據搜索與挖掘共享平臺, (以下簡稱NLPIR),匯智語言理解,掘金內容價值,讓數據成為智慧,助力企業發展。NLPIR能夠全方位多角度滿足應用者對大數據文本的處理需求,包括大數據完整的技術鏈條:網絡抓取、正文提取、中英文分詞、詞性標注、實體抽取、詞頻統計、關鍵詞提取、語義信息抽取、文本分類、情感分析、語義深度擴展、繁簡編碼轉換、自動注音、文本聚類等。

文檔抽取, 對doc、excel、pdf與ppt等多種主流格式文檔進行文本信息抽取,信息抽取準確率極高,效率達到大數據處理的要求。

漢語分詞, 對原始語料進行分詞,自動識別人名地名機構名等未登錄詞,新詞標注以及詞性標注。用戶可在分析過程中導入自定義的詞典。

文本分類, 根據規則或訓練的方法自動對大量文本進行分類,可用于新聞分類、簡歷分類、郵件分類、辦公文檔分類、區域分類等諸多方面。

智能過濾, 對文本內容的語義智能過濾審查,內置國內最全詞庫,智能識別多種變種:形變、音變、繁簡等多種變形,并實現語義精準排歧。

文本聚類, 能夠從大規模數據中自動分析出熱點事件,并提供事件話題的關鍵特征描述。同時適用于長文本和短信、微博等短文本的熱點分析。

文檔去重, 快速準確地判斷文件集合或數據庫中是否存在相同或相似內容的記錄,同時找出保存所有的重復記錄。

摘要實體, 自動摘要能夠實現文本內容的精簡提煉,從長篇文章中自動提取關鍵句和關鍵段落,構成摘要內容。實體抽取對單篇或多篇文章,自動提煉出內容摘要,抽取人名、地名、機構名、時間及主題關鍵詞;方便用戶快速瀏覽文本內容。

新詞發現, 從文本中挖掘出具有內涵的新詞、新概念,用戶可以用于專業詞典的編撰,還可以進一步編輯標注,導入分詞詞典中,提高分詞系統的準確度,并適應新的語言變化。關鍵詞提取能夠對單篇文章或文章集合,提取出若干個代表文章中心思想的詞匯或短語,可用于精化閱讀、語義查詢和快速匹配等。

人工服務

客服1

電話:010-62648216-812

QQ :3121556514

Insert title here