自然语言处理

行业领先的自然语言分析技术,一站式满足文本挖掘、舆情、对话等功能;
基于多种自然语言核心算法,可全面满足各类自然语言理解需求,帮助产品理解世界。

  • core tech 05 item 01

    语法分析

    • 按照源语言的语法规则,从词法分析的结果中识别出相应的语法范畴,同时进行语法检查。
    • 根据业务场景,实现分析、词性标注等功能

  • core tech 05 item 02

    文章分类

    • 分析文章核心关键信息,提取关键词,按照文章内容自动分类,为文章内容分析提供支持;
    • 文章标签服务对文章的标题和内容进行深度分析,输出能够反映文章关键信息的主题、话题、实体等多维度标签以及对应的置信度,该技术在个性化推荐、文章聚合、内容检索等场景具有广泛的应用价值。

  • core tech 05 item 03

    语义相似度

    • 基于领域本体信息,从概念、语句和文档三个对象层面研究文本数据的语义相似度计算问题;
    • 详细描述了语义提取、语义描述、语义计算三方面内容;
    • 包括概念相似度/相关度计算方法、语句相似度计算方法、文档相似度计算方法以及基于语义的领域搜索引擎的索引、排序技术等。

  • core tech 05 item 04

    词向量表示

    • 基于KANKAN AI自有词向量及深度学习,快速完成词向量表示,其中来自词汇表的单词或短语被映射到实数的向量,生成这种映射的方法包括神经网络,单词共生矩阵的降维,概率模型,可解释的知识库方法,和术语的显式表示 单词出现的背景。
    • 当用作底层输入表示时,单词和短语嵌入已经被证明可以提高NLP任务的性能,例如语法分析和情感分析。

  • core tech 05 item 05

    情感分析

    • 是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。
    • 情感分析或意见挖掘是人们的观点,情绪,评估对诸如产品,服务,组织等实体的态度。该领域的发展和快速起步得益于网络上的社交媒体,例如产品评论,论坛讨论,微博,微信的快速发展,因为这是人类历史上第一次有如此巨大数字量的形式记录。