词向量可以帮助你找
首先,模型识别命名实体,然后对该实体进行分类或归类。 一些 系统使用词向量来提高速度和准确性。词向量将单词表示为数字,但词向量不是简单地为每个单词分配一个数字,而是在多个维度上生成十进制格式的数字表示,例如在各种上下文中出现的频率。结果 ?相似词的编号非常接近,这使得 模型可以快速准确地找到相似词。 这是一个极其简化的示例。假设您正在使用一个包含家具店评论的数据集。在单一维度上,您的预训练模型为 灯 生成的词向量为 。到类似于 的单词: 光: 适用: 光泽: 解决歧义问题 人类语言的 西班牙电话号码数据 复杂性部分在于具有多种含义的单词数量。这些单词也称为同音异义词,对于人类来说通常是明确的,只要有足够的上下文来解读正确的含义。 例如,根据上下文,我们知道以下每个句子的含义: 投手连续投出三球。 他们又要了一壶冰水。 然而,机器无法理解上下文,因此此示例中的歧义语言提出了真正的挑战。但由于 模型是监督学习模型。
https://static.wixstatic.com/media/ad8ebf_93fc299915274e30acda637173859353~mv2.png/v1/fill/w_490,h_295,al_c,lg_1,q_85,enc_auto/ad8ebf_93fc299915274e30acda637173859353~mv2.png
这意味着它们必须首先经过训练才能应用,因此已经开发了机器学习方法来帮助它们应对这一挑战。 流行的 用例 您可以简单地使用 来收集更多结构化数据并将其存储在数据库中。但 从原始数据中提取结构化数据的能力使其可用于多种用例,包括: 电子商务的搜索功能。准确的搜索功能对于在线销售至关重要。例如,搜索 白色圆形鸡尾酒桌 的顾客并不是在寻找白色产品、圆形产品、鸡尾酒产品或任何类型的桌子。
頁:
[1]