自然语言处理:备忘单

2023-09-18 0 290

自然语言处理:备忘单

不久前,与计算机对话并让它不仅能理解,还能回复,还仅限于科幻小说的领域,就像《星际迷航》中的舰载计算机那样。 得益于自然语言处理 (NLP),24 世纪的企业号星舰技术在 21 世纪成为现实,自然语言处理是一门机器学习驱动的学科,使计算机能够理解、处理和响应口语和书面文本。

毫无疑问:NLP 是一个复杂的领域,需要花费数年时间来研究。 本指南包含 NLP 的基础知识,详细介绍了它如何使企业受益,并解释了从哪里开始实施它。

什么是自然语言处理?
自然语言处理 (NLP) 是一种跨学科方法,使计算机能够听到、处理、理解和复制人类语言。 语言学、计算机科学和机器学习等领域都是 NLP 过程的一部分,其结果可以在数字助理、聊天机器人、实时翻译应用程序和其他使用语言的软件中看到。

计算机学习理解和使用语言的概念并不是一个新概念,可以说可以追溯到艾伦·图灵 1950 年发表的《计算机器与智能》论文,这也是图灵测试的想法的由来。

简而言之,图灵试图确定机器的行为方式是否与人类没有区别,这从根本上需要具有处理语言并以明智的方式做出反应的能力。

自从图灵写下他的论文以来,出现了许多自然语言处理方法。 首先是基于规则的系统,例如 ELIZA,它们只能执行一组指令。 像 ELIZA 这样的系统很容易与人类区分开来,因为它们的公式化、非特定的反应很快就会变得重复并且感觉不自然:它缺乏理解,而理解是现代 NLP 的基本组成部分。

随着机器学习的出现,计算机可以根据样本数据通过算法开发自己的规则,自然语言处理以图灵无法预测的方式爆炸式增长。

自然语言处理已经达到了比真人更好地理解人类语音的状态。 然而,即使是这个令人印象深刻的里程碑,仍然距离真正完整的 NLP 还不够,因为执行这项工作的机器只是简单地转录语言,而不是被要求理解它。

现代 NLP 平台还能够以视觉方式处理语音。 例如,TechRepublic 姊妹网站 CNET 表示,Facebook 的 Rosetta 能够“从超过 10 亿张图像和视频帧中实时提取不同语言的文本”。

自然语言处理面临哪些挑战?
计算机不需要理解人类语音就能说一种语言——机器在一种语言结构上运行,允许它们接受输入、处理数据和响应命令。

Swift、Python、JavaScript 等语言都有一些自然语言所缺乏的共同点:精度。

人类语言无论从哪个定义上来说都是不精确的:它是语境性的、隐喻性的、模棱两可的,而且总是说得不完美,而理解语言需要大量的背景知识和解释能力,而计算机缺乏这些背景和解释能力。

计算语言学家 Ekaterina Kochmar 在一次有关自然语言处理的演讲中解释说,单词存在于一种想象的语义空间中。 科赫马尔说,在我们的脑海中,我们有单词的表示,并且具有相关或相似含义的单词在语义理解网络中紧密相连。

以这种方式思考语言可以构建机器学习工具,让计算机通过算法创建自己的语义空间,从而让它们推断单词之间的关系并更好地理解自然语音。

但这并不意味着挑战已经被克服。 对于 NLP 程序来说,从理解简单、精确的语句(例如数字助理的语句)到自己生成合理的语音仍然很困难。 由人工智能(AI)学习理解浪漫语言而产生的糖果心,可以预见是荒谬的,而《路》,一部完全由人工神经网络编写的小说,通常是无意义的,只有最偶尔的语义理解,这可能完全是荒谬的。 归结于偶然。

尽管自然语言处理能够分析语音、将其转化为数据、理解它并使用算法生成适当的响应,但仍然普遍缺乏独立说话或掌握歧义和隐喻的能力。 自然语言的基础。

我们已经掌握了第一部分:理解。 这是第二部分,生成自然语音或人类语言,我们仍然有点坚持。 如果先驱数学家和计算机科学家艾达·洛夫莱斯(Ada Lovelace)是正确的,我们可能会陷入困境一段时间:她认为计算机只能做我们告诉它们的事情,而无法发挥创意。 这被称为洛夫莱斯夫人的反对意见,它已成为对图灵测试的批评的常见部分,从而成为对自然语言处理的批评:如果机器不能有原创思想,那么有什么方法可以教它们使用非原创的语言吗? 最终重复?

如何使用自然语言处理?
自然语言处理对于各种商业用途有很多实际应用。

Google Duplex 或许是当今自然语言处理最引人注目的应用。 2018 年推出的数字助理不仅能够理解复杂的语句,而且还能以与人类几乎没有区别的方式通过电话说话——声音抽动等等。 Duplex 的目标是通过电话执行现实世界的任务,从而节省 Google 用户进行预约、预订服务、下订单等的时间。

98% 的财富 500 强公司现在都在使用自然语言处理软件,通过称为申请人跟踪系统的产品来筛选求职者。 这些产品通过简历挑选合适的关键词和其他语言元素。

聊天机器人正迅速成为在线客户服务的第一线,68% 的消费者表示,他们与聊天机器人交谈时获得了积极的体验。 这些机器人使用自然语言处理来解决基本请求和问题,同时还能够根据需要向人类提出请求。

NLP 在医疗保健环境中的用途有很多:医生听写、处理手写记录、将非结构化医疗保健数据编译成可用格式以及将自然语言与复杂的医疗计费代码连接起来都是潜在的用途。 NLP 最近还被用于筛查 COVID-19 患者。

NLP 可用于衡量呼叫中心环境中的客户态度、对社交媒体帖子执行“情绪分析”、可用作商业智能分析的一部分,并可补充预测分析。

自然语言处理具有潜在的无穷无尽的应用范围:只要采用正确的方法,任何涉及语言的事物都可以成为 NLP 的用例,特别是当它涉及处理大量数据而人类需要很长时间才能处理时。

开发人员如何学习自然语言处理?
NLP 是一个复杂的主题,计算机科学家可以轻松地花费数年时间来了解其细节。 如果您的目标是处于 NLP 研究的前沿,那么最好考虑就读一所以拥有良好的计算语言学课程而闻名的大学。

想要学习利用当前 NLP 技术的开发人员不需要深入研究。 文本分析公司 MonkeyLearn 拥有丰富的自然语言处理入门资源和步骤; 以下是其指南中的几个要点。

开始阅读:NLP 领域有一些标准书籍,例如《统计自然语言处理基础》和《自然语言处理、计算语言学和语音识别简介》。
查看教授 NLP 的在线课程。 Udemy、Coursera 等网站上有很多此类内容。
学习 Python——它是构建 NLP 系统最流行的语言之一。
熟悉自然语言工具包、spaCy 和斯坦福 CoreNLP 等 NLP 框架。
MonkeyLearn 的指南中还包含各种文章、研究和期刊的链接,任何初露头角的 NLP 开发人员都应该注意这些。

企业开始自然语言处理的最佳方式是什么?
每个企业都使用语言,因此您很有可能在您的组织中想出至少一两种自然语言处理的用途,但是您如何从思考 NLP 可以为您做什么到真正付诸实践呢? 有很多步骤需要考虑。

首先,您需要知道 NLP 在您的业务中的目标是什么。 您想使用它作为分析工具来聚合数据,还是想构建一个可以通过支持门户上的文本与客户交互的聊天机器人? 也许您想使用 NLP 作为电子邮件过滤器的支柱、了解客户情绪或将其用于实时翻译。

无论您希望 NLP 为您的企业做什么,您都需要在开始考虑实现目标之前了解您的目标。

一旦您知道自己想用自然语言处理做什么,就该寻找合适的人才来构建您想要的系统了。 您的内部可能已经有熟悉 Python 和上面提到的一些 NLP 框架的开发人员。 如果是这种情况,请从一开始就让他们参与规划阶段。

如果您内部没有可以开发自然语言处理软件的人,您将面临一个选择:雇用新人或引入专门从事 NLP 解决方案的第三方。

如果您选择在内部实现 NLP 目标,则需要找到合适的软件解决方案或提供商来托管您的 NLP 平台,并且有很多知名名称可供选择。

IBM Watson 有多种选择,AWS 提供 Amazon Comprehend 和其他 NLP 服务,Microsoft Azure 也有 NLP 服务,Google Cloud 也有。 选择合适的平台需要开发人员的意见,因为他们每天都会使用该软件,而您的 NLP 计划的成功可能取决于他们使用该平台的程度。

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

七爪网 行业资讯 自然语言处理:备忘单 https://www.7claw.com/61132.html

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务