ChatGPT 和基于大型语言模型 (LLM) 的类似工具非常出色。但它们并不是万能工具。
这就像选择其他工具进行构建和创作一样。你需要根据工作需要选择合适的工具。你不会用锤子去拧紧螺栓,也不会用打蛋器去翻转汉堡肉饼。这样做的过程会很笨拙,最终导致失败。
像 LLM 这样的语言模型只是更广泛的机器学习工具包的一部分,它包括生成式人工智能和预测性人工智能。选择正确类型的机器学习模型对于满足任务要求至关重要。
让我们深入探讨一下,为什么 LLM 更适合帮助您起草文本或集思广益,而不适合处理企业最关键的预测建模任务。传统的 "机器学习模型在 LLM 之前仍然发挥着重要作用,并在企业中反复证明了自己的价值。我们还将探索一种将这些工具结合在一起使用的开创性方法--Pecan 称之为 Predictive GenAI 的令人兴奋的发展。
LLM 专为文字设计而非数字
在机器学习中,不同的数学方法被用来分析所谓的 "训练数据"--代表数据分析师或数据科学家希望解决的问题的初始数据集。
训练数据的重要性怎么强调都不为过。训练数据中包含了机器学习模型 "学习 "的模式和关系,以便在以后获得新的、未见过的数据时预测结果。
那么,LLM 具体是什么呢?大型语言模型或 LLM 属于机器学习的范畴。它们源于深度学习,其结构专为自然语言处理而开发。
可以说,它们是建立在单词基础之上的。它们的目标仅仅是预测一连串单词中的下一个单词。例如,iOS 17 中 iPhone 的自动更正功能现在使用 LLM 来更好地预测你下一步最有可能输入的单词。
现在,想象一下你是一个机器学习模型。你已经接受过预测单词的训练。你已经阅读并研究了数百万个单词,这些单词来源广泛,涉及各种主题。你的导师(也就是开发人员)帮助你学习了预测单词和创建符合用户要求的新文本的最佳方法。
但这里有一个转折。用户现在给了你一张包含客户和交易数据的海量电子表格,其中有数百万行数字,要求你预测与这些现有数据相关的数字。
你认为你的预测结果会如何?首先,你可能会因为这项任务与你辛苦学习的内容不符而感到恼火。更重要的是,你被要求完成的任务与你所学的知识不符。而且你的表现可能也不会太好。
训练与任务之间的差距有助于解释为什么 LLM 不适合涉及数值、表格数据(大多数企业收集的主要数据格式)的预测任务。相反,为处理这类数据而专门制作和微调的机器学习模型会更加有效。实际上,它就是为此而训练的。
LLM 的效率和优化挑战
除了更适合数值数据外,传统的机器学习方法也比 LLM 更高效、更容易优化以获得更好的性能。
让我们回到你模仿 LLM 的经历。阅读所有这些单词并研究它们的风格和顺序听起来很费劲,对吧?要将所有这些信息内化,需要付出很大的努力。
同样,LLM的复杂训练也会产生拥有数十亿参数的模型。这种复杂性使这些模型能够理解和应对人类语言中的微妙差别。然而,当 LLM 生成反应时,繁重的训练也会带来繁重的计算需求。以数值为导向的 "传统 "机器学习算法,如决策树或神经网络,所需的计算资源可能要少得多。这并不是 "越大越好 "的问题。即使 LLM 可以处理数值数据,这种差异也意味着传统的机器学习方法仍然更快、更高效、更环保、更具成本效益。
此外,你是否问过 ChatGPT 它是如何知道要提供某个特定回复的?它的回答很可能有点含糊不清:
我根据授权数据、人类培训师创建的数据和公开数据的混合物生成回复。我的训练还涉及从书籍、网站和其他文本等各种来源获取的大规模数据集,以培养对人类语言的广泛理解。训练过程涉及在数千个 GPU 上运行计算,历时数周或数月,但具体细节和时间尺度为 OpenAI 所有。
该回答所反映的 "知识 "有多少来自人类训练员,有多少来自公共数据,有多少来自书籍?就连 ChatGPT 自己也不清楚:"这些来源的相对比例不得而知,我也无法详细了解哪些具体文件是我的训练集的一部分"。
让 ChatGPT 如此自信地回答你的问题,却又无法追溯其回答的具体来源,这让人有点不安。LLM 有限的可解释性和可解释性也给针对特定业务需求优化 LLM 带来了挑战。你可能很难理解其信息或预测背后的原理。更复杂的是,某些企业需要满足监管要求,这意味着它们必须能够解释影响模型预测的因素。总而言之,这些挑战表明,传统的机器学习模型(通常更容易解释和说明)可能更适合业务用例。
LLM 在企业预测工具包中的正确位置
那么,我们是否应该让 LLM 专注于与单词相关的任务,而忘掉它们在预测性用例中的作用呢?现在看来,它们似乎根本无法帮助预测客户流失率或客户终身价值。
问题是:虽然 "传统机器学习模型 "让这些技术听起来广为人知且易于使用,但我们从 Pecan 的经验中了解到,即使是这些更熟悉的人工智能形式,企业在很大程度上仍在努力采用。
Workday 最近的研究显示,北美 42% 的公司要么尚未开始使用人工智能,要么只是处于探索的早期阶段。自从机器学习工具变得更容易为公司所用以来,已经过去了十多年。他们有时间,也有各种工具可用。
出于某种原因,尽管数据科学和人工智能备受关注,而且其对业务产生重大影响的潜力已得到公认,但人工智能的成功实施却出奇地罕见。在人工智能的承诺与有效实施人工智能的能力之间,还缺少一些重要的机制来帮助弥合差距。
而这正是我们认为 LLM 现在可以发挥重要桥梁作用的地方。LLM 可以帮助企业用户跨越确定要解决的业务问题与开发预测模型之间的鸿沟。
有了 LLM,那些不具备手工编码机器学习模型能力的业务和数据团队现在可以更好地将他们的需求转化为模型。正如家长们喜欢说的那样,他们可以 "用他们的话 "来启动建模过程。
将 LLM 与专为商业数据而构建的机器学习技术相结合
现在,Pecan 的 Predictive GenAI 已经具备了这种能力,它将 LLM 的优势与我们已经高度完善和自动化的机器学习平台相融合。我们由 LLM 驱动的预测性聊天收集企业用户的输入,以指导预测性问题的定义和开发,即用户希望用模型解决的具体问题。
然后,利用 GenAI,我们的平台会生成一个预测笔记本,使下一步的建模工作变得更加简单。同样,利用 LLM 功能,该笔记本包含预填充的 SQL 查询,可为预测模型选择训练数据。Pecan 的自动数据准备、特征工程、模型构建和部署功能可在创纪录的时间内完成其余流程,比其他任何预测建模解决方案都要快。
简而言之,Pecan 的 Predictive GenAI 利用LLM无与伦比的语言技能,使我们同类最佳的预测建模平台对企业用户来说更加易用和友好。我们很高兴看到这种方法将帮助更多公司在人工智能领域取得成功。
因此,虽然单靠语言学家并不能满足您所有的预测需求,但他们可以在推动人工智能项目方面发挥强大的作用。Pecan 的 Predictive GenAI 可以解释您的用例,并通过自动生成的 SQL 代码为您提供一个良好的开端,在整合这些技术方面处于领先地位。