毫无疑问,GenAI正在改变数据科学家和分析师的工作方式,包括工具、流程和可交付成果。以下是数据科学家现在可以做些什么来准备。
直到最近,数据科学家和分析师的主要交付成果是数据可视化、机器学习模型、仪表板、报告和用于讲故事的分析见解。现在,有了genAI的能力,数据科学家被要求扩大他们的分析范围,以包括非结构化数据源,帮助业务团队转向数据驱动的决策,就人工智能伦理和治理进行咨询,并帮助为越来越多的公民数据科学家建立护栏。
Infosys Cobalt的执行副總裁Anant Adya说:“GenAI加快了洞察时间,降低了技术技能障碍,并使团队能够为数据驱动的决策扩展带宽。”“虽然人类专业知识仍然至关重要,但genAI作为一个强大的力量倍增器,增强了人类能力,并解锁了新的数据创新机会。”
在Foundry最近进行的一项关于人工智能和分析的OpenText调查中,75%的受访者表示,利用genAI进行数据可视化和报告很重要。然而,只有27%的数据架构和分析角色的受访者将其评为至关重要。人工智能正在推动重大的商业期望,领导者期望数据科学家和分析师获得提供竞争优势所需的知识和技能。数据科学团队应该审查他们的目标,并讨论他们利用生成性人工智能的策略。
Genpact AI/ML全球主管Sreekanth Menon说:“分析、数据可视化和机器学习正在迅速发展,具有生成性人工智能功能,实现了更直观的数据交互、自动化见解和复杂的预测模型。”“随着这些技术的发展,生成人工智能通过创建更准确的可视化,通过自然语言处理简化复杂的数据解释,以及自动生成分析报告来增强这些领域。”
我最近报道了数据治理、软件开发、低代码开发和devsecops是如何根据人工智能突破和新的业务驱动因素而演变的。本文研究了数据科学家和分析师的角色和责任以及他们使用的工具和流程的演变。
目标收入和增长
数据科学家一直在寻找一系列用例来应用他们的技能,包括营销中的潜在客户生成、销售的管道优化、财务的盈利能力分析和人力资源的技能开发。找到生产力的提高很重要,但随着企业利用人工智能寻求新的数字化转型机会,数据科学家应该预计对其服务的需求会更大,特别是在收入增长领域。
“为了超越生产力的提高,重要的是专注于加速长尾收入,长尾收入已经从数字化转型中受益,但仍然依赖于人类分析。Innova Solutions的首席技术官Sreedhar Kajeepeta说:“人工智能现在可以增强这一领域,以实现更大的顶线增长。”“关键领域包括分析长尾客户的需求以调整产品和服务,优化定价和促销,为利基细分市场创建有针对性的营销内容,以及识别传统销售策略以外的新客户细分市场。”
Company Search Incorporated(CSI)的联合创始人兼首席运营官Paul Boynton补充了这些战略分析用例。他说:“生成式人工智能显著增强了分析市场趋势、预测产品需求、优化供应链效率和识别兼容合作伙伴以推动销售和增长的用户界面。”
为了满足这些日益增长的业务需求,数据科学家需要提高他们的业务敏锐度,并找到发现和分析针对收入增长的新数据集的方法。
与人工智能生成的仪表板集成
数据科学家传统上开发了仪表板,作为快速简便的方式来了解新数据集或帮助商业用户回答有关其数据的问题。虽然数据可视化和分析平台在过去几年中增加了自然语言查询和机器学习算法,但数据科学家应该预测一波由geneAI驱动的创新。
IBM业务分析产品管理副总裁Alvin Francis说:“在未来两年内,我们预计从静态商业智能仪表板过渡到更动态、更个性化的分析体验。”“有了生成性人工智能,对传统仪表板的依赖性就会减少,因为用户可以消除分析的噪音,并通过对话获得可操作的见解。数据分析师和数据科学家从临时仪表板生成中解放出来,将专注于将组织知识记录到语义层中,并进行战略分析,创造一个良性循环。”
另一个预测来自CData的高级技术传播者Jerod Johnson,他说:“随着genAI平台集成到可视化工具中,它们可以实现更动态和交互式的数据表示,允许实时合成和场景分析。在接下来的几年里,数据科学家可以期待这些工具的发展,使可视化更加直观和有见地,甚至为创新发现回答未问的问题。”
数据科学家应该利用这段时间学习如何在其数据可视化平台中使用genAI功能。随着可视化变得越来越容易,数据科学家需要准备好使用高级分析功能来提供新型的见解。
赋予公民数据科学家权力
许多领导人预计,针对公民数据科学家的功能将增加,商务人士将学习具有genAI功能的自助商业智能工具将增加。
SAP北美人工智能主管Jared Coyle说:“GenAI正在释放数据的全部潜力,使IT专业人员能够通过扩展功能和自动化工作流程优化规划和分析能力。”“这种演变简化了复杂的任务,并使非技术用户更容易获得高级工具。在未来几年,日常任务的自动化程度将使团队能够专注于更具战略性的工作,推动整个组织更高效的数据驱动决策。”
随着数据可视化工具增强了自然语言能力并自动应用机器学习模型,可能会出现增长。这些功能将简化公民数据科学家的工作,他们可以查询数据、发现异常值、识别趋势,并以更少的专业知识和更少的点击来创建和维护仪表板。
RR Donnelley的企业人工智能架构师Sharmadeep Sarkar说:“GenAI驱动的应用程序和平台可以生成动态可视化、数据故事讲述,并对复杂的数据洞察进行清晰的解释。”“这使得非技术受众更容易理解它们,有助于在大型组织中培养授权的'公民数据分析师'。”
数据、分析、可视化和建模技能从数据科学过渡到业务团队已经十多年了,但genAI可能会加速。这对数据科学家及其工作意味着什么?
EDB首席产品工程官Jozef de Vries说:“随着GenAI在分析中更加集成,数据准备和基本分析等日常任务将变得更加自动化,腾出时间来深入研究。”“先进的人工智能工具将使数据可视化和讲故事更加直观,使数据科学家更容易向非技术同事传达复杂的发现,同时也使这些同事能够使用自然语言来探索数据。这将有助于弥合数据团队和其他部门之间的差距,营造一个更具协作性的环境。”
天文学家首席技术官Julian LaNeve表示,由于生成性人工智能能力,数据科学团队应该期待利益相关者的兴趣和参与度增加。他说:“从数据中进行交互和提取见解的进入障碍将大大降低,因此建立强大的数据文化和实践极其重要。”
LaNeve建议根据数据工程最佳实践和为非技术同事开发一个适当的数据平台。另一个角色是为最终用户提供适当的治理和护栏方面的咨询。
利用非结构化数据集
随着分析数据行和列对商业用户来说变得更容易,数据科学家应该扩大他们的技能和分析工作,以调查非结构化数据源。许多营销、销售和客户服务数据集都是没有结构化的,因此分析它们有助于与寻求增长和竞争优势的企业保持一致。
mPulse的首席采购官Saeed Aminzadeh说:“生成型人工智能正在彻底改变以客户为中心的组织合成和分析大量自由文本对话的方式。”“通过大规模准确地对消费者的意图和需求进行分类,这些高级工具提供了更丰富、更可操作的见解。”
数据科学家应该学习的一项技术是图形数据库。另一个知识图可用于开发具有域智能增强LLM模型的RAG。
RelationalAI研究ML副总裁Nikolaos Vasiloglou说:“将数据组织为知识图而不是扁平的SQL表,在进行高级分析以及运行机器学习模型方面具有巨大的优势。”“最常见的任务是特征工程,随着LLM嵌入知识图中,数据科学家应该期待获得更有意义的生成特征。”
Kumo AI的工程主管兼联合创始人Hema Raghavan表示,数据科学家应该熟悉图形神经网络(GNN)。“GNNs能够跨表查看,找到预测性人工智能任务所需的信号,从而消除了对大量特征工程工作流程的需求。然后,数据科学家可以专注于影响,并确定其业务中可以插入预测的机会。”
利用人工智能代理和模型
数据科学家应该感兴趣的两种新兴人工智能功能是特定行业的人工智能模型和人工智能代理。
例如,Salesforce最近宣布了Industries AI,这是一套预建的可定制的人工智能功能,可解决15个行业的行业特定挑战,包括汽车、金融服务、医疗保健、制造业和零售。一个医疗保健模型提供福利验证,一个汽车模型提供车辆遥测摘要。
关于人工智能代理,Aisera首席执行官Abhi Maheshwari说:“人工智能代理通过参与推理、规划、决策和工具使用,自主处理CRM和ERP交易等任务来提升LLM。这些代理简化了数据分析师通常完成的数据任务,包括清理、探索性数据分析、特征工程和预测。”
这两种趋势说明了数据科学角色的次要转变——从处理数据和开发机器学习模型到专注于利用人工智能代理、调查第三方模型,以及与公民数据科学家合作应用人工智能、机器学习和其他数据科学能力。
数据科学家需要精通的另一个关键领域是人工智能伦理,以及它如何促进其组织的人工智能治理。FlowX.AI人工智能主管Bogdan Raduta说:“随着genAI进一步嵌入分析,数据科学团队必须通过获取新技能、专注于战略协作和优先考虑人工智能伦理来适应。”
Genpact的Menon说:“在数据故事讲述中使用genAI需要解决持续的挑战,例如通过负责任的人工智能减轻偏见和确保生成内容的准确性,以确保道德使用、透明度和公平性,提高数据驱动决策的信任和准确性。”
毫无疑问,人工智能正在改变数据科学家的工作方式以及他们专注于的任务。真正的机会在于引导组织向前发展,并以道德的方式提供分析驱动的影响。