2023 年是关于采用生成式 AI 和基础模型的一年。然而,随着组织竞相将 Gen AI 置于其工作流程的前沿和中心,他们意识到整理数据事务是多么重要。
虽然公司一直了解高质量数据在业务成功中的作用,但人工智能一代的兴起加强了其价值,确保它是每个人关注的焦点。现在,随着我们进入 2024 年,这将带来更大的一代 AI 故事,领先的行业专家和供应商分享了他们对未来几个月数据生态系统不同方面如何发展的预测。
1. 关系型将摆脱 SQL 的束缚
“无论是利用现代边缘、物联网还是生成式人工智能应用程序来发展业务,2024 年的企业都不乏大胆的计划。所有这些计划都依赖于对企业数据的安全访问。对于许多公司来说,支撑这些应用程序的数据基础设施仍然停滞不前。许多组织继续依赖过时的运营数据库,这些数据库是为处理几十年前的技术需求而构建的
SQL 是一种数据库语言,它缺乏过程逻辑的标准化方法,对于大多数应用程序来说,该过程逻辑嵌入到使用有状态的持久会话连接到 SQL 数据库的应用程序服务器中。这种 SQL 设计方法在 50 年前是有意义的,但对于现代无连接云服务来说,这是一个痛苦的遗产。它通常要求应用程序代码和数据库共同驻留在同一个数据中心区域,这严重阻碍了对当今企业至关重要的无服务器或地理分布式应用程序,例如物联网和边缘应用程序……
展望未来,我们将看到企业采用更敏捷的数据库基础设施,以支持跨物联网、边缘和人工智能的现代应用程序的分布、一致性、可扩展性和灵活性。随着遗留数据库的局限性对企业开发人员来说越来越沉重,以及业务创新步伐的瓶颈越来越大,遗留数据库的挑战只会变得更加昂贵。
– Bob Muglia,Fauna 执行董事长兼 Snowflake 前首席执行官
2. 向量数据库将成为最抢手的技术
“到2024年,矢量数据库将成为最抢手的技术。在数据驱动的洞察力推动创新的时代,矢量数据库因其在处理高维数据和促进复杂相似性搜索方面的实力而迅速获得关注。无论是推荐系统、图像识别、自然语言处理、财务预测还是其他人工智能驱动的企业,了解顶级矢量数据库对于各行各业的软件开发都至关重要。
“随着人工智能从头开始构建新的应用程序……,矢量数据库将在技术堆栈中发挥越来越重要的作用,就像过去的应用程序数据库一样。团队将需要可扩展、易于使用且操作简单的矢量数据存储,因为他们寻求创建具有新的 LLM 支持功能的 AI 产品。
– Talentica Software 首席架构师 Ratnesh Singh Parihar 和 Timescale AI 和矢量总经理 Avthar Sewrathan
3. 在企业数据湖中捞取LLM金牌
“关于普通企业存储多少信息的统计数据并不缺乏——对于大公司来说,这些信息可能高达数百 PB。然而,许多公司报告说,他们挖掘的信息(主要是结构化数据)不到一半,以获得可操作的见解。到 2024 年,企业将开始使用生成式 AI 来利用这些未驯服的数据,将其用于构建和定制 LLM。借助人工智能驱动的超级计算,企业将开始挖掘其非结构化数据(包括聊天、视频和代码),以将其生成式人工智能开发扩展到训练多模态模型。这种超越挖掘表格和其他结构化数据能力的飞跃将使公司能够为问题提供更具体的答案并找到新的机会。这包括帮助检测健康扫描的异常情况,发现零售业的新兴趋势,并使业务运营更加安全。
– Charlie Boyle,Nvidia DGX Systems 副总裁
4. 没有足够复杂的自动化来支持人工智能的公司将感受到燃烧
“随着企业实施人工智能来保持其竞争优势,许多企业将更敏锐地感受到其杂乱无章的数据基础设施的影响。当风险从简单地在仪表板上提供不良信息提高到可能根据该数据自动执行错误决策和行为时,不良数据(或没有足够的数据)的影响将变得更加复杂。没有强大数据基础设施和治理能力的人将生成式人工智能置于关键任务环境中并遭受准确性损失只是时间问题。
– Sean Knapp,Ascend.io 首席执行官
5. Cloud FinOps 团队将优化其数据管道
“面对今年云支出失控的现实,到2024年,将需要真正的跨组织合作伙伴关系来识别不必要的支出,财务和工程团队都发挥着关键作用。在奥升德的年度研究中,48%的受访者表示计划优化其数据管道以降低云计算成本,其中89%的受访者预计未来12个月管道数量将增长。明年,当务之急是利用平台来查明数据管道中发生额外支出的位置,并通过快速演示成本优化来反击,以避免来自上层的误导性授权。
– Sean Knapp,Ascend.io 首席执行官
6. 意向数据将成为进入市场团队的必备品
“到 2024 年,意向数据将不再是上市团队的’锦上添花’。随着公司努力协调销售和营销工作,通过从意图数据中分析行为数据分析来预测客户需求的能力将变得越来越重要。随着人工智能每年变得越来越复杂,我们预计客户参与将持续从被动转变为主动,从而提高转化率并培养长期的客户忠诚度。
– Henry Schuck,ZoomInfo 首席执行官
7. 数据和业务团队将就 AI 产品入职问题展开角逐
“虽然企业用户对ChatGPT等人工智能产品的需求已经起飞,但数据团队在允许访问企业数据之前,仍然会强加一个庞大的清单。这种摇尾巴的场景可能是实现平衡的强制功能,随着人工智能证明自己是可靠和安全的,采用可能会迟早到来。
此外,企业将优先考虑干净的数据集,以赶上人工智能驱动分析的潮流。干净的数据集将成为成功实施人工智能的基础,使企业能够获得有价值的见解并保持竞争力。
– Arina Curtis,DataGPT 首席执行官兼联合创始人
8. 企业将受到实时和人工智能的双重打击
“人工智能驱动的实时数据分析将通过自动化为企业带来比以前更大的成本节约和竞争情报,并使软件工程师能够在组织内更快地行动。例如,保险公司的数据库中存储了数 TB 和 TB 的数据。借助人工智能,到 2024 年,我们将能够实时处理这些文档,并从该数据集中获得良好的情报,而无需编写自定义模型。
到目前为止,软件工程师需要编写代码来解析这些文档,然后编写更多代码来提取关键字或值,然后将其放入数据库和查询中以生成可操作的见解。企业将节省大量成本,因为得益于实时人工智能,公司将不必雇用大量员工即可从数据中获得竞争价值。
– Dhruba Borthakur,Rockset 首席技术官兼联合创始人
9. 知识图谱将帮助用户消除数据孤岛
“随着企业继续将更多数据迁移到数据云中,他们在云中收集了数百、数千甚至数万个数据孤岛。知识图谱将通过利用各种数据源之间的关系,轻松驱动语言模型来导航存在的所有数据孤岛。因此,在新的一年里,我们将看到各种成熟的、新颖的基于知识图谱的人工智能技术出现,这些技术支持智能应用的发展。
– Molham Aref,RelationalAI 首席执行官兼创始人
10.AI 将改变当前的数据管理方法
“企业正在意识到人工智能的潜力,可以为其整体价值主张和竞争优势做出贡献。为了实现这一目标,人工智能需要对不同类型的数据进行训练和处理。有些数据是公开的,但其中很多是特定于组织的个人消费者信息或知识产权。公司会发现,他们需要取得平衡,以保护人工智能模型正在使用的数据,同时仍然使用这些数据来支持有价值的决策。这些创新的数据管理解决方案将随着监管合规性和新兴立法的出台而不断发展。
— Osmar Olivo,Inrupt 产品管理副总裁
11. 首席数据官的角色将成为有希望成为首席信息官的先决条件
“到 2024 年,将为有希望成为首席信息官的有志之士开辟一条新的、万无一失的职业道路——成为并成为出色的首席数据官。在过去的几年里,首席数据官已经从一个低预算的顾问角色发展成为帮助企业充分利用其数据的关键资产。随着越来越多的组织投资于人工智能和云,以实现数据民主化并刺激创新,首席数字官处于主导地位,并且比以往任何时候都更接近首席信息官以及业务的成功。寻找优秀首席信息官的组织将选择那些真正了解数据如何移动、流动和影响组织的人,这意味着首席信息官在追求这条职业道路时将具有天然的优势,并继续在企业中发挥巨大的影响力。
– Heath Thompson,Quest Software 总裁兼总经理
暂无评论内容