DataWorks 数据开发核心能力全景图
一、AI 原生开发环境
1. 智能算力调度
-
支持 CPU/GPU 混合资源池化调度:DataWorks Serverless 资源组支持配置 CPU 类型和 GPU 类型的资源。以免运维、按需付费、弹性伸缩的 Serverless 架构,将大数据处理与 AI 开发能力无缝融合。开发者在创建个人开发环境时,可以按需选择个人开发环境实例的资源规格,以支持进行高性能的计算工作。

2. 全栈开发支持
-
深度集成阿里云 PAI-DSW,提供 AI 原生的 Python 开发环境:在个人开发环境下,Data Studio 支持 Python 语言的智能生成、一键纠错、注释生成及代码解释等能力,开发效率翻倍,同时支持 Python 的可视化断点调试、代码即时运行以及发布到调度系统,实现了 Python 的全流程开发闭环。
3. Notebook 交互式编程
-
提供交互式、灵活且可复用的数据处理和分析环境 Notebook:增强了数据开发与分析过程中的直观性、模块化和交互性,帮助您更轻松地进行数据处理、探索、可视化和模型构建。

4. 跨域智能编排
-
深度集成阿里云人工智能平台 PAI:数据开发 Data Studio 支持 PAI Flow 节点,突破性实现可视化通过拖拽式编排大数据算子服务来构建 PAI Flow 节点,创新打造可无缝衔接 MaxCompute、Hologres、PAI Flow 节点等的 WorkFlow,通过统一编排,打通数据处理与模型训练双闭环,自动生成全域数据血缘图谱,完整覆盖从特征工程到模型部署的智能链路。

二、智能开发矩阵

代码补全
-
DataWorks Copilot 代码补全能力,可对您正在编写的 SQL 进行智能代码补全。
代码生成
-
您可通过自然语言表达您的业务需求,DataWorks Copilot 会将自然语言指令自动转换成 SQL/Python 语句。
代码改写
-
您可通过自然语言对已有代码进行修改,只需要用自然语言说出您的要求,DataWorks Copilot 就会对指定的代码进行改写;
代码纠错
-
在 DataWorks 中,在代码执行前,您可以主动对已有代码进行错误检查;在代码运行出错后,也可以通过一键纠错,发起对代码错误的纠正。DataWorks Copilot 会告诉您当前代码运行出错的原因以及修正后的代码。
代码解释
-
DataWorks Copilot 可对您指定的代码内容进行解释,提升代码的可读性,方便您快速学习和理解代码。
生成注释
-
您可以对指定的代码生成注释,提升代码的完整性及可读性。
代码问答
-
您可以用自然语言提出对 SQL 语法或者 MaxCompute 函数的相关问题,DataWorks Copilot 会给出解释和用法示例,帮助您加深对 SQL 语法及函数的理解。
代码优化
-
在 DataWorks Copilot Chat 窗口中,您可以对指定的代码发起 SQL 优化,如引入JOIN结合多表等方式简化代码逻辑,提升代码运行效率,一定程度降低数据库的负载。
代码测试
-
在DataWorks Copilot Chat 窗口中,您可以对指定的代码生成测试用例。DataWorks Copilot 会为您生成完整的代码测试报告,包含单元测试、代码性能、边界条件验证等多角度,并生成测试代码,您可据此逐步验证任务代码的每个部分是否按预期工作。
三、Agent智能应用
1. AI 可视化建表
-
在Data Studio-数据目录中,借助DataWorks Copilot建表助手,您只需输入表名关键字即可完成表的创建。也可一键触发,智能推荐字段名称和字段描述的补全。
2. 数据开发 Agent
-
在 Data Studio-数据开发中,借助 DataWorks Copilot 发布助手,您可一键生成上线发布描述,提高发布效率。

3. 查询结果可视化图表及见解生成
-
在 DataWorks-数据开发/数据分析中,借助 DataWorks Copilot 智能图表助手,您可一键生成基于查询结果的可视化图表及数据见解。
4. 智能数据洞察
5. 智能诊断专家

6. 数据质量规则
-
智能推荐数据质量规则:用户可以通过一键唤起 Copilot 的能力,基于 DataWorks 中完整的元数据信息,快速生成适用于特定数据表或业务场景的数据质量规则 -
支持多种数据源类型:该功能支持常见的大数据引擎(如 MaxCompute、E-MapReduce、Hologres 等),并能够根据不同的数据源特性生成适配的规则 -
多维度质量校验:推荐的规则覆盖数据质量的多个维度,包括完整性、准确性、有效性、一致性、唯一性和及时性,确保全面监控数据问题


