01 什么是Azure ML Studio?
-
低代码/无代码操作:对于非程序员或编程新手来说,这无疑是最大的福音!它提供了直观的拖拽式界面,让你可以像搭积木一样构建机器学习模型。 -
灵活的编程支持:对于有编程经验的开发者,Azure ML Studio也提供了强大的代码支持,你可以用Python、R等语言来完成高阶任务。 -
全面的工具集成:从数据准备、模型训练到部署,它几乎涵盖了机器学习项目的每一个环节。
02 如何开始使用Azure ML Studio?
Step 1: 注册Azure账户
Step 2: 创建Azure ML工作区
-
登录Azure门户后,点击左侧导航栏的“机器学习”。 -
点击“创建”,然后填写工作区信息:
-
订阅:选择你的Azure订阅计划。 -
资源组:可以新建一个资源组,比如叫 ML-Workspace。 -
工作区名称:随便取个名字,比如 MyFirstMLWorkspace。 -
确认信息无误后,点击“创建”,几分钟后,你的机器学习工作区就准备好了! -
数据集支持多种格式,比如CSV、JSON、Parquet等。 -
在Azure ML Studio的界面上,你可以直接拖拽文件上传,并快速预览数据。
Step 3: 进入Azure ML Studio
03 Azure ML Studio的核心功能
1. 数据准备:让数据为你所用
上传和查看数据集
from azureml.core import Workspace, Dataset # 连接到你的工作区ws = Workspace.from_config() # 上传CSV文件并创建数据集datastore = ws.get_default_datastore()datastore.upload_files(['./data/train.csv'], target_path='train-data/', overwrite=True) # 创建一个Tabular数据集dataset = Dataset.Tabular.from_delimited_files(path=[(datastore, 'train-data/train.csv')]) # 打印前5行数据df = dataset.to_pandas_dataframe()print(df.head())
小贴士:
2. 模型训练:简单到不可思议
使用Python训练模型
from azureml.core import Experiment, ScriptRunConfig, Workspacefrom sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitfrom sklearn.ensemble import RandomForestClassifierfrom joblib import dump # 加载数据集data = load_iris()X_train, X_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.2) # 训练模型clf = RandomForestClassifier()clf.fit(X_train, y_train) # 保存模型dump(clf, 'iris_model.pkl') # 上传模型到Azurews = Workspace.from_config()model = ws.models.register(model_path='iris_model.pkl', model_name='iris_model')print(f"模型已注册为:{model.name}, 版本:{model.version}")
3. 模型部署:从开发到生产一站搞定
部署模型为Web服务
from azureml.core import Model, Webservice, Workspacefrom azureml.core.model import InferenceConfig # 加载工作区ws = Workspace.from_config() # 获取注册的模型model = Model(ws, name='iris_model') # 定义推理环境inference_config = InferenceConfig(entry_script='score.py', environment=myenv) # 创建容器实例服务service = Webservice.deploy_from_model(ws, name='iris-service', models=[model], inference_config=inference_config, deployment_config=None)service.wait_for_deployment(show_output=True) print(f"服务已部署在:{service.scoring_uri}")
04 小贴士与注意事项
-
合理分配资源:Azure ML Studio基于云计算,你需要付费使用资源。记得合理配置虚拟机大小,避免资源浪费。 -
版本控制:Azure ML Studio支持模型版本管理,每次注册模型时都会创建新版本,方便你追踪和回滚。 -
安全性:为你的工作区启用角色控制(RBAC),确保只有授权用户能访问敏感数据和模型。


