star 34.6k!通过DeepSeek实现AI自动化操作浏览器!


如果能够通过大模型自动操作浏览器,无论是网页抓取、自动化测试还是数据收集都能大大提高效率。

因为你无须编写和维护复杂的xpath、正则、css选择器脚本。今天,喵将介绍一个非常有趣的工具——browser-use[1],并结合 DeepSeek 模型,展示通过 AI Agent自动化操作浏览器。

开始使用

1. 安装依赖

首先,你需要确保有一个基础的Python 环境,Python版本要大于3.11。

pip install browser-use
playwright install

2. 编写测试脚本

browser-use 官方推荐使用 GPT-4 模型,但为了降低成本,我们可以使用 DeepSeek 。官方的有点卡,我这里使用的是硅基流动的deepseek-ai/DeepSeek-V2.5

接下来,我们可以编写一个简单的 Python 脚本来测试 browser-use 的功能。以下是一个示例脚本,用于获取财联社电报的前十条新闻资讯:

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio

if __name__ == '__main__':
    llm = ChatOpenAI(model="deepseek-ai/DeepSeek-V2.5", api_key="api-key", base_url="https://api.siliconflow.cn")
    asyncdefmain():
        agent = Agent(
            task="打开财联社https://www.cls.cn/telegraph,获取前十条资讯",
            llm=llm,
            use_vision=False,
        )
        result = await agent.run()
        print(result)

    asyncio.run(main())

3. 运行脚本并查看结果

运行上述脚本后,browser-use 会自动打开浏览器,访问指定的财联社地址,并获取前十条资讯。结果将打印在控制台中。

star 34.6k!通过DeepSeek实现AI自动化操作浏览器!

下面是browser-use获取到的数据,并且自动转为了json格式,对于抓取数据可谓是相当友好了。

star 34.6k!通过DeepSeek实现AI自动化操作浏览器!

注意: 本文中的示例代码和配置仅供参考,实际使用时请根据你的需求进行调整

RAG技术前沿技术新闻资讯

Chonkie:开源、轻量、极速的 RAG 分块神器 🦛

2026-4-22 9:23:07

企业落地数字员工新闻资讯

COZE多agent企业应用实践落地,4名AI员工上线

2026-4-22 9:24:07

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索