-
使用Ollama和Phi4mini在边缘设备上构建AI Agent
最新发布的Phi-4-mini和Phi-4-multimodal现已支持函数调用功能。该功能使模型能够连接外部工具和API。通过在边缘设备上部署具有函数调用能力的Phi-4-mini和Phi-4-multimodal,我们可以实现本地知识能力的扩展,并提高其任务执行效率。本文将重点介绍如何利用Phi-4-mini的函数调用能力在边缘设备上构建高效的AI代理。什么是函数调用工作原理首先我们需要了解函…- 0
- 0
-
手把手教你实现自己的“Manus”:构建基于容器的多用户Agent应用【下】
再重复下我们关注的重点:编码Agent与Web Agent是主要任务工具它们需要在容器环境中执行以确保安全多用户环境,每个用户有自己的Agent与容器本篇将完成剩下的任务(代码地址在文末):构建Tool:Python代码执行器(Docker版)构建Tool:浏览器自动化(Docker版)组装Prompts与ReAct Agent测试与未来改进01构建Tool:Python代码执行器这个工具的任务是…- 0
- 0
-
32.7k star, 让AI接管你的浏览器!5秒完成1小时工作
你是否曾在浏览器自动化中遇到过这样的问题:复杂的网页、频繁的API变动让你头痛不已?或者,你的AI项目总是卡在浏览器控制上,进展缓慢?又或者,你只是想让你的AI代理更加智能、高效?无论是哪种情况,我们都有一个完美的解决方案—Browser Use。项目简介:Browser Use 是一个强大而便捷的工具,它能让AI代理轻松控制浏览器,打破传统方法的种种限制。无论是获取网页信息、自动化浏…- 0
- 0
-
罗永浩的AI新战场,能否打破“行业冥灯”魔咒?
低调许久的罗永浩,最近有了不少“新动作”。先是在3月4日被曝为了实现AIOS系统的创业构想,罗永浩挖来了小米前50号员工、操作系统领域的老兵汪文俊;紧接着3月10日,罗永浩在个人微博上发布招聘信息,其旗下AR创业公司细红线科技(Thin Red Line)启动2025年春季招聘,软件产品部门开放的全职岗位均为产品经理岗,工作地位于上海和北京。图源:微博截图作为罗永浩继锤子科技之后投身的又一家科技创…- 0
- 0
-
Mac Studio 首发实测:10 万块的顶配 Mac,能跑满血版 DeepSeek 吗?
自苹果自研 M 系芯片以来,每年我们都能听到一次:这是有史以来「最强」的 Mac!但「最强」到底有多强?过去,我们只能往 Mac 里多灌几份工程文件,来彰显其性能过剩。但今年,事情开始有了变化,新一代的顶配 PC 测试软件——不再是什么 Mark 或 Bench,而是 DeepSeek。刚上市的 M3 Ultra 是有史以来最强的 Mac,这是极少数你买回家就能部署「满血版」DeepSeek 的电…- 0
- 0
-
【AI-智算】DeepSeek-r1:671b性能压测&H100
前言继上次结合K8s、SGLang、LWS 等技术栈,完成分布式 DeepSeek-r1 推理集群的部署后,经过几天的实际使用,发现当并发数达到一定阈值时,性能出现下降。为进一步评估和优化集群性能,现对已部署的 DeepSeek-r1 推理集群进行深入的性能压测。选型LLM 性能压测工具经过调研,选择 推理引擎 SGLang 自带的 sglang.bench_serving&…- 0
- 0
-
【一文看懂】什么是端侧算力?
随着物联网(IoT)、人工智能和5G技术的快速发展,端侧算力正逐渐成为智能设备性能提升和智能化应用实现的关键技术。什么是端侧算力,它的应用价值是什么,与云计算、边缘计算有哪些区别?本文从以下6个维度向您介绍全方面端侧算力:1. 端侧算力的定义2. 端侧算力的技术框架3. 端侧算力的应用价值与场景4. 端侧算力与其他技术的互补5. 端侧算力与相关技术的区别6. 端侧算力的发展趋势与未来挑战01端侧算…- 0
- 0
-
Tauri 2.0 —— 或许是做 AI 应用的最佳选择
最近我花了一些时间用 Tauri+SvelteKit 做了一个桌面 AI 小软件,技术选型主要以我熟悉的为主,细节请看我的春节碎碎念。当前做桌面应用的除了操作系统原生的开发技术,大家更多会选择一些跨平台的方案,毕竟为每一种客户端投入专门的人员开发,这个成本还挺高的。而跨平台应用开发框架目前主流的就有如下两款:Tauri 与 Electron 对比特性TauriElectron体积大小小(几 MB)…- 0
- 0
-
一文读懂:AI时代为什么需要DPU?
我们都知道,AI时代的到来,刺激了一波智算中心的建设,而DPU能够释放智算中心的有效算力,能够解决基础设施的降本增效问题,重要性和渗透率正逐渐提升AI时代的架构困局随着大模型训练对算力的指数级需求,传统冯·诺依曼架构的局限性日益凸显。当ChatGPT等模型将工作负载分布到数千颗GPU时,突发的梯度数据传输导致网络拥塞,形成"算力墙"与"内存墙"之外的第三大瓶…- 0
- 0
-
大力出奇迹,苹果发售 10 万块的 Mac Studio M3 Ultra 能干什么?
Apple 将于 3 月 12 日发售 M4 Max 芯片与 M3 Ultra 芯片的 Mac Studio。作为迷你型桌面电脑,M3 Ultra 芯片版本的 Mac Studio 现在支持大力堆料的配置,可以选配 32 核中央处理器、80 核图形处理器和 32 核神经网络引擎的 Apple M3 Ultra 芯片,512GB 统一内存,16TB 固态硬盘的奢华配置,售价 108,749 元,还不…- 0
- 0
-
Manus 吹散了人与 Agent 之间的迷雾|直播测试 8 小时,我对 Manus 真实实测感想
想了想,应该有不少读者想看我对 Manus 的评价,还是不偷懒,分享直播实测 8 小时的真实感受。 先给总体评价(非常希望你们能看到最后的小结): 整体感受下来,Manus 工程、产品化做得都很棒,易上手、价值感知明确。 所以文章开头必须给 Manus 团队点赞,同时做到“想到”、“做出来”、“做到让人愿意好好用用的程度”,这真的很不容易。 本文不聊太深入的技术原理,就想给用过 or 没用过的…- 0
- 0
-
英伟达主流GPU服务器以及中国可售型号清单
英伟达GPU服务器分类与核心架构英伟达的GPU服务器根据应用场景和技术架构可分为四大类,其设计目标均围绕“算力密度最大化”展开。1. DGX系列:算力集群的标杆DGX系列是英伟达原厂研发的高性能整机服务器,专为大规模AI训练和超算设计,代表型号包括:• DGX Station A100/H100:单机支持4-8张GPU,通过NVLink实现多卡互联,适用于中小规模模型训练。• …- 0
- 0
-
英伟达4090惊现48GB版本,未来还有96GB版本
近日,有一个关于NVIDIA GeForce RTX 4090显卡的新消息引起了业内极大兴趣。据传,这款前代旗舰级显卡将推出配备96GB超大显存的版本,目前正处于测试阶段,并有望在未来几个月内进入量产。同时,一个48GB显存的版本也已被证实存在。这些消息虽未获官方确认,但结合网上信源和工厂内部人士的说法,RTX 4090的显存升级计划正在稳步推进。RTX 4090自2022年10月发布以来,凭借其…- 0
- 0
-
给Manus泼一盆冷水,给苹果一个大大的赞
苹果终于发布了新版Mac Studio,不是预计的M4 Ultra,而是M3 Ultra,估计M4 Ultra会留给Mac Pro,在经历了从Intel CPU到自家CPU转换的“阵痛期”(感觉它一点都不痛),苹果要再次重视起专业用户的工作站需求了,如果再不跟上的话,引以为傲的软件生态会遭到破坏。但是最大的惊喜是,512GB的一体化内存,而不是预计的256GB。我跟小伙伴讨论了很久时间,甚至跟某强…- 0
- 0
-
我让DeepSeek设计了一个智能运维平台
智能运维AiOps并不是新鲜物种,早在6,7年前早就提出的概念,但业界并没有非常好的解决方案。当然,目前的各大公有云厂商早就有了类似的平台,但当前阶段依然有各种局限性,并不适合小公司使用。我们来看看DeepSeek是如何设计这个智能运维平台的吧。以下是为运维工程师设计的「DeepSeek+智能化运维平台」整合方案,包含技术架构、实施路径和具体场景应用,分为六个核心模块逐步推进:一、技术架构设计1.…- 0
- 0
-
一个指令完成所有工作!Manus AI 预示了未来几年Agent的疯狂发展
3月5日,一款名叫Manus AI的代理Agent系统横空出世。"世界上第一个能交付完整结果的AI代理!"而不到24小时,各大科技媒体的标题已经变成了"Manus AI碾压OpenAI"、"AI代理技术重大突破"、"马斯克紧急加速自家AI代理研发"...到底什么是AI代理?Manus AI又凭什么这么牛?今天,字节笔记…- 0
- 0
-
DeepSeek 给 API 网关上了一波热度
API 网关并不是一个新的概念,但 DeepSeek 的全民化趋势给 API 网关上了一波热度。本文将围绕 API 网关的上下游概念、演进历程和分类、核心能力、DeepSeek 如何接入 API 网关等方面,和大家一起更加立体的重新认识下 API 网关。目录:01 引言02 API 网关的相关概念03 API 网关的演进历程和分类04 API 网关的核心能力和应用场景05 如何使用阿里云云原生 A…- 0
- 0
-
star 34.6k!通过DeepSeek实现AI自动化操作浏览器!
如果能够通过大模型自动操作浏览器,无论是网页抓取、自动化测试还是数据收集都能大大提高效率。因为你无须编写和维护复杂的xpath、正则、css选择器脚本。今天,喵将介绍一个非常有趣的工具——browser-use[1],并结合 DeepSeek 模型,展示通过 AI Agent自动化操作浏览器。开始使用1. 安装依赖首先,你需要确保有一个基础的Python 环境,Python版本…- 0
- 0
-
DeepSeek时代:关于AI服务器的技术思考(PCIe篇)
刚过去的一个周末,IT新闻基本上又被DeepSeek刷屏了。从春节到现在,加班的同行朋友是不是比以前多了?GPU连接方式:PCIe还是UBB?上图是一款4U 8卡(或单宽16卡)的AI服务器,支持可以4卡互连的NVIDIA H200 NVL GPU。其实XE7745这个机型我在《风冷、液冷GPU服务器密度提升 - PowerEdge 17G整机架预览 (2)》中已有过简单介绍;我还在《3U 8卡:…- 0
- 0
-
详细版教程|使用 Higress AI 网关,4步实现 DeepSeek 联网搜索功能
为什么公司部署的 DeepSeek 的内容生成效果不如 DeepSeek 官方的?一是看是否是满血版,二是看是否支持了联网搜索,三是看联网搜索是否仅能获取网页标题、摘要、关键词而非全文。Step.0 配置 DeepSeek 的 API Key可能你在安装 Higress 时没有填写 DeepSeek 的 API Key,那么可以在这里进行配置。Step.1 配置搜索引擎 API 域名首先…- 0
- 0
-
使用 Nginx 对 LLM 服务进行负载均衡实践
想象一下有很多的算法服务实例,负载不均衡会造成:有的节点计算压力很重,用户延迟变长有的节点在闲置,资源浪费需要将请求分发到不同的节点进行处理,让每个节点的负载在合适的水平,这就是负载均衡。1. 简介nginx 是一款开源的、高性能的 Web 服务器,同时也广泛用作 反向代理服务器、负载均衡器 和 HTTP 缓存。 它的设计目标是解决传统服务器(如 Apache)在高并发场景下的性能瓶颈,…- 0
- 0
-
AI全息透明显示音箱,会是音箱市场的“哪吒”吗?
内的智能音箱,在经历2019-2021年的高速增长之后,市场规模增速放缓,销量也逐年下降,智能音箱似乎有点卖不动了。但AI技术的热度又让音箱这个市场再次躁动起来,AI能在音箱上做什么有趣的创新?2022年,由数位硬件极客和艺术家一起成立的品牌幻陆想要为音箱市场带来一种更新的选择,做一款全息歌词音箱。2023年6月,江苏幻陆科技有限公司(以下简称:幻陆)成立了,团队成员在硬件研发、设计和艺术创作等方…- 0
- 0
-
我搭建了自家的全屋智能,还接入了 DeepSeek
一切都是因为不想花冤枉钱 ?刚交房的时候我就下了决心,要把新家搞得高级一点,必须做到全屋智能 ?于是在硬装阶段差不多的时候,我就去深圳的各大家装市场了解了一下行情。真是不去不知道,一去吓一跳 ?就拿一百平的房子举例,华为生态的报价在 4w 左右,更有高端的套餐价格能上到 10w;小米相对好一些,价格能做到 2w ~ 3w。虽然但是,当时我还是觉得有些虚高。我当着店员的面拿出手机,让 ChatGPT…- 0
- 0
-
AI已精,硬件何愚?
近期,华为、联想、星纪魅族等头部厂商陆续宣布了其系统级智能体接入 DeepSeek-R1。尽管 LLM 逐渐朝着人类思考的方式靠近,但接入 AI 大模型的智能终端设备实际体验并不佳,离真正的智能还有很远的距离。传统的 LLMs 主要部署在云服务器上,但存在着延迟、数据隐私安全和联网等等局限性。而随着智能手机、汽车和可穿戴设备等设备的智能化趋势,能在边缘设备上直接部署 LLMs 成为关键需求。目录0…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!

















