-
48GB 5090 已点亮,即将量产
5090应该是魔改玩法最多的芯片,单面支持32G/48G/64G,双面可以64G/96G/128G 官版的5090是32GB GDDR7 ,采用2GB X 16 布局,涡轮版已经正常出货,目前涡轮版K级订单8~12周价格是2.2~2.3w/片;《英伟达5090,暴跌!》 5090官版PCB显存以54…- 9
- 0
-
MiniCPM 4.0极速狂飙,端侧模型的比赛,结束了!
端侧长文本模型迎来了革命性时刻!面壁智能联合清华大学刚刚发布的MiniCPM 4.0,用一个让人难以置信的数字宣告了端侧长文本时代的到来:极限场景下220倍加速!这不是简单的性能提升,而是从「龟速爬行」到「疾速飞驰」的质变。作为一个只有一台4090、还要在上面部署一堆模型的GPU Poor,我从MiniCPM 2.5开始就一直混迹于官方群24群,并密切关注这个项目的每一次更新——各个量化版本我都详…- 10
- 0
-
如何让你的Gemini不再短小,一口气生成万字长文?
今天在做小说写作教程的时候,被一个群友问到了:“为什么我的Gemini输出变得很短?好像和0325相比,一次吐出的字数短了很多,经常两三千token,以前好像可以上万Token的。”这个问题很常见,船板我平时其实超长文输出的场景不多,我更习惯简短输出,这样方便我随时指导AI修正。但必须承认,在写小说的时候,有时候我们就是需要一次吐出万字完整长文,这样在关键描写的段落,才有更大的扩写、修…- 78
- 0
-
一觉醒来,国内 AI 的天又要崩了吗?
拖拖拉拉烟雾弹了好几天呐,o3-pro 终于发布了!先发布后上线,不是等待名单更胜等待名单。o3-pro 是 OpenAI 今年早些时候推出的推理模型 o3 的一个升级版本。与传统的AI模型不同,推理模型能够一步一步地解决问题,这使其在物理、数学和编程等领域表现得更为可靠。ChatGPT Pro 和 Team 用户将今天就可以使用 o3-pro,它将取代之前的 o1-pro 模型。企业版…- 10
- 0
-
一文读懂数据向量化和向量数据库
在人工智能技术飞速发展的当下,数据作为驱动创新的核心要素,其处理与应用的方式正不断革新。数据向量化打破了计算机理解复杂数据的壁垒,而向量数据库则为海量向量化数据提供了高效的存储与检索方案。这两项技术的融合,不仅重塑了数据处理的底层逻辑,更为智能搜索、个性化推荐、多模态分析等应用场景开辟了新的可能。接下来,让我们深入探究数据向量化与向量数据库的奥秘,解析它们如何共同推动数字世界迈向新的高度。一、数据…- 8
- 0
-
大模型的蒸馏与量化相关概念通俗理解
一、模型蒸馏:知识的传承与简化1.1 为什么需要模型蒸馏?1.2 模型蒸馏是如何实现的?1.3 模型蒸馏的优势二、模型量化:降低精度,提升效率2.1 为什么要进行模型量化?2.2 模型量化的方式有哪些?2.3 模型量化的优势三、小结在大模型蓬勃发展的今天,模型的规模和复杂度不断攀升。然而,这也带来了诸如高计算成本、大存储需求等问题。为了让大模型能在更多设备上高效运行,模型蒸馏与量化技术应运而生。这…- 9
- 0
-
大模型是「躲在洞穴里」观察世界? 强化学习大佬「吹哨」提醒LLM致命缺点
为什么语言模型很成功,视频模型还是那么弱?「我一直很困惑,语言模型怎么能从下一个 token 预测中学到这么多,而视频模型从下一帧预测中学到的却那么少?难道是因为大模型(LLM)其实是伪装的大脑扫描仪?」近日,加州大学伯克利分校副教授、强化学习大牛 Sergey Levine 发出了一记灵魂拷问。AI 技术在快速发展,人们对于 AI 能力的上限,以及人脑和电脑异同的思考也越来越深入。上周末,Ope…- 8
- 0
-
DeepSeek 大模型点燃 AI 市场,企业知识库成关键落地场景
DeepSeek 大模型的火爆,让生成式 AI 重新成为市场焦点。热潮过后,我和团队一直在思考一个核心问题:除了内容创作、编程等场景,AI 还能在哪些领域真正落地?经过深入调研,我们得出以下关键结论:企业知识库类产品是生成式 AI 最具竞争力的落地场景。无论是面向客户的智能客服,还是面向员工的知识问答,AI 都能显著提升沟通效率。RAG(Retrieval-Augmented Generation…- 4
- 0
-
企业知识库图文混排再升级:可视化前端一键解析
产品效果上周我们团队开源了 RAGFlow 知识库支持图文混排后,有同学私信我们能不能做一个前端出来,释放双手。企业生产环境下知识库管理者通过 可视化前端页面完成文档上传解析,并自动支持图文混排 ,效率将会大幅度提升。文档上传完成后,在 RAGFlow 进行问答,便可以 自动显示文档里的图片 :实现原理图文混排 整体流程如下 :暂时无法在飞书文档外展示此内容文档 OCR 引擎在之前发布的「RAGF…- 9
- 0
-
KonwFlow v0.0.5 发布:新增 Markdown 智能分块和按标题分块策略,检索效果提升明显
背景KonwFlow v0.0.4 实现了 RAGFlow 采用 MinerU 模型进行文档解析,并支持了多种文件格式。在社区同学的协助下,进一步完善了 MinerU GPU 支持,使得产品达到可用状态。基于从可用到好用的产品迭代思路,KnowFlow v0.0.5 正式发布,进一步增强 MinerU 解析产物 Markdown 文件的分块策略,增强分块检索效果,从而增强最终召回准确率…- 12
- 0
-
AI思考新篇 – 技术的舒适区 vs 抽卡
曹曦之前文章用到了一个很好的描述 —— “技术的舒适区”,一般来说成功的公司都是在技术的舒适区里展开商业模式,而不是在技术的绝对前沿。要判断 AI 产品是否在技术的舒适区,只需要看是否 “抽卡” —— 意思是可灵/Sora这种在抽卡阶段的模型,用户为了生成一条心仪的片段,需要点很多次 “重新生成” 或 “重新运算”我司在美国有一定规模的 AI 娱乐产品的 “regenerate” 按钮使用比例大概…- 7
- 0
-
AI 创业者的反思:那些被忽略的“快”与“长”
AI浪潮刚开始,我们就冲到了美国总榜前30。当时看着同屏的公司,都是耳熟能详的大厂,其中有两位还是自己当年在美国服务过的老东家,有一种飘飘然的感觉。在这波 AI 落地的技术浪潮中沉浮冲浪了两年,我的认知螺旋上升,被现实一再的打击和蹂躏,逐步意识到哪些是错误的产品方向(留存、营收、护城河等角度判断),再一点点 pivot —— 思考、实践、反馈、迭代。本文记录一下阶段性的一些挫折和反思。我之前忽略了…- 5
- 0
-
百度网盘文库能成为AI时代的“瑞士军刀”吗?
一、“相机+AI”会碰出什么火花?在聊如何改造今天的手机上的相机之前,我们先来回顾一小段相机发展的历史——1913年6月,德国工程师奥斯卡·巴纳克设计了一款轻型相机,这款相机创造性地使用35毫米电影胶片作为底片。而在此之前相机都使用巨大的8*13厘米玻璃底片,使用这种底片的相机体积巨大,需要装在笨重的木盒里使用大型三脚架才能固定。所以,在巴纳克的发明之前,照相是一种室内行为,人们在照相馆里拍摄表情…- 6
- 0
-
深度解读 Qwen3 Embedding:从基础模型到SOTA文本Embedding与Reranker
今天我们聊一下来自阿里巴巴通义实验室的 Qwen3 Embedding 系列模型,如果你一直在关注大语言模型(LLM)的进展,尤其是它们在信息检索、问答系统、RAG(检索增强生成)和智能体(Agent)等领域的应用,那你一定知道高质量的文本表示(Embedding)和重排(Reranking)有多么重要。这篇名为《Qwen3 Embedding》的技术报告,就像为我们揭开了一层面纱,让我…- 5
- 0
-
阿里云DLF:面向 AI 时代的数据基础设施演进
导读 本次分享题目为 OpenLake 面向 AI 时代的数据基础设施演进。主要介绍:1. 背景介绍2. 数据湖基础设施的演进3. DLF 数据湖平台:OpenLake 的存储底座4. DLF 数据湖平台:多模态数据湖分享嘉宾|李劲松 阿里云 高级技术专家编辑整理|永铮内容校对|李瑶出品社区|DataFun01背景介绍当今主要数据趋势,是从数据湖和数据仓库,…- 3
- 0
-
中国AI基础设施崛起:美国视角下的中国创新之路
导语2025年5月29日,美国特别竞争研究项目(Special Competitive Studies Project,SCSP)和情报公司Strider联合发布了题为《中国人工智能基础设施激增》(China's AI Infrastructure Surge)的报告。该报告从美国视角出发,深入剖析了中国在人工智能基础设施领域的快速发展,旨在为美国政策制定者和战略利益相关者提供参考。报告…- 4
- 0
-
国金证券大模型赋能投资研究场景探索
在当前数字化与智能化快速发展的时代,金融领域正经历着深刻的变革。证券行业作为金融体系的重要组成部分,面临着前所未有的机遇与挑战。随着人工智能技术的持续进步,尤其是大模型技术的不断突破,证券行业的智能化发展迎来新的契机。截至目前,至少有30家证券公司相继宣布接入DeepSeek等大模型产品或推进其本地化部署,这标志着证券行业在智能化发展道路上迈出了重要步伐。一、大模型在证券行业应用的挑战大模型在证券…- 6
- 0
-
聊聊AI应用架构演进
本文通过一条AI应用架构演进的路线(图来自《AI Engineering》),来描述和记录每一次演进增加的架构内容以及概述涉及到的相关技术,从而帮助自己以及有需要的同学按照一定的脉络整理LLM和AI应用快速发展下不断迸发的新设计和新技术,也为后续可能的关于AI应用架构和传统应用架构的异同的主题探讨做些调研。最初的起点最简易的AI应用架构上图描述的应该是最简单的用户和AI的交互方式,从现在的视角看,…- 4
- 0
-
ChatGPT的记忆系统是如何工作的
ChatGPT 的记忆系统让它在众多大模型应用中脱颖而出。但是,记忆功能目前并未通过 #OpenAI API 向开发者开放。这篇分析文章,旨在更好地理解 #ChatGPT 的记忆系统是如何工作的,以及为什么它的使用体验如此出色。本文分为三部分:1. 逆向分析 ChatGPT 记忆系统的工作方式2. 推测 ChatGPT 记忆系统的技术实现3. 理解…- 4
- 0
-
Qwen3 嵌入与重排序(技术报告):复杂指令下的文本处理新能手(万字)
“ 前些天 Qwen3 冷不丁的发布了 Embedding 让人惊喜。已经有小伙伴做了自己业务上的测试,据说挺好用,一起看看它的技术报告吧。”大家好,我是肆〇柒。上网的各位,对网络搜索一定不陌生,当下每天都会有数十亿次查询涌向各大搜索引擎,希望搜索有价值的内容;而在 AI 的 RAG 问答系统里,智能助手努力剖析问题的核心语义,以便从知识库中提炼出贴合需求的答案;推荐系统的背后,算法辛勤…- 5
- 0
-
上下文窗口错觉:为什么你的 128K token 不起作用
一、当理论容量遭遇现实困境在大语言模型(LLM)的技术竞赛中,上下文窗口长度早已成为各家标榜的核心指标。从GPT-4o的128K到Gemini 1.5的1M,模型厂商不断突破Token容量的上限,仿佛更长的上下文就意味着更强的信息处理能力。然而,这场“军备竞赛”背后却隐藏着一个残酷的现实:模型对长上下文的利用率远低于理论预期。本文将结合最新研究与实践案例,揭示长上下文应用中的“甜甜圈洞”现象(Do…- 7
- 0
-
大语言模型并非一切:你还应该了解这 8 种不同的 AI 模型类型
2023年,如果你说“AI”,大多数人想到的都是“ChatGPT”。快进到2025年,局面看起来完全不同了。虽然LLMs(大型语言模型)可能点燃了AI革命,但现在我们正深入一个专用AI模型的时代,每个模型都设计有特定的超能力。然而, 人们仍然称它们为LLMs。这就像把每辆车都称为“汽车”,无论它是自行车、卡车还是飞机。当然,它们都能移动,但它们的用途却截然不同。如果你是一名AI研究人员、…- 6
- 0
-
GitMCP:为任意GitHub仓库文档提供即时MCP服务
你是否遇到过这种情况:凌晨2点在调试一个复杂的新库问题。官方文档零散不全,Stack Overflow上的答案已经过时,而你的AI助手总是建议一些根本不存在的API。听起来很熟悉吧?解决方案GitMCP + Claude Desktop = 再也不用翻找过时文档了。我只花了10分钟设置这个工具,这周就已经为我节省了4个小时。下面是能够彻底改变你开发工作流程的具体步骤。我的真实使用场景昨天,我需要实…- 4
- 0
-
将AI当模型看,为什么能少走很多弯路?
这个标题对很多读者而言会觉得有点奇怪:“AI(这里特指大语言模型)不就是一种数学模型么,很显然的事有必要拿出来讲么?”有必要,是因为我们常常忘记大语言模型的本质。在我们当前的语境下,因为大语言模型的巨大成功,我们会将其视为一个“会说话的人”,或一个“无所不知的专家”,甚至一个“觉醒的意识体”。我们开始赋予它意志、情绪和判断,亦开始恐惧它的取代、操控和失控。但实际上,大语言模型不过是一个庞大的数学函…- 9
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!





















