首页人工智能openai新模型 OpenAI新模型用的嵌入技术被网友扒出来了

openai新模型 OpenAI新模型用的嵌入技术被网友扒出来了

编程之家2026-06-12809次浏览

OpenAI新模型用的嵌入技术被网友扒出来了

OpenAI新模型使用的嵌入技术是Matryoshka Representation Learning(MRL,俄罗斯套娃表征学习),该技术允许开发者通过调整嵌入维度权衡性能与成本,在缩短嵌入长度时仍保持概念表征能力。以下是具体分析:

openai新模型 OpenAI新模型用的嵌入技术被网友扒出来了

技术核心:MRL的嵌套优化机制MRL通过嵌套方式在高维向量中学习不同容量的表征,其核心原理如下:

嵌套结构:将低维向量(如256维)嵌套在高维向量(如3072维)中,形成从粗到细的层级化表征。低维部分包含基础语义信息,高维部分补充细节,无需独立训练不同维度的模型。自适应部署:开发者可通过dimensions参数截取向量前m维(m≤原始维度),直接获得信息量与m维独立训练模型相当的嵌入,且无需额外计算成本。例如,text-embedding-3-large在MTEB基准上缩短至256维时,性能仍优于未缩短的1536维旧模型text-embedding-ada-002。

图1:MRL在高维向量中嵌套低维表征,实现维度自适应技术优势:性能与成本的平衡计算效率提升

在分类任务中,MRL结合自适应级联可显著降低平均嵌入维度。例如,在ImageNet-1K数据集上,达到相同精度时表征大小最多可缩小14倍。

在检索任务中,通过分阶段使用不同维度(如先用前64维筛选候选,再用512维重排序),理论速度提升128倍(FLOPS计),实际响应时间加快14倍,且精度与单次检索相当。

灵活性与多保真度

openai新模型 OpenAI新模型用的嵌入技术被网友扒出来了

开发者可根据硬件限制(如向量数据库仅支持1024维)动态调整嵌入长度。例如,text-embedding-3-large原始维度为3072维,通过设置dimensions=1024可生成兼容向量,仅牺牲少量精度。

长尾持续学习场景中,MRL因维度间语义共享特性,准确率提升2%,且鲁棒性与原始嵌入一致。

零额外训练成本

Matryoshka表征的低维部分直接从高维向量截取,无需单独训练小模型,避免了传统方法中多模型维护的复杂性。

应用场景:大规模分类与检索分类任务:MRL训练的模型生成可变长度嵌入,自适应级联分类器根据精度需求动态选择维度。例如,在ImageNet-1K上,基线模型需2048维达到76.5%精度,而MRL仅需146维即可实现同等性能。

图2:MRL在分类任务中显著降低嵌入维度检索任务:分阶段检索流程(筛选→重排序)结合MRL嵌入,在FAISS等向量数据库中实现高效相似性搜索。例如,在Glove-1.2M数据集上,MRL检索速度比单次检索快14倍,且NDCG@10指标仅下降1%。

openai新模型 OpenAI新模型用的嵌入技术被网友扒出来了

技术溯源:MRL论文关键贡献MRL由Aditya Kusupati等人于2022年提出,其核心创新点包括:

理论框架:证明通过嵌套优化可同时学习多维度表征,且低维部分信息量与独立训练模型相当。工程实现:提出维度自适应部署策略,兼容现有表征学习流程(如ResNet、BERT等),仅需修改损失函数即可实现嵌套训练。跨领域适用性:在计算机视觉(ImageNet)和自然语言处理(检索任务)中验证有效性,为通用表征学习提供新范式。论文链接:Matryoshka Representation Learning

OpenAI的集成与影响OpenAI将MRL作为text-embedding-3系列模型的默认技术,显著提升了嵌入的实用性和经济性:

开发者友好:通过dimensions参数简化维度调整流程,降低模型部署门槛。行业示范效应:MRL一作Aditya Kusupati确认OpenAI的采用,预计将推动更多模型和服务跟进,形成技术标准。

图3:MRL在检索任务中的分阶段流程综上,MRL通过嵌套表征学习实现了性能与成本的精准平衡,其技术原理清晰、应用效果显著,已成为OpenAI新嵌入模型的核心竞争力。

OpenAI重要模型时间线

OpenAI重要模型时间线如下:

GPT-1

发布时间:2018年6月

主要特点:首个生成预训练模型(GPT),结合Transformer架构与无监督预训练,开创大型语言模型研究方向。

GPT-2

发布时间:2019年2月

主要特点:模型规模扩大至15亿参数,文本生成能力显著增强;因滥用风险,初期未公开完整模型,后逐步释放。

GPT-3

发布时间:2020年6月

主要特点:参数规模达1750亿,自然语言处理能力飞跃,支持翻译、问答、代码生成等多任务,成为通用AI模型标杆。

DALL·E

发布时间:2021年1月

主要特点:多模态生成模型,可根据文本描述生成图像,探索视觉与语言结合的创新应用。

CLIP

发布时间:2021年1月

主要特点:多模态理解模型,将图像与文本映射至同一嵌入空间,实现跨模态检索与分类,推动多模态AI发展。

Codex

发布时间:2021年8月

主要特点:专为代码生成设计,可将自然语言转换为代码,成为GitHub Copilot核心技术,提升开发效率。

ChatGPT

发布时间:2022年11月

主要特点:基于GPT-3.5微调的对话模型,支持自然语言交互,展现强大交互能力,推动AI应用场景扩展。

GPT-4

发布时间:2023年3月

主要特点:大型多模态模型,支持文本与图像输入,理解与生成能力进一步提升,接近人类水平。

o1

发布时间:2024年9月

主要特点:推理模型,专注解决复杂问题,强化逻辑与推理能力,提升模型在数学、科学等领域的表现。

o3

发布时间:2024年12月

主要特点:最新推理模型,性能超越o1,在编码、高级数学等复杂任务中表现更优,标志推理能力新突破。

总结:OpenAI通过持续迭代模型架构与规模,从语言生成到多模态理解,再到推理能力强化,逐步推动AI技术向通用化、智能化演进。

OpenAI退出中国,这些国产大模型免费API赶紧用起来

国产大模型免费API推荐

随着OpenAI退出中国市场,国产大模型迎来了新的发展机遇,多个国产大模型开始提供免费API,以供开发者使用。以下是几款值得推荐的国产大模型免费API:

1.讯飞星火

简介:讯飞星火拥有跨领域的知识和语言理解能力,能够完成问答对话、文学创作等多种任务。它持续从海量文本数据和大规模语法知识中学习进化,实现从提出问题、规划问题到解决问题的全流程闭环。API特点:提供在线调试,速率可达2RPS,不限tokens。此外,还赠送Spark Max模型1亿Tokens。使用建议:适合需要跨领域知识理解和问答对话功能的开发者使用。2.腾讯混元(Tencent Hunyuan)

简介:腾讯混元大模型具备强大的中文创作能力、复杂语境下的逻辑推理能力,以及可靠的任务执行能力。API特点:提供在线调试,并发量可达5。使用建议:适合对中文处理有较高要求的开发者使用,特别是在需要逻辑推理和任务执行能力的场景中。3.百度ERNIE Lite

简介:百度ERNIE Lite是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。API特点:提供在线调试,速率可达300RPM,不限tokens。提供多个免费模型版本,如Lite-8K、Lite-8K-0922、Lite-8K-0308、Lite-128K和Tiny-8K等。使用建议:适合对推理性能有较高要求且算力有限的开发者使用。4.硅基流动(Siliconflow)

简介:硅基流动致力于加速AGI普惠人类,让生成式人工智能惠及开发者和终端用户。API特点:提供在线调试,速率可达3RPS,100QPM。提供多个永久免费模型,如Qwen/Qwen2-7B-Instruct(32K)、Qwen/Qwen2-1.5B-Instruct(32K)等。使用建议:适合需要多种模型选择和灵活配置的开发者使用。5.无问芯穹

简介:无问芯穹利用顶尖的技术为用户打造面向最前沿AI的平台产品,提供创新、智能的AI产品。API特点:提供在线调试,速率可达3RPS,100RPM,不限tokens。平台所有模型都免费,仅有访问速率限制。提供国外模型如DBRX、LLaMA3等,以及国内模型如千问2、智谱3、零一万物等。使用建议:适合需要国内外多种模型选择和丰富功能的开发者使用。总结:

以上五款国产大模型免费API各具特色,开发者可以根据自己的需求和场景选择合适的模型。建议在使用前仔细阅读API文档,了解模型的特点和使用方法,以便更好地发挥模型的优势。同时,也可以多尝试不同的模型,进行对比和测试,以找到最适合自己的模型。

好了,关于openai新模型和OpenAI新模型用的嵌入技术被网友扒出来了的问题到这里结束啦,希望可以解决您的问题哈!

银色北伐军?银色北伐军军需官位置原神三界路飨祭其二,原神三界路飨祭地图是永久的吗