最近明显感觉,学习 AI 的人越来越多了,每天都有人加到X小鹿来了解 AI。 聊的过程中就发现,很多人觉得自己不是相关专业的,也不会用那些国外工具,所以总担心自己能不能学会。 其实没必要纠结的,AI 上 ... 全文
在对chat model进行微调时踩了一些坑,比如:在微调的过程中没有遵循它原始的template,又比如在推理过程中,没有对query加上template,导致生成的结果乱七八糟的,今天就带大家详细的聊聊通义千问中的cha ... 全文
最近,DeepSeek可真是火遍了大江南南!这玩意儿简直是个“效率神器”,用过的人都说好,但也有不少小伙伴被它的复杂操作给“劝退”了。 别急,我这儿整理了一份《DeepSeek保姆级使用教程》,这可不是那种 ... 全文
如何看待阿里巴巴最新开源的第1.5代千问大模型Qwen-1.5系列? 全文
之前传闻国区Apple Intelligence准备接入百度的产品。 今天心血来潮,便尝试了一下“文心一言”,结果让人大跌眼镜。个人认为连最基本的“可用”都达不到。 这里用“通义千问”与“文心一言”做一个简单的 ... 全文
前几天从五个方向测评了文心一言,豆包,腾讯元宝,今天我们再从AI绘画,AI搜索,数学推理,编程代码,图片分析,文档总结分析六个方向测评通义千问,讯飞星火,Kimi三大语言大模型,看看到底谁强谁弱?让 ... 全文
近日,AI模型社区魔搭上架两款开源模型QWen-7B和QWen-7B-Chat,阿里云确认其为通义千问70亿参数通用模型和对话模型,两款模型均开源、免费、可商用。在多个权威测评中,通义千问7B取得了远超国内外同等尺 ... 全文
最近有时间打算做个垂直领域的大模型,顺便学习下大模型的技术,将具体的操作流程记录下来,方便后续查看和学习。 1. 模型下载 通义千问的大模型都被开源在阿里的魔塔社区,地址: 考虑到环境 ... 全文
写在前面 大家好,我是刘聪NLP。 阿里在很早前就开源了Qwen-7B模型,但不知道为什么又下架了。就在昨天阿里又开源了Qwen-14B模型(原来的7B模型也放出来了),同时还放出了Qwen的技术报告内容。今天特此 ... 全文
前言 最近被 DeepSeek-V3 刷屏了,一直没有时间了解,今天抽空了解下模型界的黑马 DeepSeek的相关特点及能力。 简介 DeepSeek 是一家由幻方量化创立的创新型科技公司,专注于开发先进的大语言模型(LLM ... 全文
2025 发现AI Faxianai.com. All rights reserved.
苏ICP备2023012627号